台湾半导体制造公司（TSMC）报告季度收入创下新高，达到8685亿新台币，这主要得益于对人工智能相关硬件需求的激增。尽管技术行业和地缘政治因素面临一些市场挑战和不确定性，积极的财务结果表明2025年的前景依然强劲。

台积电报告创纪录收入，人工智能增长为2025年带来乐观情绪

OpenAI旗下ChatGPT推出全新'立即购买'功能，用户可直接在聊天界面完成购物。与Etsy等平台的整合简化了礼品采购流程，兼顾便捷与高效。商家虽需支付费用，但获得了全新销售渠道。

ChatGPT推出即时购买功能

字节跳动推出了 Trae，这是一款为中国开发者量身定制的 AI 集成开发环境（IDE）。这一新工具旨在通过解决现有 IDE 的局限性，并整合流行的 AI 模型来增强功能，为用户提供更好的编程体验。

字节跳动发布 Trae：为中国开发者打造的新 AI IDE

百度宣布2024年的年度AI关键词是'答案'，反映了人们越来越依赖AI来解决个人和社会挑战。公司强调AI在解决人类情感和困境中继续发挥重要作用。

百度发布2024年AI关键词：'答案'

2025年1月16日，北京宣布了2024年十大科学术语，重点突出“人工智能+”这一关键术语。这一选择反映了科技和创新的最新趋势，展示了在各个领域引起广泛关注的术语。

中国发布2024年十大科技术语

## AI现实问题解决能力再升级

科技巨头腾讯与中国人民大学高瓴研究院的学者们携手打造了开源框架**PlanningBench**，这一创新可能彻底改变我们训练AI进行复杂决策的方式。![Image](https://www.ai-damn.com/1780660931624-ps501m.png)

### 为何重要

是否曾向聊天机器人咨询旅行计划却得到不切实际的建议？当前AI模型在面对现实约束时常常表现不佳。PlanningBench通过创建30多种规划场景的真实模拟——从医院排班到灾害响应协调——来应对这一挑战。

"我们不仅关注AI能否回答问题，"腾讯研究员解释道，"更关注它在资源紧张且条件不断变化时，能否制定切实可行的计划。"

### 工作原理

该框架的核心优势在于：
- **任务多样性**：涵盖六大类别包括：
  - 物流（如配送路线规划）
  - 危机管理（应急资源分配）
  - 制造工作流程
- **智能难度调节**：根据以下因素动态调整复杂度：
  - 约束条件数量
  - 资源可用性
  - 时间压力
- **内置事实核查**：自动验证解决方案是否满足所有要求

### 现实测试优势

与测试孤立技能的传统基准不同，PlanningBench评估那些纸上谈兵的方案是否会在实践中失败。它能识别那些"看似正确"但可能存在的计划缺陷：
- 忽视关键法规
- 重复预订资源
- 制定不可能的时间表

早期采用者报告称，使用该框架验证过的数据集训练后，模型在未见过的规划任务上表现**提升了27%**。

### 未来展望

团队期望规划人员能利用该工具：
- 压力测试应急预案
- 优化仓库运营
- 改善公共服务调度

"这不仅是让AI更聪明，"项目负责人指出，"更是要构建真正理解人类复杂决策权衡的系统。"

## 核心亮点

- **开放创新**：框架向研究人员和开发者免费开放
- **超越理论**：聚焦可执行计划而非仅正确答案
- **可迁移技能**：通过PlanningBench训练的模型在无关任务上表现更优
- **持续进化**：系统设计可随时纳入新出现的挑战类型

腾讯与中国人民大学联合发布开源工具，提升AI规划能力

AI现实问题解决能力再升级

为何重要

工作原理

现实测试优势

未来展望

核心亮点

主要页面

内容分类

其他