台湾半导体制造公司（TSMC）报告季度收入创下新高，达到8685亿新台币，这主要得益于对人工智能相关硬件需求的激增。尽管技术行业和地缘政治因素面临一些市场挑战和不确定性，积极的财务结果表明2025年的前景依然强劲。

台积电报告创纪录收入，人工智能增长为2025年带来乐观情绪

Anthropic推出了其AI编程助手Claude Code的网页版本，使更多用户能够使用该工具，而不仅限于命令行用户。该工具面向Pro和Max订阅用户开放，旨在提升开发者跨平台的工作效率。尽管AI编程工具市场竞争激烈，Claude Code仍实现了快速普及，年收入已超过5亿美元。

Anthropic将Claude Code AI编程助手扩展至网页端

DeepSeek发布了实验性V3.2-exp模型，采用创新的稀疏注意力机制，显著降低了长上下文处理成本。初步测试显示API调用费用最高可节省50%，有望彻底改变AI服务的经济模式。该开源权重模型现已在Hugging Face上开放供行业验证。

DeepSeek V3.2-exp 通过稀疏注意力突破性技术大幅降低AI成本

尽管AI在客服中迅速崛起，许多地区仍突显出对人工代表的迫切需求。专家强调在高效的AI与人类同情心之间取得平衡，以有效解决复杂的客户问题。

人工客服需求在AI局限性中增长

Anthropic发布了突破性的编程助手Cowork，该工具主要由其AI模型Claude在短短一周多时间内开发完成。这款旨在通过简单语音指令帮助非程序员完成技术任务的工具，标志着编程普及化的重要飞跃。虽然仍处于alpha测试阶段，但Cowork的快速开发展现了AI辅助创作的潜力——不过用户需谨慎对待其文件访问权限。

Anthropic的Cowork：仅用10天由AI打造的AI助手

# 当现代AI遭遇古老文字

![Image](https://www.ai-damn.com/1779231604886-61zw8q.png)

想象向孔子展示智能手机——现在把这个场景反过来。当今最先进的人工智能系统能轻松处理现代代码，却在面对三千年前的文字时出人意料地束手无策。

由腾讯混元团队、SSV数字文化实验室和故宫博物院组成的联盟开发了**Chronicles-OCR**，这是首个评估AI识别中国古文字能力的综合基准。该项目涵盖汉字七种历史形态的完整演变过程，其测试结果为我们技术的局限性敲响了警钟。

## 测试场域

研究团队整理了2,800张精心平衡的古文字图像，从甲骨文到草书不等。每张图像都经过细致标注——早期文字如甲骨文和金文采用字符级标注，后期标准化字体则采用序列级标注。这种多层次方法创造了研究人员所称的视觉AI模型"迄今最严苛的测试"。

当进行四项逐渐升级、将视觉感知与语义理解分离的挑战性任务时，结果连开发者都感到震惊。包括GPT-5和Claude Opus在内的28个主流模型在基础检测任务中表现惨淡，即使最佳模型的细粒度识别准确率也仅为27.1%。

## AI的认知盲区

这些失败揭示了当前技术的显著缺陷：

- **重材质轻内容**：模型经常根据载体材料（兽骨vs青铜）而非实际笔画特征混淆书写风格
- **推理适得其反**：启用高级推理模块反而会放大感知不确定性导致性能下降
- **微观失明**：现有系统缺乏对区分历史文字至关重要的细微笔触变化的敏感度

"这些不仅是技术局限,"一位参与研究员指出,"更反映了我们训练AI理解人类文化表达方式的缺失环节。"

## 超越科技圈的意义

汉字承载着追溯至商代未曾中断的文明链条。数字化保存和解读这些文物不仅是学术实践——更是维系我们与共同历史鲜活联系的关键。

Chronicles-OCR的开源既是对AI社区的挑战也是邀请。通过暴露这些缺陷，研究者希望推动开发不仅能扫描字符、更能真正理解其历史背景的系统。

### 关键要点：
- 首个中国古文字识别综合基准测试揭示AI重大缺陷
- 顶尖模型在关键识别任务中准确率不足30%
- 当前视觉AI关注材质纹理而非有意义的笔画特征 
- 开源发布旨在引导未来开发方向朝向文化理解

AI在古汉字识别上栽跟头：新基准测试暴露技术短板

当现代AI遭遇古老文字

测试场域

AI的认知盲区

超越科技圈的意义

关键要点：

主要页面

内容分类

其他