台湾半导体制造公司（TSMC）报告季度收入创下新高，达到8685亿新台币，这主要得益于对人工智能相关硬件需求的激增。尽管技术行业和地缘政治因素面临一些市场挑战和不确定性，积极的财务结果表明2025年的前景依然强劲。

台积电报告创纪录收入，人工智能增长为2025年带来乐观情绪

DeepSeek发布了实验性V3.2-exp模型，采用创新的稀疏注意力机制，显著降低了长上下文处理成本。初步测试显示API调用费用最高可节省50%，有望彻底改变AI服务的经济模式。该开源权重模型现已在Hugging Face上开放供行业验证。

DeepSeek V3.2-exp 通过稀疏注意力突破性技术大幅降低AI成本

Soul公司推出的SoulX-Podcast AI语音模型为播客制作带来突破性能力，支持90分钟以上不间断对话生成、多语言兼容及零样本声音克隆技术，这项创新将彻底改变媒体制作流程。

SoulX-Podcast AI模型革新长时语音生成技术

尽管AI在客服中迅速崛起，许多地区仍突显出对人工代表的迫切需求。专家强调在高效的AI与人类同情心之间取得平衡，以有效解决复杂的客户问题。

人工客服需求在AI局限性中增长

Anthropic收购了AI工具平台Humanloop的核心团队，以增强其企业级AI能力和安全研究。此举巩固了Anthropic在对抗OpenAI和Google DeepMind等竞争对手的AI市场中的地位。

Anthropic收购Humanloop团队以增强AI安全性

## 中国AI里程碑：可在手机上运行的强大模型

想象一下在智能手机上运行复杂AI模型而不会出现性能延迟。随着BitCPM-CANN的发布，这一未来已更近一步——这是由面壁智能、清华大学和OpenBMB社区合作开发的中国首个三元大语言模型。

![Image](https://www.ai-damn.com/1779710954788-zy4asw.png)

### 小体积，大性能

其秘密在于1.58比特（三元）表示法，这项技术突破显著降低了内存需求。开发者现在可以在主流智能手机上运行80亿参数模型——这在之前需要强大服务器才能实现。早期测试显示，该模型在推理过程中的内存效率比全精度模型高出约六倍。

"其特别之处不仅在于技术成就，"参与该项目的清华研究员解释道，"我们构建了从量化算子到训练算法的完整生态系统——全部针对国产硬件进行了优化。"

![Image](https://www.ai-damn.com/1779710957588-t8zsf2.png)

### 推动AI开发民主化

该团队基于MindSpeed和Megatron-LM构建基础架构，创建了对32K长序列和集成算子的支持。这一基础设施现已成为面向华为昇腾平台的未来低位训练项目的公共平台，可能加速中国AI发展进程。

所有模型权重现已在HuggingFace和ModelScope上提供，邀请全球开发者尝试这一创新方法。开源举措可能激发从移动应用到边缘计算等各行业的创新应用。

### 对未来的意义

BitCPM-CANN不仅仅代表又一个AI模型。它展示了中国开发不依赖外国技术的完整AI解决方案的能力正在增强。对消费者而言，它预示着更智能的移动应用能更好地理解上下文而不会耗尽电池。对开发者而言，它提供了创建轻量级却强大AI服务的新可能性。

**关键点：**
- 中国首个三元（1.58比特）大语言模型
- 可在智能手机上高效运行（6倍内存优势）
- 提供0.5B到8B参数版本
- 已在主流AI平台完全开源
- 基于国产昇腾计算平台构建
- 支持新一代移动AI应用开发

中国发布突破性AI模型，可装入口袋

中国AI里程碑：可在手机上运行的强大模型

小体积，大性能

推动AI开发民主化

对未来的意义

主要页面

内容分类

其他