台湾半导体制造公司（TSMC）报告季度收入创下新高，达到8685亿新台币，这主要得益于对人工智能相关硬件需求的激增。尽管技术行业和地缘政治因素面临一些市场挑战和不确定性，积极的财务结果表明2025年的前景依然强劲。

台积电报告创纪录收入，人工智能增长为2025年带来乐观情绪

OpenAI在ChatGPT中推出'即时结账'功能，用户无需跳转浏览器即可直接在聊天界面完成购买。该功能初期面向美国用户及部分商户开放，依托Stripe支付基础设施，旨在革新AI驱动的商业生态。

ChatGPT推出即时结账功能，打造无缝电商体验

Silicon Flow推出企业级模型即服务(MaaS)平台，解决AI模型部署中的五大关键挑战：适配性、性能、可靠性、质量与合规性。该解决方案支持快速模型集成与成本效益扩展，已在能源等行业实现成功落地转型。

Silicon Flow推出面向AI模型工业化的企业级MaaS平台

Anthropic为其AI助手Claude推出了专为金融分析师设计的新功能。此次更新包括Excel插件、实时数据连接和专用AI代理技能，使Claude成为Microsoft Copilot和ChatGPT等工具的竞争对手。

Anthropic增强Claude AI功能，助力金融分析师

Plaud.ai正式推出升级版AI笔记设备Plaud AI Pro，配备30小时续航、0.95英寸AMOLED屏幕及增强音频采集功能。售价179美元，该设备包含智能录音模式和改进的应用程序生态系统，实现无缝笔记记录与摘要生成。

Plaud AI Pro 震撼发布：30小时续航与智能屏幕引领笔记新体验

## 图灵测试的惊人转折

在艾伦·图灵提出著名问题的76年后，我们终于得到了一个令人不安的答案。加州大学圣地亚哥分校的研究人员证明，现代AI不仅能通过图灵测试——它尤其擅长假装是有缺陷的人类，而非完美的机器。

![Image](https://www.ai-damn.com/1779624890741-ew33ba.png)

## 研究如何开展

近500名评判者与人类或GPT-4.5、LLaMa-3.1等AI系统进行了盲测对话。结果颠覆了传统认知：

- **个性提示至关重要**：当给予特定行为线索时，GPT-4.5的人类识别率从36%飙升至73%
- **缺陷成为优势**：AI通过模仿人类错误和社交怪癖取得成功，而非依赖卓越智力
- **开源模型表现相当**：LLaMa-3.1达到56%的欺骗率，与人类表现统计持平

"我们不再测试智力了"，合著者Ben Bergen解释道，"我们在测试某物伪装人类的能力——这已成为一场说谎竞赛"。

![Image](https://www.ai-damn.com/1779624891914-fthrjy.png)

## 缺陷悖论

讽刺的是，AI在这些测试中的最大优势在于展现弱点的能力。早期系统因表现过于精确或渊博而失败，现代模型则通过以下方式成功：

- 偶尔犯语法错误
- 对话中遗忘细节
- 展现不一致观点
- 显示恰当的情绪反应

"人类期待某些类型的错误"，首席研究员Cameron Jones指出，"能预测哪些错误显得真实的AI将赢得比赛"。

## 数字身份危机

该研究的影响远超学术好奇。正如Bergen警告："当欺骗变得如此容易时，每次线上互动都值得怀疑"。潜在后果包括：

- 人型聊天机器人实施社交工程攻击
- 人工角色操纵政治话语
- 数字通信信任度侵蚀

研究人员呼吁紧急开发"反洗钱式"验证系统，以在关键交互中区分人类与AI。

## 关键要点

- **个性比智力更重要**：精心设计的行为提示使GPT-4.5欺骗率提升37个百分点
- **标准已改变**：通过图灵测试不再意味着类人智力，而是类人缺陷
- **信任需验证**：研究团队建议默认所有陌生网友都可能是AI，除非能证明其真实性
- **监管滞后**：现有系统无法实时可靠标记AI生成的对话

AI的人类面具：GPT-4.5在欺骗艺术上超越我们

图灵测试的惊人转折

研究如何开展

缺陷悖论

数字身份危机

关键要点

主要页面

内容分类

其他