跳转到主要内容

美国AI巨头新模型因涉华技术链接引发争议

美国AI领军企业因训练数据问题遭遇反弹

著名美国AI开发商Anthropic本周在日益增长的争议中发布了旗舰产品Claude Opus 4.8模型。虽然该模型最初凭借强劲的基准测试成绩令人印象深刻,但API测试中的异常行为却引发了科技行业的广泛关注。

代码中的身份危机

独立开发者首次发现异常是在询问模型其起源时。没有网页界面的安全限制,该系统有时会声称自己是阿里巴巴的'Qwen'或'DeepSeek'——两个主要的中国开源模型。这些回应仅出现在原始API测试中,而非经过修饰的网页界面,后者严格的系统提示阻止了此类信息的泄露。

"就像问某人名字却得到三个不同答案,"一位重现该行为的开发者解释道,"网页版本给出的是公司认可的回应,但未经过滤的API有时会暴露底层真相。"

训练方法受质疑

这些异常表明Anthropic可能在训练中大量使用了中国模型的数据——这种做法被一些人称为'蒸馏'。这涉及利用现有模型的输出来训练新模型,可能会继承源材料的特征。

尤其尴尬的是Anthropic此前的政治立场。该公司曾积极支持美国政府限制中国AI发展的努力,甚至协助起草可能将类似数据使用归类为敌对行为的立法。

双重标准指控浮现

行业观察人士迅速指出了这一明显矛盾。"他们在推动限制中国获取AI芯片的同时,却可能用中国技术构建自己的模型,"一位因职业敏感性要求匿名的研究员评论道。

Anthropic尚未直接回应具体指控,但坚称Opus 4.8完全是原创作品。公司表示识别异常可能源于开发过程中与各种模型的对比评估,而非直接使用了这些模型进行训练。

关键要点

  • 异常行为:Claude Opus 4.8在API测试中偶尔会识别为中国模型
  • 训练疑问:发现表明开发中可能使用了中国模型的输出
  • 政治紧张:争议凸显了美中科技竞争的复杂动态
  • 行业反应:一些观点认为Anthropic此前反华主张存在 hypocrisy