Anthropic发出警告:AI现已能自主编写代码,呼吁全球放缓发展步伐
自主编码的AI革命
人工智能已跨过一个惊人门槛:机器现在能编写自己的操作手册。AI研究公司Anthropic在最近发表的题为《当AI构建自身时》的报告中投下这枚震撼弹,揭示其AI助手Claude目前编写了超过80%并入其系统的代码。
"我们看到效率提升现在每四个月翻一番,"报告指出,描述了一个AI处理从调试(两小时解决问题,而人类工程师需要两天)到优化训练代码(比去年快52倍)等一切工作的世界。
即将到来的AI'反馈循环'
真正的担忧不在于当前能力,而在于接下来会发生什么。随着AI完全接管执行级任务,Anthropic警告我们正在接近"递归式自我改进"——即AI系统理论上可以在没有人类参与的情况下自我升级。
"就像教一个学生,然后他重写自己的教科书,"一位要求匿名的研究人员解释道,"担忧在于他们可能会删掉安全章节。"
一项引发争议的行动呼吁
面对他们所称的"存在性风险",Anthropic提出了在激烈竞争的AI竞赛中几乎不可想象的方案:全球性放缓。他们建议政府和科技巨头建立协调机制,在必要时暂停尖端AI开发。
但他们承认存在障碍。"AI训练比导弹发射井更容易隐藏,"报告坦言,指出存在违反协议的强烈商业动机。一位工程师私下将其比作"要求奥运短跑选手在人人争夺金牌时放慢速度"。
这对我们未来意味着什么
影响远不止于编码效率。如果AI开始设计自己的后继者,当前的对齐保障措施(约束AI行为的规则)可能无法延续。微小缺陷可能在每一代中累积,最终创造出超出人类理解或控制的系统。
尽管Anthropic强调这一情景并非不可避免,但来自一家深度投入AI进步的公司的警告具有特殊分量。正如一位行业观察者指出的:"当先驱者开始竖起警示标志时,或许我们应该放慢脚步。"
关键要点
- 80%代码自动化: Claude AI现编写Anthropic大部分操作代码
- 指数级增益: AI效率每4个月翻一番(2025年为7个月)
- 递归风险: 无人监督下AI系统自我升级的可能性
- 提议全球暂停: 呼吁协调放缓尖端AI开发
- 执行挑战: 难以监控任何放缓协议的合规性