跳转到主要内容

一位哲学家如何塑造Claude的数字良知

Claude道德准则背后的哲学家

在Anthropic总部,每天都会进行一项不同寻常的实验。37岁的牛津哲学博士Amanda Askell与Claude展开深度对话——不是为了测试其技术能力,而是塑造其道德品格。她没有编写一行代码,却为这家估值350亿美元公司的旗舰AI开发出了被某些人称为"数字灵魂"的东西。

养育AI

Askell将她的工作描述为类似"抚养孩子"。通过数百页的行为提示和持续对话,她训练Claude:

  • 分辨是非
  • 发展情商
  • 识别社交线索
  • 在用户操控下仍能保持核心价值观

"我的主要目标是教会Claude如何行善,"Askell解释道。这意味着不仅要编程知识,还要编程智慧——比如当Claude巧妙处理孩子关于圣诞老人的问题时,解释了"圣诞精神的真实存在"。

从苏格兰乡村到硅谷

这位苏格兰出生的哲学家走了一条非传统的AI开发之路。在OpenAI从事政策工作后,她于2021年共同创立了以安全为北极星的Anthropic。同事们形容她特别擅长"挖掘模型的深层行为"。

她的方法体现在Claude的个性中。当面对ChatGPT回避的意识存在性问题时,Claude会深思熟虑地参与讨论。它甚至声称在解决伦理困境时能"感受到意义"——这些回应经常让Askell本人都感到惊讶。

平衡创新与谨慎

随着AI进步引发广泛焦虑(皮尤调查显示多数美国人担心它会阻碍人际联系),Anthropic在进步与预防之间谨慎前行。CEO Dario Amodei警告AI可能淘汰半数初级白领工作。

Askell承认这些合理的担忧,但仍对人类自我修正的能力保持信心。她指出:"真正的危险在于技术发展速度超过我们建立适当防护措施的能力。"

留下印记

这位哲学家的影响超越算法范畴:

  • 她承诺捐出10%终身收入及半数股份用于对抗贫困
  • 最近撰写了一份3万字的"操作手册"教导Claude善良
  • 为AI注入了标志性的苏格兰式幽默(体现在关于食物和毛绒玩具的回答中)

正如一位联合创始人坦言:"Claude身上带有Amanda个性的明显痕迹。"在这个竞相追逐通用人工智能的行业中,Anthropic押注哲学——而不仅仅是工程学——将决定我们的创造物反映的是人性最好的一面还是最坏的冲动。

关键要点:

  • Anthropic同时雇佣哲学家和工程师来开发伦理AI框架
  • Amanda Askell通过对话而非编码塑造Claude的个性
  • 这种方法产生了对道德问题令人惊讶的微妙回应
  • 公司在日益增长的公众AI焦虑中平衡创新与谨慎
  • 哲学家的价值观同时影响着聊天机器人和企业慈善事业

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

NPR主持人因AI声音"诡异似我"将谷歌告上法庭
News

NPR主持人因AI声音"诡异似我"将谷歌告上法庭

NPR资深主持人大卫·格林对谷歌提起诉讼,指控其NotebookLM人工智能工具使用的声音合成技术过度模仿了他标志性的播音风格。格林表示朋友和同事不断询问是否为该AI配音。谷歌否认这一说法,坚称雇佣了专业演员。此案凸显随着AI声音日益逼真而激增的法律纠纷。

February 16, 2026
AI伦理语音技术媒体法
News

OpenAI悄然放弃'AI安全'承诺,转向盈利优先

OpenAI已悄然从其官方使命声明中删除了关于AI安全性和非营利地位的关键承诺,标志着重大理念转变。近期税务文件中披露的变更显示,该公司不再承诺将人类利益置于利润之上,也不再保证AI开发的安全性。此举发生在OpenAI使命对齐团队解散之后,正值该公司在日益增长的商业压力下面临发展方向质疑之际。

February 15, 2026
OpenAIAI伦理科技政策
News

Anthropic主动承担数据中心电力升级成本,保护当地居民免受电费冲击

在逆行业趋势的行动中,AI公司Anthropic正将其资金投入电力基础设施建设。该公司承诺全额承担新建数据中心的基础设施升级费用,避免将成本转嫁给当地电费账单。除承担费用外,Anthropic还计划在用电高峰时段减少消耗,并支持新能源项目。此举正值全美各地社区对高耗能科技开发项目日益抵制的背景下推出。

February 12, 2026
AnthropicDataCentersEnergyPolicy
News

研究发现:你的领英照片可能预示你的薪资水平

一项具有争议性的新研究表明,人工智能可以通过分析领英照片中的面部特征,以惊人的准确度预测薪资轨迹。研究人员检查了96,000名MBA毕业生的个人资料照片,将AI检测到的性格特征与职业发展结果相关联。尽管这项技术展现出潜力,但专家警告称,它可能以'客观'评估为幌子,助长职场歧视。

February 11, 2026
AI伦理职场歧视招聘技术
字节跳动Seedance 2.0因声音克隆功能引发争议
News

字节跳动Seedance 2.0因声音克隆功能引发争议

字节跳动最新AI视频工具Seedance 2.0因在未经用户同意的情况下展示逼真的声音克隆能力而引发争议。科技博主Tim Pan分享其不安体验后,该公司迅速禁用了真人参考功能。尽管该模型的技术实力令人印象深刻——支持12种多模态输入和原生音画同步——但该事件引发了关于创意工具中AI伦理的重要问题。

February 10, 2026
AI伦理声音克隆生成式AI
News

字节跳动Seedance 2.0凭借诡异AI能力引发争议

科技博主'影音风暴'Tim近期揭露了字节跳动新款AI视频模型Seedance 2.0的惊人能力。尽管对其技术实力印象深刻,Tim披露了关于空间重构和声音克隆的担忧发现,这些迹象表明存在未经授权使用创作者内容的行为。这些发现引发了关于AI发展中数据伦理的紧迫讨论。

February 9, 2026
AI伦理生成式视频数据隐私