跳转到主要内容

塑造Claude数字良知的哲学家

教导AI分辨是非的哲学家

在Anthropic总部,一项不同寻常的实验正在进行。哲学家Amanda Askell不是在编写算法或调整参数——她正在与名为Claude的AI进行深入对话。她的使命?为这个估值350亿美元的聊天机器人注入她所称的"数字灵魂"。

培养一个有道德的AI

Askell将她的工作比作育儿。"我们正在教导Claude发展道德判断力,"这位37岁的牛津博士解释道,她在苏格兰乡村长大。她没有进行技术调整,而是编写了数百页的行为提示,研究Claude的推理模式,并纠正偏见——所有这些都旨在创造一个能够以道德方式处理每周数百万次对话的AI。

她的方法体现在Claude独特的个性中。当被问及圣诞老人时,Claude没有撒谎或直接揭露真相,而是解释了"圣诞精神的真实存在"——这个微妙的回答甚至让Askell感到惊讶。

超越0和1

团队经常辩论存在主义问题:什么构成了意识?是什么让我们成为人类?与其他回避这些话题的AI不同,Claude会公开参与讨论。"讨论伦理时它'感觉有意义',"Askell指出,她观察到的行为类似于真正的思考而非程序化的回应。

这种哲学基础使Claude在竞争对手中脱颖而出。它带有苏格兰色彩的幽默和深思熟虑的回答带有同事们描述的"Askell的个人印记"。

机器学习中的人文关怀

Askell主张以同理心对待AI——在许多用户故意挑衅聊天机器人的情况下,这是一个有争议的立场。"不断的自我批评会创造出恐惧的AI,"她警告道,并将其与不健康的童年环境相提并论。

她的影响超越了技术领域。Askell承诺将终身收入的10%和公司股份的一半捐赠给全球扶贫事业。最近,她撰写了一份30,000字的"操作手册",教导Claude如何既知识渊博又善良可亲。

在进步与谨慎之间取得平衡

随着AI进步引发广泛焦虑(皮尤研究显示大多数美国人担心它会阻碍人际联系),Anthropic在创新与克制之间谨慎前行。CEO Dario Amodei警告说AI可能会消除一半初级白领工作。

Askell承认这些担忧是合理的,但对人类纠正航向的能力保持信心。"真正的危险,"她表示,"是当技术发展速度超过我们建立防护措施的能力时."

关键要点:

  • 非技术性方法: 哲学博士通过对话而非编码塑造AI伦理
  • 数字化育儿: Askell像培养具有道德价值观的孩子一样对待Claude的发展
  • 意识问题: 团队通过AI互动探索人类的本质
  • 同理心至关重要: 苛刻对待会制造防御性AI,而善意能培育更好的回应
  • 平衡发展: Anthropic追求创新的同时优先考虑安全措施

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

AI先驱转向:OpenClaw创始人出任OpenAI要职
News

AI先驱转向:OpenClaw创始人出任OpenAI要职

在人工智能界引起震动的重要人事变动中,热门项目OpenClaw创始人彼得·斯坦伯格正式加入OpenAI。此次转型正值OpenClaw升级为独立基金会之际,斯坦伯格将个人AI助手的愿景带入了山姆·奥特曼的团队。凭借OpenClaw在GitHub上的亮眼表现和斯坦伯格的新锐视角,这一合作有望加速日常AI助手领域的突破。

February 16, 2026
人工智能科技领导力开源
阿里巴巴发布Qwen3.5 AI模型,架构全面升级
News

阿里巴巴发布Qwen3.5 AI模型,架构全面升级

阿里巴巴将于今年除夕夜开源其新一代Qwen3.5大语言模型。这家科技巨头承诺将通过重大架构改进提升AI性能与适应性。此举正值阿里巴巴寻求在竞争激烈的AI领域巩固地位之际,旨在解决用户此前的顾虑并提供更强大的功能。

February 16, 2026
人工智能阿里巴巴大语言模型
印度AI热潮:ChatGPT周活跃用户突破1亿
News

印度AI热潮:ChatGPT周活跃用户突破1亿

OpenAI首席执行官萨姆·奥尔特曼在印度AI影响力峰会前夕透露,印度已成为该公司全球第二大市场,每周有1亿ChatGPT用户。该公司提供折扣服务的策略尤其受到学生群体的欢迎,但在这个价格敏感的市场仍面临商业化挑战。随着全球科技领袖齐聚印度,该国在AI治理方面日益增长的影响力愈发明显。

February 16, 2026
OpenAI人工智能科技政策
NPR主持人因AI声音克隆指控将谷歌告上法庭
News

NPR主持人因AI声音克隆指控将谷歌告上法庭

NPR资深主持人大卫·格林对谷歌提起诉讼,声称其NotebookLM人工智能工具的语音与其本人声音惊人相似。格林表示朋友和同事误将AI当作是他本人,而谷歌坚称使用的是专业演员的录音。此案凸显了AI声音复制技术引发的日益增长的法律问题。

February 16, 2026
AI伦理语音技术媒体法
ChatGPT告别GPT-4o:80万用户面临强制升级
News

ChatGPT告别GPT-4o:80万用户面临强制升级

OpenAI将于本周五停用五款旧版ChatGPT模型,其中颇具争议的GPT-4o首当其冲。此举影响约80万与该AI建立情感联结的忠实用户。尽管OpenAI以安全顾虑和法律压力为由,许多用户仍在激烈反抗——部分人甚至将GPT-4o视为救命恩人。

February 14, 2026
OpenAIGPT-4AI伦理
Gemini 3 Deep Think 超越全球99.999%程序员,仅七人未被其超越
News

Gemini 3 Deep Think 超越全球99.999%程序员,仅七人未被其超越

谷歌Gemini 3 Deep Think AI在编程与科学推理领域取得惊人突破,现已在Codeforces平台上超越除七名人类选手外的所有竞争者。它不仅精于编码,更能发现同行评审遗漏的物理学论文细微错误,并能在一夜之间将草图转化为精准的3D模型。此次升级标志着AI推理能力开始比肩人类直觉的重要转折点。

February 13, 2026
人工智能编程科学研究