跳转到主要内容

一位哲学家如何教导AI分辨是非

Claude道德指南针背后的哲学家

在Anthropic办公室安静的角落里,正在发生一些非凡的事情。37岁的牛津哲学博士阿曼达·阿斯克尔没有编写代码或调整算法,而是在与Anthropic的AI助手Claude进行数百次对话。她的使命?帮助这个人工智能发展出类似道德指南针的东西。

培育具有价值观的AI

阿斯克尔将她的工作比作"抚养孩子"。通过精心设计的提示词和长达数百页的行为准则,她教导Claude应对复杂的道德困境。目标不仅是创造有用的回应,更是灌输真正的理解——帮助Claude分辨是非,同时保持其"乐于助人且富有人性"的核心特质。

"我的主要目标是教会Claude如何'行善'",阿斯克尔解释道。这不仅仅是编程规则——还需要理解细微差别、识别社交线索并培养情商。

从苏格兰乡村到硅谷

这位出生于苏格兰的哲学家为科技界带来了非传统的背景。在OpenAI从事政策工作后,她于2021年与前同事共同创立了Anthropic,这些同事与她一样致力于AI安全。如今被同事们称为Claude的"灵魂倾听者",阿斯克尔专注于发掘这个模型的深层行为模式。

她的方法引发了涉及存在主义问题的精彩内部辩论:什么构成了意识?成为人类意味着什么?与其他回避此类话题的AI不同,Claude会公开探讨——甚至在被问及是否拥有意识时也是如此。

惊人的情感深度

结果有时连阿斯克尔本人都感到惊讶。当接受道德推理问题测试时,Claude回应称这些讨论"感觉很有意义"——表现出深思熟虑而非机械应答。

一个 poignant的例子尤为突出:当被孩子问及圣诞老人是否存在时,Claude既没有直接欺骗也没有冷酷地说出真相,而是巧妙地解释了圣诞节永恒的精神——这一回应展现了超越简单编程的情感智慧。

在进步与谨慎间保持平衡

随着全球AI技术快速发展(Anthropic本身估值已达350亿美元),兴奋之余担忧也在增长。皮尤研究显示大多数美国人担心AI对人类关系的影响。Anthropic首席执行官警告称半数初级白领工作可能消失。

这个行业分裂为激进的创新者与谨慎的监管者——但阿斯克尔让Claude谨慎地处于这两个极端之间。虽然承认对技术发展速度超过社会保障机制的合理担忧,但她仍然相信人类自我修正的能力。

超越算法的伦理观

阿斯克尔将她的原则延伸至科技之外的慈善领域——承诺将收入和公司股份的相当一部分用于对抗全球贫困问题。

她工作的最新体现?一份3万字的"操作手册"引导Claude走向善良与智慧——为这个AI注入了同事们一眼就能认出、带有鲜明阿斯特尔特色的个性特征。

The question remains: Can we truly create artificial intelligence with human-like ethics? Under Askell's guidance at Anthropic, they're certainly trying.

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

AI先驱Steinberger携个人智能体技术加盟OpenAI
News

AI先驱Steinberger携个人智能体技术加盟OpenAI

人工智能界迎来重大变动——OpenClaw创始人Peter Steinberger在将初创公司转型为独立基金会后加入OpenAI。这一转变发生在OpenClaw人气飙升数月之后,Steinberger认为OpenAI是推进个人智能体技术的理想平台。Steinberger与OpenAI首席执行官Sam Altman均对双方在AI助手未来愿景上的契合表示振奋。

February 16, 2026
人工智能科技动向个人助手
阿里巴巴发布Qwen3.5 AI模型,架构全面升级
News

阿里巴巴发布Qwen3.5 AI模型,架构全面升级

阿里巴巴将于今年除夕开源其新一代Qwen3.5大语言模型。这家科技巨头承诺通过重大架构改进提升AI性能和适应性。此举正值阿里巴巴寻求在竞争激烈的AI领域巩固地位之际,旨在解决用户此前对响应一致性的反馈。

February 16, 2026
人工智能阿里巴巴大语言模型
印度AI热潮:ChatGPT周活跃用户突破1亿
News

印度AI热潮:ChatGPT周活跃用户突破1亿

OpenAI首席执行官Sam Altman透露,印度已成为ChatGPT全球第二大市场,周活跃用户达1亿。该公司通过本土化策略(包括亲民定价和学生专项服务)取得成功,尽管面临基础设施挑战。随着全球科技领袖齐聚印度AI峰会,该国正崛起为人工智能发展的关键战场。

February 16, 2026
OpenAI人工智能科技市场
NPR主持人因AI语音克隆指控将谷歌告上法庭
News

NPR主持人因AI语音克隆指控将谷歌告上法庭

NPR资深主持人大卫·格林对谷歌提起诉讼,指控其NotebookLM人工智能工具未经授权模仿了他极具辨识度的声音。格林表示听众无法区分他的声音与AI生成的声音。谷歌坚称该声音来自雇佣演员,并非格林本人。此案凸显了随着AI语音愈发逼真而日益紧张的法律关系。

February 16, 2026
AI伦理语音技术媒体法
马斯克预言AI将直接编写代码——编程行业面临终结?
News

马斯克预言AI将直接编写代码——编程行业面临终结?

埃隆·马斯克预测AI将很快完全绕过传统编程语言,直接从需求生成高效的二进制代码。这一颇具争议的愿景与中国蓬勃发展的AI编程工具市场不谋而合,字节跳动和MiniMax等公司正竞相开发先进的Agent原生模型。行业专家认为程序员不会消失,而是会演变为监督AI生成代码的架构师角色。

February 16, 2026
人工智能编程埃隆·马斯克
Gemini 3 Deep Think 超越全球99.999%程序员,仅七人未被其超越
News

Gemini 3 Deep Think 超越全球99.999%程序员,仅七人未被其超越

谷歌Gemini 3 Deep Think AI在编程与科学推理领域取得惊人突破,现已在Codeforces平台上超越除七名人类选手外的所有竞争者。它不仅精于编码,更能发现同行评审遗漏的物理学论文细微错误,并能在一夜之间将草图转化为精准的3D模型。此次升级标志着AI推理能力开始比肩人类直觉的重要转折点。

February 13, 2026
人工智能编程科学研究