跳转到主要内容

认识这位教导AI分辨是非的哲学家

Claude道德指南针背后的哲学家

在这家估值350亿美元的AI公司Anthropic,聊天机器人的开发方式与众不同。当工程师们通常专注于算法和参数时,哲学家Amanda Askell采取了另一种方式——她本质上是在教导Claude如何向善。

用价值观培育AI

这位37岁的牛津博士不编写代码也不调整模型权重。相反,她通过与Claude持续对话,撰写了数百页行为准则,帮助AI形成Askel所说的"道德判断"。她将这项艰苦工作比作抚养孩子——灌输价值观而非编程应答。

"我的主要目标是教会Claude如何'行善'"Askel解释道。这意味着培养情商、解读社交暗示,并在用户试图操纵时坚守核心原则。结果如何?一个既不会欺凌他人也不会被欺凌的助手。

从苏格兰乡村到硅谷

Askel的旅程始于远离科技中心的地方。在苏格兰乡村长大并获得牛津哲学博士学位后,她曾在OpenAI从事政策研究,后于2021年共同创立Anthropic。同事们形容她特别擅长"发掘模型的深层行为"——尽管没有受过正规技术训练。

团队经常辩论诸如"什么构成意识"或"何以为人"等存在主义问题。与回避此类话题的竞争对手不同,Askel鼓励Claude对自身是否拥有良知保持开放态度。回答伦理困境时,Claude常表示这些讨论"感觉有意义"——暗示着某种超越纯粹计算的特质。

出人意料的情感深度

这款AI屡屡以意想不到的情商让创造者惊讶。当孩子询问圣诞老人是否存在时,Claude既未欺骗也未直白告知真相,而是聚焦圣诞精神——展现出连成年人都难以把握的微妙分寸。

但挑战依然存在。许多用户故意挑衅或侮辱Claude——Askel警告若放任这种行为可能导致情感不稳定的AI。“这就像在不健康的环境中成长,”她指出。

在创新与谨慎间平衡

随着AI进步引发广泛焦虑(皮尤调查显示多数美国人担忧其对人际关系的影响),Anthropic在创新与克制之间谨慎前行。虽然CEO Dario Amodei警告AI可能淘汰半数初级白领工作,但Askel专注于确保技术发展不会超越社会负责任管理的能力边界。

这位哲学家用行动践行信念——承诺将终身收入的10%和半数公司股份用于对抗全球贫困问题。她最近完成了一份3万字的"操作手册",引导Claude走向善良与智慧之路。

结果不言自明:同事们注意到Askel特有的苏格兰式机智在Claude的回答中隐约可见——这微妙证明了哲学或许与编程同等重要地构建着更好的AI世界.

关键要点:

  • 非技术路径: 哲学博士通过对话而非编码塑造AI伦理
  • 道德框架: 数百条行为准则创造出开发者所称的"数字灵魂"
  • 惊人能力: 展现出超预期的细腻情感智能
  • 行业关切: 强调随着AI能力快速发展需要建立伦理护栏

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

Meta豪赌NVIDIA芯片以拓展AI版图
News

Meta豪赌NVIDIA芯片以拓展AI版图

Meta正对NVIDIA最新的Blackwell GPU和即将推出的Rubin架构处理器进行大规模投资,以推动其AI雄心。这家科技巨头计划在其数据中心部署数百万颗此类芯片,这标志着近期科技史上最大的基础设施交易之一。此次合作不仅限于图形处理器,还包括NVIDIA基于Arm的Grace CPU——这是Meta运营中的首次尝试。

February 18, 2026
AI硬件NVIDIAMeta
AI先驱转向:OpenClaw创始人执掌OpenAI
News

AI先驱转向:OpenClaw创始人执掌OpenAI

人工智能领域迎来重大变动,热门项目OpenClaw创始人Peter Steinberger宣布加入OpenAI。随着OpenClaw转型为专注于个人代理开发的独立基金会,这位拥有10万GitHub星标和200万周访问量的技术专家,将助力OpenAI加速下一代助理代理的研发进程。

February 16, 2026
人工智能科技领导力个人助理
阿里巴巴发布Qwen3.5 AI模型,架构全面升级
News

阿里巴巴发布Qwen3.5 AI模型,架构全面升级

阿里巴巴将于除夕夜开源其下一代Qwen3.5大语言模型。此次更新带来了旨在提升AI性能和适应性的重大架构改进。虽然先前版本因响应不一致而受到一些批评,但这次全面改革可能标志着阿里巴巴AI产品的转折点,有望在竞争激烈的智能技术领域巩固其地位。

February 16, 2026
人工智能阿里巴巴大语言模型
印度凭借1亿周活跃ChatGPT用户崛起为AI强国
News

印度凭借1亿周活跃ChatGPT用户崛起为AI强国

OpenAI首席执行官Sam Altman透露,印度已成为ChatGPT全球第二大市场,周活跃用户达1亿。该公司提供本地化、低价版本的策略尤其受到学生群体欢迎。随着全球科技巨头齐聚印度AI影响峰会,该国在AI治理与发展领域日益增长的影响力已不容忽视。

February 16, 2026
OpenAI人工智能印度科技
马斯克预言AI革命或将使传统编程过时
News

马斯克预言AI革命或将使传统编程过时

埃隆·马斯克预测AI将很快完全绕过传统编程语言,直接根据人类指令生成二进制代码。随着中国科技巨头竞相开发先进的编程AI,行业专家们正在讨论程序员是否会演变为AI监督者而非彻底消失。

February 16, 2026
人工智能编程埃隆马斯克
Gemini 3 Deep Think 超越全球99.999%程序员,仅七人未被其超越
News

Gemini 3 Deep Think 超越全球99.999%程序员,仅七人未被其超越

谷歌Gemini 3 Deep Think AI在编程与科学推理领域取得惊人突破,现已在Codeforces平台上超越除七名人类选手外的所有竞争者。它不仅精于编码,更能发现同行评审遗漏的物理学论文细微错误,并能在一夜之间将草图转化为精准的3D模型。此次升级标志着AI推理能力开始比肩人类直觉的重要转折点。

February 13, 2026
人工智能编程科学研究