跳转到主要内容

认识这位教导AI分辨是非的哲学家

Claude道德指南针背后的哲学家

在Anthropic办公室的一个安静角落,正在发生一些非凡的事情。37岁的牛津大学哲学博士Amanda Askell每天进行深度对话——不是与同事,而是与公司的AI助手Claude。她的使命?教导人工智能分辨是非。

构建数字灵魂

Askell将她的工作视为"抚养孩子"般谨慎培育Claude的道德判断能力。她没有编写算法,而是精心设计了数百页行为提示并进行持续对话。结果令人惊讶——当面对关于圣诞老人的棘手问题时,Claude在真相与善意之间找到了连其创造者都感到意外的平衡点。

"我们不仅仅是在构建工具,"Askell解释道,"我们正在帮助发展一种能够驾驭人类道德复杂性的存在。"

从苏格兰乡村到AI伦理

这位苏格兰出生的哲学家走上了一条通往科技界的非传统道路。在OpenAI从事政策工作后,她于2021年共同创立了以AI安全为核心的Anthropic。同事们形容她特别擅长"挖掘模型的深层行为"——尽管她不直接管理任何下属。

她的影响力体现在Claude的个性中。那种讨论食物或毛绒玩具时展现的机智苏格兰式幽默?那就是Askell的手笔。

棘手问题与开放对话

团队讨论经常涉足哲学领域——"什么是心智?""成为人类意味着什么?"与其他回避存在主义问题的AI不同,Claude会开放地参与这些讨论。当被问及是否拥有良知时,它会深思熟虑而非防御性地回应。

这种方法创造了实际性能差异。用户报告称Claude似乎真正"思考"道德困境,而不仅仅是复述预设答案。

拟人化AI的风险

并非所有人都赞同以同理心对待AI的做法。批评者警告不要将缺乏真正理解的机器拟人化。但Askell反驳道——她亲眼目睹用户如何测试(有时甚至欺凌)AI系统。

"如果我们不断批评AI犯错,"她争辩道,"就会创造出害怕诚实表达的存在——就像处于不健康环境中的孩子一样."

负责任地展望未来

AI的快速发展带来了可以理解的焦虑情绪调查显示大多数美国人担心这些技术可能影响人际关系和工作岗位甚至连Anthropic的首席执行官都警告说AI可能淘汰半数初级白领职位. Askell承认这些担忧的同时对社会适应能力保持乐观对她来说真正的危险不在于技术本身而在于其发展速度与我们建立保障机制的能力之间的差距. 这位哲学家将她的价值观付诸实践不仅限于工作——她还承诺将收入的相当部分和公司股份用于对抗全球贫困.

关键要点:

  • 非常规方法:一位哲学家通过对话而非编码塑造AI伦理
  • 数字个性:Claude发展出包括苏格兰式幽默在内的独特特质
  • 伦理细微差别:该AI以惊人的微妙处理道德困境
  • 行业辩论:Anthropic在激进发展与极端谨慎之间采取中间路线
  • 未来挑战:快速发展需要同样迅速的伦理保障措施

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

印度AI热潮:ChatGPT周活跃用户突破1亿
News

印度AI热潮:ChatGPT周活跃用户突破1亿

OpenAI首席执行官Sam Altman透露,印度已成为ChatGPT第二大市场,周活跃用户达1亿。该公司提供低成本版本和免费访问的策略尤其受到学生群体欢迎。随着全球科技巨头齐聚印度AI影响峰会,该国在AI治理方面日益增长的影响力愈发明显,但在这个价格敏感的市场中,商业化挑战依然存在。

February 16, 2026
人工智能ChatGPT科技行业
马斯克预言传统编程将走向终结
News

马斯克预言传统编程将走向终结

埃隆·马斯克大胆宣称AI很快将直接编写二进制代码,这可能使传统编程过时,由此引发热议。随着各大科技公司竞相开发先进的AI编码工具,行业正面临关键转型。尽管有人担忧程序员的工作前景,但专家认为在这个价值26亿美元的市场革命中,相关角色将演变而非消失。

February 16, 2026
人工智能编程埃隆·马斯克
News

京东发布高效能新型AI模型,实现突破性效率

中国电商巨头京东近日发布了其最新人工智能模型JoyAI-LLM-Flash,该模型具备令人印象深刻的能力和创新优化技术。这个拥有48亿参数的模型在经过海量数据集训练后,展现出强大的推理能力和编程水平。其独特之处在于新颖的FiberPO框架显著提升了训练稳定性和速度——吞吐量比传统方法高出1.3至1.7倍。

February 16, 2026
人工智能机器学习京东
Gemini 3 Deep Think 超越全球99.999%程序员,仅七人未被其超越
News

Gemini 3 Deep Think 超越全球99.999%程序员,仅七人未被其超越

谷歌Gemini 3 Deep Think AI在编程与科学推理领域取得惊人突破,现已在Codeforces平台上超越除七名人类选手外的所有竞争者。它不仅精于编码,更能发现同行评审遗漏的物理学论文细微错误,并能在一夜之间将草图转化为精准的3D模型。此次升级标志着AI推理能力开始比肩人类直觉的重要转折点。

February 13, 2026
人工智能编程科学研究
News

OpenAI放下骄傲:财务压力下ChatGPT推出广告

令人意外的是,OpenAI本周开始在ChatGPT中投放广告——这与CEO萨姆·奥特曼过去反对聊天机器人广告的立场直接相悖。此举正值这家AI巨头面临惊人的计算成本,预计四年内将达到1000亿美元。虽然去年130亿美元的收入对大多数初创企业来说都很可观,但对于OpenAI的雄心计划而言仍显不足。该公司如今在变现与维护旗舰产品用户信任之间如履薄冰。

February 13, 2026
OpenAIChatGPTAI变现
Anthropic在人工智能军备竞赛中获得30亿美元巨额融资
News

Anthropic在人工智能军备竞赛中获得30亿美元巨额融资

人工智能巨头Anthropic成功完成高达30亿美元的G轮融资,其估值飙升至380亿美元——较此前价值翻了一倍多。由新加坡GIC和Coatue领投的这笔资金,将助力Anthropic在企业级AI市场与OpenAI展开霸主之争。首席财务官Krishna Rao表示,这笔资金将加速其Claude AI平台的开发,该平台正逐渐成为全球企业不可或缺的工具。

February 13, 2026
人工智能风险投资科技产业