新闻资讯喂养AI:研究揭示聊天机器人高度依赖新闻内容
AI聊天机器人的隐藏食谱
随着人工智能日益精进,研究人员正深入探究这些数字大脑的运作机制。公关数据库Muckrack的一项全面新研究揭示了关于聊天机器人信息来源的惊人发现。

新闻机构喂养机器
对Gemini、Perplexity、Claude和ChatGPT等主流AI系统1500万条回复的分析显示,25%的引用内容源自新闻报道。这种对新闻内容的严重依赖引发了关于AI时代内容来源和版权的重要问题。
"我们预期会看到一些新闻引用,但规模之大令人惊讶,"Muckrack发言人表示,"这些系统本质上是在大规模合成并重新包装专业记者的工作成果。"
谁在被引用?
研究明确了新闻来源中的热门选择:
- 路透社成为全球被引用最频繁的媒体
- 福布斯在排名中位居第二
- 在英国市场,卫报占据主导地位
个别记者也未能幸免于此趋势。前商业内幕CEO亨利·布洛杰特成为被AI系统引用最多的记者。
衡量"AI可见度"
针对这些发现,Muckrack引入了一个新指标,将记者的"AI可见度"分为三个层级。同时,对谷歌AI概览功能的分析显示,对于更广泛的查询,Facebook和Reddit等平台也是重要的参考来源。
版权难题持续发酵
这些数据重新点燃了行业关于AI使用受版权材料的争论。在科技公司竞相推进AI开发——Meta员工争夺token使用量、Netflix开源视频编辑工具的同时——关于如何公平补偿内容创作者的问题依然存在。
Anthropic近期因不可持续的需求而停用OpenClaw等第三方工具的决定,暗示了可持续AI发展面临的挑战。正如一位行业观察者指出:"我们正在构建依赖人类创造力的强大系统,但尚未完全弄清楚如何恰当评估这种人类投入的价值。"
关键要点:
- AI聊天机器人25%的引用来自新闻报道
- 路透社、福布斯和卫报是最常被引用的信源
- 前商业内幕CEO亨利·布洛杰特是被引用最多的记者
- 新指标追踪记者的"AI可见度"
- 研究发现重启了AI开发中的版权争议

