《大英百科全书》起诉OpenAI涉嫌内容侵权
《大英百科全书》起诉OpenAI
在一项可能重塑AI行业的大胆举措中,《大英百科全书》和韦氏词典已对OpenAI采取法律行动。出版商指控该公司未经许可使用其受版权保护的内容来训练其流行的ChatGPT模型。
争议核心
诉讼称OpenAI从大英百科全书的数字资产中"抓取"了近10万篇文章、百科全书条目和词典定义。法庭文件显示了一些惊人的例子,其中ChatGPT的回应几乎逐字逐句地反映了大英百科全书的内容——有时甚至包括原始材料中存在的事实错误。
真正让大英百科全书感到刺痛的是什么?当用户在ChatGPT界面中直接获得完整答案时,他们不再需要访问百科全书的网站。这种"流量流失"打击了大英百科全书的痛处——其广告收入严重依赖网站访问者。
超越版权:商标纠纷
法律投诉比典型的版权主张更进一步。利用《兰哈姆法案》(涵盖商标侵权),大英百科全书辩称ChatGPT有时会编造事实,然后虚假地将其归因于该百科全书。这些"幻觉"损害了大英百科全书来之不易的准确性声誉,同时误导用户以为存在潜在合作关系。
"当ChatGPT编造信息然后说它来自我们时,这是双重伤害,"一位大英百科全书的发言人解释道。"它在传播错误信息的同时让人们以为我们参与其中,而实际上我们并没有。"
AI公司面临的法律风暴日益加剧
OpenAI并非唯一面临这些挑战的公司。在整个硅谷,AI公司正受到作者、艺术家以及现在传统知识提供商的起诉:
- Anthropic最近就盗版电子书案件达成了15亿美元的和解
- 主要新闻机构已提起类似诉讼
- 甚至一些科技公司也在就训练数据来源起诉竞争对手
法律形势仍不明朗。虽然一些法官裁定AI训练符合"变革性"合理使用原则,但其他人坚持认为使用盗版材料越界——无论内容之后如何被转化。
这对AI的未来意味着什么
此案可能会迫使神秘的AI公司对其训练数据来源采取彻底的透明度措施。多年来,像OpenAI这样的公司一直采用批评者称之为"黑箱"的方法——拒绝确切披露其模型中包含的内容。
结果可能决定AI公司是否需要:
- 在训练模型前妥善获取内容许可
- 实施更好的归属系统
- 与内容创作者分享收入
- 或面临潜在毁灭性的法律处罚
正如一位法律专家所言:"我们正在法庭上见证两种截然不同的知识构建方式的碰撞——一种是通过严谨学术历经数世纪建立的,另一种是通过大规模数据收集以数字速度组装的。"
关键点:
- 法律行动:《大英百科全书》起诉OpenAI涉嫌未经授权使用其内容
- 核心投诉:近10万篇文章/词典条目未经许可用于AI训练
- 额外主张:虚假归属损害品牌声誉;聊天机器人回应分流网络流量
- 更广泛影响:此案可能迫使更多关于AI训练数据来源的透明度
- 行业趋势:多起诉讼挑战AI公司如何使用受版权保护的材料


