《大英百科全书》起诉OpenAI涉嫌内容侵权
《大英百科全书》就内容使用问题起诉OpenAI
本周,传统知识提供商与人工智能公司之间的战线愈发清晰。《大英百科全书》及其子公司梅里亚姆-韦伯斯特已对OpenAI采取法律行动,指控该公司未经许可使用其受版权保护的材料来训练其广受欢迎的ChatGPT系统。
争议核心
根据周五提交的法庭文件,《大英百科全书》声称OpenAI非法复制了近10万篇文章、百科全书条目和词典定义。"这不仅仅是关于补偿的问题,"一位《大英百科全书》发言人告诉记者,"这是在一个AI可以复制但不总能验证信息的时代,保护经过精心研究的知识的完整性。"
诉讼书中列举了几个引人注目的例子,据称ChatGPT生成的回应与《大英百科全书》的专有内容几乎完全相同。在一个例子中,当被问及第一次世界大战的原因时,据报道ChatGPT生成的文本与《大英百科全书》的条目仅在措辞上略有不同。
超越版权:归因问题
使此案特别有趣的是,《大英百科全书》还根据《兰哈姆法案》提出了商标侵权的额外主张。出版商认为,ChatGPT有时会编造事实(臭名昭著的"AI幻觉"),同时错误地将这些事实归因于《大英百科全书》。
"当ChatGPT出错但声称信息来自我们时,"梅里亚姆-韦伯斯特的法律顾问解释道,"这不仅损害了我们准确性的声誉,还在用户心中制造了错误的联想。"
流量流失困境
出版商在AI时代面临的另一个棘手现实是:直接回答问题的技术意味着访问其网站的访客减少。当ChatGPT在聊天窗口中就能总结一切时,为什么还要点击进入百科全书呢?这种"流量流失"效应可能会破坏依赖广告或订阅收入的知识提供商的商业模式。
日益增长的法律趋势
OpenAI并非唯一面临这些挑战的公司。在整个行业中,AI公司正应对来自作者、出版商和媒体组织的类似诉讼。就在去年,Anthropic以15亿美元和解了一起涉及用于模型训练的盗版电子书的案件。
法律专家正密切关注法院在这一知识产权法新领域开始确立先例的情况。虽然一些法官已经认识到AI训练的"变革性"本质,但未经授权使用受版权保护的材料仍然是违法的。
利害攸关的是什么?
此案的结果可能会重塑AI公司未来的运营方式。多年来,这些公司一直将其训练数据来源视为严格保密的商业秘密。现在传统知识权威机构通过诉讼进行反击后,我们或许最终能更清楚地了解在人工智能时代什么构成合理使用。
关键点:
- 《大英百科全书》指控OpenAI未经许可使用了超过10万篇文章
- 诉讼包括根据版权法和商标法(《兰哈姆法案》)提出的主张
- 对损害出版商声誉的AI幻觉表示担忧
- 案件凸显了传统知识提供商面临的"流量流失"威胁
- 属于针对AI训练实践的法律挑战日益增长的趋势的一部分
