Gracenote起诉OpenAI涉嫌窃取数据用于AI训练
Gracenote起诉OpenAI涉嫌数据抓取
尼尔森子公司Gracenote已向联邦法院对OpenAI提起诉讼,这一举措可能重塑AI公司收集训练数据的方式。这家媒体元数据巨头指控该AI领军企业不当使用其专有数据库来训练ChatGPT等商业产品。
争议核心
Gracenote的数据库并非普通的资料集合。数百名人工编辑细致地分类整理了电视节目、电影和其他媒体——创建详细描述、识别独特特征并绘制内容间复杂关系图。这不仅仅是数据;更是无数小时专业技能劳动的成果。
该公司声称ChatGPT关于《权力的游戏》等热门节目的回复与Gracenote专有描述存在惊人相似性。“他们不仅拿走了我们的文字,”Gracenote发言人解释道,“还复制了我们理解媒体关系的整个框架——这正是我们获得专利的系统。”
受威胁的商业模式
此案对Gracenote尤为紧迫的原因何在?其全部营收模式依赖于向智能电视制造商和流媒体平台等客户授权这些精心整理的数据。Gracenote警告称,如果AI公司可以随意抓取并复述这些信息,价值5亿美元的元数据市场可能崩溃。
“我们多次尝试协商正式授权事宜,”发言人指出,“但每次都被忽视或回绝。法律诉讼成为我们唯一的救济途径。”
OpenAI的辩护立场
OpenAI坚持认为所有训练数据都受“合理使用”原则保护。公司代表表示:“我们的模型从公开可用信息中学习,就像人类研究各种学科时那样。”
法律专家对此案走向意见不一。有人认为这与近期针对AI艺术生成器的诉讼类似,另一些则指出Gracenote结构化数据库的特殊性可能使本案成为里程碑式案例。
后续发展
虽然向纽约南区法院提起的诉讼可能需要数年才能解决,但其影响已然显现。各行业内容创作者都在密切关注——许多人担忧他们的专有数据可能成为下一个目标。
关键要点:
- Gracenote指控 OpenAI未经许可复制其专有媒体元数据
- 人工整理数据库包含详细节目描述和关系映射
- 商业威胁在于AI可能取代授权元数据服务
- OpenAI坚称仅依据合理使用原则处理公开数据
- 法律先例将决定AI训练数据获取规范



