NVIDIA因涉嫌使用盗版书籍训练AI面临版权诉讼
NVIDIA被指控使用盗版书籍推动AI野心
科技巨头NVIDIA面临严峻法律挑战,作者们提交的修正起诉书指控该公司系统性使用影子图书馆的受版权保护材料训练其人工智能模型。
指控逐渐成形
在加州提起的诉讼描绘了令人不安的画面。原告声称NVIDIA内部战略团队曾主动联系臭名昭著的盗版电子书库Anna's Archive,为其大语言模型寻求海量数据集。据称内部通信显示高管们在收到材料来源可疑的警告后,仍于数日内批准了该项目。
"这并非偶然抓取数据,"法律专家Maria Chenson表示,"起诉书暗示了通过已知盗版渠道故意获取受版权作品的努力。"
不止Anna's Archive
涉及范围似乎比最初想象的更广。法庭文件提到其他可能牵涉其中的影子图书馆,包括:
- LibGen
- Sci-Hub
- Z-Library
更严重的是,NVIDIA还被指控分发帮助企业客户自动收集类似数据集的工具——这可能使其面临二次侵权索赔。
合理使用辩护站不住脚?
NVIDIA此前依赖AI版权案件中常见的"合理使用"论点。但新曝光的邮件可能削弱这一立场。据称一封往来邮件显示员工讨论支付Anna's Archive以获取更快下载速度——这很难说是一个相信自己行为属于合理使用保护范畴的公司会有的行为。
"当你与盗版网站协商访问费用时,"知识产权律师David Lin指出,"你的合理使用辩护就开始显得相当站不住脚了。"
利害关系
案件结果可能在科技行业产生连锁反应:
- 法律先例:可能确立关于AI训练数据来源的更明确边界
- 企业实践:可能迫使公司在获取训练材料方式上进行透明度改革
- 创作者权利:可能加强针对未经授权AI使用的版权保护
随着双方准备各自论点,案件仍在发展之中。
关键要点:
- 主动追求:邮件据称显示NVIDIA是主动寻找盗版内容而非偶然获得
- 规模问题:根据文件显示涉及约500TB争议数据
- 连带责任:提供给客户的工具使NVIDIA的法律立场复杂化
- 行业影响:结果可能重塑AI公司获取训练数据的方式