英伟达因涉嫌使用盗版书籍训练AI而面临强烈反对
英伟达被指控在AI训练中使用盗版内容
一起爆炸性诉讼震动了硅谷,指控芯片制造商英伟达在急于开发具有竞争力的AI技术时越过了道德底线。法庭文件显示,该公司可能通过臭名昭著的影子图书馆秘密获取了大量盗版电子书。
相关指控
根据法律文件,英伟达据称联系了被称为"图书海盗湾"的Anna's Archive,寻求多达500TB的受版权保护材料。诉讼中引用的内部通信表明公司高管清楚他们正在利用非法获取的内容。
"这不是意外抓取数据",一位熟悉此案的原告律师表示,"我们说的是在公开宣称合理使用的同时,故意接触已知的盗版运营方"。
竞争压力锅
这一披露正值英伟达的关键时刻,该公司一直努力将其业务从显卡主导扩展到成为AI领域的巨头。当OpenAI的ChatGPT在2022年底横空出世时,行业观察人士表示英伟达急于展示可与之媲美的技术。
不久后该公司推出了NeMo和Retro-48B模型,但作者们现在声称这些令人印象深刻的演示背后存在可疑的数据来源。畅销小说家埃琳娜·彼得罗夫(Elena Petrov)是原告之一,她指控道:"他们走了捷径——没有通过正规渠道获取内容授权就直接使用了盗版网站的资料"。
影子图书馆关联
诉讼指出了多个有问题的来源:
- Anna's Archive
- LibGen
- Sci-Hub
- Z-Library
这些平台长期在法律灰色地带运作,提供对数百万受版权保护的学术论文和书籍的免费访问。虽然深受研究人员和学生欢迎,但出版商已多次以侵权为由起诉它们。
科技伦理学家马库斯·袁博士指出:"令人震惊的是看到一个市值1万亿美元的公司可能依赖这些来源——这引发了关于某些AI模型是如何在不为人知的情况下被训练的严重问题"。
法律影响蔓延
本案带来的麻烦不仅限于英伟达:
- Anna's Archive面临新的法律审查
- 整个行业对训练数据透明度产生质疑
- 作者要求对用于AI的创意作品提供更明确的保护
The Authors Guild称此为"一个分水岭时刻",可能会重塑科技公司获取创意内容的方式。
与此同时,英伟达坚称自己无意侵犯版权并继续开发下一代模型。
关键点:
- 诉讼指控英伟达从盗版网站获取了500TB数据
- 内部邮件显示公司知晓版权问题
- 事件发生在与OpenAI等公司的激烈AI竞争中
- 本案可能为AI时代的创意权利开创先例

