苹果陷入AI版权风波,被指使用盗版书籍数据
苹果因AI训练数据面临法律压力
科技巨头苹果因涉嫌使用盗版书籍训练其人工智能系统而陷入困境。该公司如今与硅谷其他重量级企业一样,面临着与AI开发实践相关的版权侵权诉讼。
诉讼详情
Chicken Soup for the Soul有限责任公司于3月18日提起诉讼,指控苹果不当使用了包含争议性"Books3"模块的"The Pile"数据集。据报道,这个数字图书馆包含数千本未经授权从互联网抓取的受版权保护作品。

本案不仅针对苹果——还点名了几乎所有AI开发领域的主要参与者,包括Meta、谷歌的xAI、Anthropic、OpenAI甚至芯片制造商英伟达。法律专家认为这是对科技公司数据收集行为更广泛抵制的一部分。
苹果的辩护
这家总部位于库比蒂诺的公司坚称自己遵守了规则。"自2024年以来,我们一直致力于合法且道德地构建AI数据集,"一位苹果发言人表示。他们强调虽然研究人员在开源项目OpenELMs中使用了"The Pile",但这些数据从未用于其旗舰产品Apple Intelligence系统。
但法律分析师并不认为这一辩护站得住脚。"苹果与谷歌的技术合作可能引发责任问题,"知识产权律师马克·陈解释道,"如果谷歌的Gemini模型使用了有问题的训练数据并影响了苹果的系统,两家公司可能要共同承担责任。"
行业影响
这起诉讼正值全球各国政府加强AI监管之际。Perplexity等被告辩称其网络抓取方法属于行业标准做法,但创作者认为这些做法构成了系统性版权侵权。
"此案代表着一个转折点,"出版业倡导者丽莎·王表示,"内容创作者终于开始反击科技公司将创意作品视为其盈利机器的免费原材料的行为。"
案件结果可能迫使AI开发者彻底重新思考如何获取训练数据——这可能会显著增加模型开发的成本和复杂性。
关键点:
- 多起诉讼现正针对科技巨头的AI训练数据实践
- 争议核心在于涉嫌侵权的"Books3"数据集
- 苹果坚称其核心AI系统未使用争议数据
- 法律专家警告技术合作可能导致责任共担
- 本案可能迫使全行业改变数据获取方式
