Reddit起诉Anthropic涉嫌未经授权数据爬取
Reddit已对人工智能初创企业Anthropic采取法律行动,向旧金山高等法院提起诉讼,指控其系统性违反平台规则。这家社交媒体巨头声称,自2024年7月以来,Anthropic在完全知晓Reddit禁止自动化爬取的情况下,仍进行了超过10万次未经授权的访问。
在法庭文件中,Reddit将Anthropic描绘成一个公开倡导AI道德发展、却涉嫌在幕后违反平台规则的公司形象。诉状指出:"Anthropic自诩为AI伦理的白骑士","却同时开发着依赖未经授权数据收集的商业产品"。

图片来源说明:该图片由AI生成,经MidJourney服务商授权
Reddit首席法务官Ben Lee强调了该平台在AI生成内容主导时代的独特价值。"Reddit的特别之处在于这里发生的真实人类对话和情感连接",Lee表示。他暗示Anthropic涉嫌的数据爬取可能为这家AI公司带来数十亿美元收入,同时可能破坏Reddit自身的商业模式。
此次诉讼正值Reddit通过官方合作日益实现数据货币化之际。去年二月,该公司与谷歌达成6000万美元协议,允许其访问内容用于AI训练目的。与其他未披露公司的类似协议表明,Reddit正将自己定位为蓬勃发展的AI行业关键数据提供商。
这并非Anthropic首次卷入版权争议。去年八月,该公司就面临作家群体提起的集体诉讼,指控其未经授权使用受版权保护的书籍。2023年10月,环球音乐集团起诉Anthropic涉嫌系统性侵权歌词使用。
此案提出了关于AI公司如何在尊重知识产权的同时道德获取训练数据的基本问题。随着人工智能技术日益复杂化,法院可能需要明确机器学习应用中合理使用与侵权行为的界限。
法律专家认为此案可能建立重要先例,指导平台如何既保护内容免遭未经授权的爬取,又通过合法合作参与AI经济。判决结果可能影响其他社交媒体公司应对类似挑战的方式。
关键要点
- Reddit指控Anthropic自2024年7月以来对其平台进行了超过10万次未经授权的访问
- 诉讼将Anthropic公开的伦理立场与涉嫌违规行为形成对比
- Reddit已与谷歌等公司达成价值数百万美元的数据授权协议
- 这是Anthropic近几个月来面临的至少第三起重大版权挑战
- 本案可能有助于界定AI训练中合理使用与侵权的边界


