日本AI雄心蒙上抄袭指控阴影
日本AI展示引发透明度争议
本应是日本科技行业引以为豪的时刻,却成了关于AI开发伦理的警示故事。乐天集团近期发布的700亿参数语言模型——在政府支持下开发——在眼尖的开发者发现其外国血统的蛛丝马迹后迅速陷入争议。
蛛丝马迹
模型发布数小时内,开源调查人员就在技术架构中发现了确凿证据。配置文件仍保留原始名称"DeepseekV3ForCausalLM"——这是中国开发模型的明显指纹。乐天似乎并未如宣称那样从零构建,而只是用日本数据对这个现有框架进行了微调。
"这就像给汽车重新喷漆后声称是自己设计的",一位开发者在GitHub上评论道,"底盘上还留着原厂的标记"。
披露困境
争议集中在两个关键问题上:
1. 选择性透明 乐天的新闻材料模糊提及"整合开源社区智慧",却未具体承认中国模型的基础性作用。对于被宣传为国家成就的项目,这种遗漏让许多人觉得不够诚实。
2. 许可证疏漏 据称最初发布版本遗漏了所需的MIT许可证文件。虽然乐天后来添加了合规声明,但批评者认为这种被动应对方式展现了糟糕的开源管理能力。
行业反应
AI社区意见分歧:
- 纯粹主义者谴责他们认为的知识产权洗白行为
- 实用主义者指出模型优化在全球都是常见做法
- 法律专家辩论是否在技术上违反了许可条款
"这不只是乐天的问题",东京大学AI伦理学教授佐藤贤治指出,"这暴露了在领域飞速发展时正确追溯AI血统的系统性挑战"。
截至发稿时,乐天坚称其模型代表了重大原创工作,同时拒绝就有关删除许可证文件的具体指控置评。
关键要点:
- 700亿参数模型在经济产业省资助下面临真实性质疑
- 技术痕迹暗示中国深度求索模型的基础
- 披露行为被批评为不够透明
- 开源合规性仍在审查中
- 行业争论持续关于衍生AI作品的伦理标准

