OpenAI数据收集行为引发合同工担忧
OpenAI要求承包商提供真实工作样本
人工智能实验室在获取高质量训练数据方面既展现了创意——也潜藏风险。据《连线》报道,OpenAI及其合作伙伴Handshake AI已开始要求第三方承包商提交其职业经历中的实际案例研究。
请求背后的细则
这一不寻常的要求出现在公司简报会上,承包商被要求详细说明过去及当前工作中的任务细节。更引人注目的是,他们被要求上传"实际工作样本"——不是摘要,而是完整文件包括:
- Word文档
- PDF报告
- PowerPoint演示文稿
- Excel电子表格
- 代码仓库
"这无关假设场景,"一位要求匿名的行业分析师解释道,"他们要的是真材实料——人们在专业环境中实际创建的文档。"
行走在隐私钢索上
OpenAI为承包商提供了专用清理工具(被称为ChatGPT"星级清理"工具),用于在提交前删除专有信息和个人身份数据。但这里正是法律灰色地带所在。
接受《连线》采访的知识产权律师埃文·布朗直言不讳:"任何这样做的AI实验室都是在玩火。"他的担忧?该系统完全依赖承包商正确识别何为机密信息——这种判断很容易出错。
"想象一位营销顾问提交活动材料,"布朗举例说明,"他们可能隐去客户名称却保留了专有市场研究方法论。这就是潜在的诉讼导火索。"
当下为何重要
此举标志着随着AI公司进军白领工作自动化领域,它们对优质训练数据的争夺已趋白热化。传统的网络爬虫无法提供训练模型完成复杂专业任务所需的细致案例。
但代价是什么?法律专家警告即使使用清理工具:
- 人工编辑失误仍可能发生
- "专有信息"的定义因行业而异
- 合规负担不成比例地落在个体承包商身上
对于关注OpenAI激进数据获取策略的人而言,这场争议并不意外。就在上个季度,该公司还因涉嫌爬取科技公司工程师间的私人Slack对话而遭受批评。
当被要求置评时,OpenAI发言人拒绝就该承包计划详述或直接回应法律关切。
关键要点:
- 🚨 OpenAI向承包商索取实际工作文件(非摘要)
- 🛡️ 提供清理工具但依赖承包商判断
- ⚖️ 法律专家称该方法高风险
- 📈 反映对优质训练数据的激烈竞争

