NYU教授42美分的AI口试揭露作弊漏洞
学术作弊的0.42美元解决方案
图片来源说明:该图片由AI生成,图片授权服务商为Midjourney
当NYU教授Panos Ipeirotis和Konstantinos Rizakos在他们的"AI/ML产品管理"课程中发现可疑的完美作业时,他们没想到简单的口试会暴露出如此明显的知识漏洞——那些提交无懈可击论文的学生,却连自己作品的基本原理都解释不清。
AI如何成为终极助教
教授们利用ElevenLabs语音AI技术将这一发现转化为创新评估方法。他们的两阶段口试首先要求学生辩护项目决策,随后随机抽考课程内容。36名学生在9天内完成了25分钟的测试,总成本仅15美元——比外卖披萨还便宜。
"起初学生抱怨AI听起来像严厉的教授",Ipeirotis坦言。早期版本有时会同时抛出多个问题造成混乱。经过调整后,虚拟考官在保持严谨标准的同时变得更善于对话。
评分革命
评分面临另一项挑战。使用Claude、Gemini和ChatGPT评估答案最初产生了不一致的结果。"就像有三个永远达不成共识的助教",Rizakos开玩笑说。通过让AI相互校验评估结果,他们最终获得了高度一致的分数。
尽管70%的学生承认这种测试能有效衡量真实理解力,但许多人认为其压力大于笔试。"你没法糊弄AI",一名参与者指出:"它立刻能识别模糊答案并要求补充说明"
超越作弊检测
实验还发现了超出预期的益处。"有些学生明显理解概念但难以表述",Ipeirotis观察到:"现在我们知道该加强哪些教学内容了"
教授们相信AI口试可能成为标准实践——尤其对于技术类课程而言实操理解比华丽文笔更重要。每次测试42美分的成本也解决了学术预算限制这个永恒难题。
关键要点:
- 书面与口头差异:高分作业经常无法在口头测试中体现实际理解程度
- 经济型创新:AI监考将每班口试成本从数百美元降至个位数
- 有意义的压力:虽比笔试更紧张但多数学生认可该方法有效性
- 教学洞察:考试不仅发现作弊行为更揭示了需要关注的真实学习短板



