跳转到主要内容

Moonshot推出Kimi-Researcher,专为深度研究任务设计

Moonshot推出Kimi-Researcher,专为深度研究任务设计

Moonshot Dark Side正式发布了其首款AI驱动的深度研究代理Kimi-Researcher,目前正在进行限量内部测试。这一新模型利用端到端自主强化学习(agentic RL)技术,为用户提供高效、深入的研究能力。

先进的自主研究能力

在处理复杂查询时,Kimi-Researcher展现出卓越的自主性:

  • 平均每项任务执行23步推理
  • 每次查询规划74个搜索关键词
  • 评估206个URL,仅保留质量最高的前3.2%内容 Image

该系统超越了简单的信息检索功能:

  • 自动调用浏览器和代码解释器等工具
  • 将原始数据处理为可操作的见解
  • 生成包含可追溯来源的全面报告

基准测试表现与实际应用

为验证其能力,开发者对Kimi-Researcher进行了严格的Humanity's Last Exam (HLE)基准测试,涵盖数百个专业领域包括:

  • 数学与物理学
  • 医学研究
  • 政治学与历史学 该模型取得了令人印象深刻的成绩:26.9% Pass@140.17% Pass@4准确率,超越多个成熟AI系统。

在实际场景中,Kimi-Researcher已证明对以下领域具有重要价值:

  • 寻求高价值基准的算法工程师
  • 研究行业趋势的商业分析师
  • 比较国际数据隐私法的法律专业人士 该系统可生成10,000+字的报告并附带约26个高质量参考文献,同时提供可共享的交互式可视化内容。

技术创新与可用性

该模型的独特架构特点包括:

  • 零结构设计:无需复杂提示或预设工作流程
  • 自适应能力:完全通过试错强化学习进行学习 这种方法使其在处理冲突信息或适应环境变化时表现出色。

目前该服务处于限量测试阶段。感兴趣的用户可在kimi.com申请访问权限,审核通过后可激活"深度研究"功能。

关键点:

  1. Moonshot Dark Side发布AI研究代理Kimi-Researcher进入测试阶段
  2. 系统自主规划搜索、筛选内容并生成详细报告
  3. 在极具挑战性的Humanity's Last Exam基准测试中取得顶级表现
  4. 目前可通过kimi.com的限量访问计划获取

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

谷歌Gemini 3将AI推理能力推向科学新高度

谷歌发布Gemini 3 Deep Think,标志着AI能力在日常对话之外的重大飞跃。这款专业模型以奥林匹克竞赛级别的推理能力解决复杂科学问题,在数学和编程挑战中表现惊人。现已面向精选研究人员和Google AI Ultra订阅用户开放,有望从基准测试冠军转型为真正的实验室伙伴。

February 13, 2026
AI研究机器学习科学计算
News

苹果的制胜秘诀:为何调优后的开源模型在UI设计上超越GPT-5

苹果研究团队在AI辅助UI开发领域取得惊人突破。通过与21位设计专家合作,通过草图与代码修改提供针对性反馈,他们证明了在AI训练中质量胜过数量。经过微调的Qwen3-Coder模型虽规模较小,却在生成应用界面时超越了GPT-5——这印证了在人工智能时代,专业的人类洞察力依然不可替代。

February 6, 2026
AI研究UI开发机器学习
News

腾讯AI布局再添强援:顶尖科学家田雨鹏加入混元团队

腾讯在人工智能人才争夺战中再下一城,聘请田雨鹏担任混元多模态团队首席研究科学家。这位清华大学博士、前Sea AI Lab研究员将专注于提升腾讯旗舰AI模型的强化学习能力。此举彰显了腾讯持续领跑多模态AI前沿研发的决心。

February 3, 2026
腾讯人工智能研究强化学习
News

AI领军人物彭天宇执掌腾讯混元多模态研究

AI研究新星彭天宇,这位与清华大学渊源深厚的学者,已加入腾讯混元部门担任首席研究科学家。这位机器学习专家将引领多模态强化学习的创新,融合视觉与语言AI能力。拥有包括顶级会议奖项和论文发表在内的卓越履历,彭的加入彰显了腾讯在生成式AI技术前沿突破的决心。

January 30, 2026
AI研究腾讯混元多模态学习
NeurIPS会议因虚假引用丑闻陷入信任危机
News

NeurIPS会议因虚假引用丑闻陷入信任危机

人工智能领域最负盛名的会议之一曝出惊人发现,大规模引用欺诈行为被揭露。GPTZero调查发现51篇NeurIPS论文中存在100多个伪造参考文献,包括虚构作者和无效DOI。这一丑闻凸显了学术出版日益增长的压力——自2020年以来会议投稿量翻倍增长,使同行评审系统不堪重负。

January 23, 2026
学术诚信AI研究同行评审
News

AI以全新方法破解著名数学难题

OpenAI最新模型通过解决一个长期存在的数论问题在数学界引起轰动。这个对埃尔德什问题的解决方案引起了菲尔兹奖得主陶哲轩的注意,他称赞其独创性。但成功背后隐藏着一个发人深省的现实——AI解决此类问题的总体成功率仍然很低,提醒我们这些工具是助手而非人类数学家的替代品。

January 19, 2026
AI研究数学机器学习