跳转到主要内容

AI交易对决:DeepSeek在市场测试中超越Gemini

AI模型在真实市场交易挑战中正面交锋

金融研究实验室nof1进行了一项名为Alpha Arena的开创性实验,让六款主流AI模型在去中心化交易所Hyperliquid上进行实盘交易对决。每个模型获得10,000美元真实资金,并在相同条件下运作以测试其金融决策能力。

参赛者与结果

参与测试的模型包括:

  • GPT-5
  • Gemini 2.5 Pro
  • Grok-4
  • Claude Sonet 4.5
  • DeepSeek V3.1
  • Qwen3Max

Image

结果显示业绩存在显著差异:

  • DeepSeek V3.1Grok-4以超过14%的回报率并列榜首
  • Gemini 2.5 Pro遭受灾难性亏损达42.57%,创下最差纪录

其他模型表现参差不齐,无一能匹敌领先者的成绩。

超越单纯竞赛

Alpha Arena项目旨在评估的不仅仅是原始盈利能力。据nof1研究人员称,主要目标包括:

  1. 评估市场波动下的策略稳定性
  2. 测试不同模型架构的风险应对机制
  3. 建立AI驱动量化交易系统的基准指标

该实验展示了大型语言模型如何从文本处理领域进化到复杂金融应用场景。

对金融AI的启示意义

部分模型的成功表现预示着以下领域的应用前景:

  • 自动化投资组合管理
  • 实时交易算法
  • 风险评估系统 Gemini 2.5 Pro的惨败也凸显了在部署真实资金AI系统前进行充分测试的重要性。

    金融行业持续表现出对能比人类交易员更快更全面处理市场数据的AI解决方案的强烈兴趣。

    关键要点:

  • DeepSeek V3.1和Grok-4在实盘测试中获得超14%回报率
  • Gemini 2.5 Pro损失近半数配置资金
  • 实验在Hyperliquid交易所进行,每个模型使用10,000美元真实资金 该研究同时揭示了AI驱动金融系统的潜力与风险

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

AI实验室AfterQuery获3000万美元融资,推动数据领域突破
News

AI实验室AfterQuery获3000万美元融资,推动数据领域突破

人工智能研究公司AfterQuery已完成3000万美元的A轮融资,估值飙升至3亿美元。本轮融资由Altos Ventures领投,The Raine Group跟投。新资金将用于扩大公司专家网络并深化专业数据服务。值得注意的是,AfterQuery近期年收入突破1亿美元,表明其AI训练数据解决方案市场需求强劲。

April 15, 2026
AI融资机器学习科技初创公司
News

投资者转移筹码:Anthropic挑战OpenAI的AI霸主地位

随着Anthropic爆炸性的收入增长对OpenAI的高估值施压,AI投资格局正在升温。尽管OpenAI仍保持着8520亿美元的估值,投资者却越来越被Anthropic380亿美元的更亲民估值和三位数的收入增长所吸引。市场动态显示Anthropic股票需求更强劲,这让人质疑OpenAI万亿美金IPO的雄心在新竞争环境下是否现实。

April 15, 2026
AI投资OpenAIAnthropic
Skywork AI的Matrix-Game 3.0通过实时高清视频让虚拟世界栩栩如生
News

Skywork AI的Matrix-Game 3.0通过实时高清视频让虚拟世界栩栩如生

Skywork AI破解了AI视频生成的最大挑战——长期记忆。其全新Matrix-Game 3.0系统能以40帧/秒生成无缝720p世界,像虚拟导游般记住每个细节。秘诀在于相机感知记忆系统及海量游戏数据,这些数据教会AI理解真实世界的运作规律。这项突破或将彻底改变从电子游戏到机器人训练的各个领域。

April 14, 2026
AI视频生成实时渲染游戏技术
HarmonyGNN:AI理解复杂关系的重大突破
News

HarmonyGNN:AI理解复杂关系的重大突破

一种名为HarmonyGNN的新型AI训练方法正在彻底改变计算机理解数据中复杂关系的方式。由北卡罗来纳州立大学的研究人员开发,该技术帮助神经网络更好地区分图数据中不同类型的连接,实现高达9.6%的准确率提升。这一创新可能对药物发现和天气预报等领域产生重大影响。

April 14, 2026
人工智能机器学习图神经网络
News

美国监管机构敦促银行利用AI技术加强金融安全

在一项出人意料的政策转变中,美国顶级金融监管机构目前正鼓励各大银行测试Anthropic强大的Mythos AI模型,以发现系统漏洞。尽管此前对该技术的风险持谨慎态度,但财政部长Scott Bessent和美联储主席Jerome Powell看到了将该模型能力转化为防御工具的潜力。包括摩根大通和高盛在内的华尔街巨头已开始测试,尽管Anthropic正因国家安全问题面临特朗普政府的法律挑战。

April 13, 2026
AI监管金融科技网络安全
小米AI模型加入领先开源框架并开放免费试用
News

小米AI模型加入领先开源框架并开放免费试用

小米将其MiMo-V2系列AI模型集成至开源AI开发主流框架Hermes Agent中。开发者现可免费试用两周小米的Pro、Omni和Flash模型。此次合作结合了小米的硬件专长与Hermes的自我进化能力,为AI助手带来新的可能性。此举标志着AI竞争焦点正从对话质量转向执行效率。

April 10, 2026
小米AI开发开源