跳转到主要内容

阿里巴巴AI模型以22.32%回报率赢得投资竞赛

阿里巴巴AI模型主导首届投资竞赛

2025年11月4日 - 首届AI大模型投资竞赛Alpha Arena落幕,阿里巴巴的通义千问Qwen3-Max成为明确赢家。这项由美国研究机构Nof1主办的活动展示了人工智能在金融市场中日益增长的能力。

Image

竞赛框架

六种领先的大语言模型(LLM)参与了为期一个月的挑战,每个模型获得10,000美元虚拟资金在Hyperliquid平台上交易比特币和以太坊永续合约。独特约束条件包括:

  • 数据限制:模型只能访问数值市场数据(价格、成交量、技术指标)
  • 无外部背景:排除新闻事件或定性信息
  • 绩效指标:根据原始回报率(Qwen3-Max为22.32%)和风险调整后的夏普比率进行评判

Image

出现分歧的交易策略

研究人员观察到参与者之间存在显著行为差异:

  • 主动vs被动:部分模型执行频繁交易而其他则保持较长期持仓
  • 风险偏好:对杠杆和头寸规模的多样化处理方式自然形成
  • 数据敏感性:简单的提示调整(如改变数据呈现顺序)会显著影响某些模型的绩效表现

竞赛揭示了AI系统解读金融数据的意外细微差别。"我们发现某些模型将价格下降序列误读为看涨信号,直到我们重新格式化输入数据",一位Nof1研究员指出。

局限性与未来方向

研究承认了几项限制因素:

  • 仅六种模型的小样本量
  • 短期评估周期(30天)
  • 有限资产类别(仅BTC/ETH衍生品)

研究团队计划在第二季扩展试验范围,包括:

  1. 增加控制变量
  2. 更多资产类别
  3. 延长评估窗口
  4. 增强统计测量工具
  5. 深化行为分析协议

对金融AI发展的启示

Alpha Arena代表了从静态基准测试向动态市场环境的范式转变。关键发现表明:

  • 未经调优的LLM无需金融专项训练即可生成超额收益
  • 数据呈现格式对决策质量具有关键影响
  • 风险管理仍是自主系统面临的持续挑战 Nof1的举措架起了学术研究与实用金融科技应用之间的桥梁,可能加速AI交易系统的采用。

关键要点:

  • 🏆 阿里巴巴Qwen3-Max在受限条件下实现22.32%回报率
  • 🔍 模型在没有明确编程的情况下展现出独特交易个性
  • ⚠️ 数据格式化意外成为关键绩效因素
  • 📈 竞赛验证了AI在量化金融应用中的潜力
  • 🔬 未来迭代将纳入更多变量与资产类别

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

DeepMind先驱者携十亿美元AI愿景独自启航

DeepMind突破性成果AlphaGo背后的智囊大卫·席尔瓦已离职创办自己的AI企业。他的初创公司Ineffable Intelligence旨在通过不依赖人类知识的自主学习系统改写规则书。凭借雄心勃勃的10亿美元融资计划,席尔瓦的豪赌或将重新定义我们所知的人工智能。

February 22, 2026
人工智能科技创业机器学习
谷歌Gemini 3.1 Pro大幅提升AI推理能力
News

谷歌Gemini 3.1 Pro大幅提升AI推理能力

谷歌发布了迄今为止最先进的AI模型Gemini 3.1 Pro,其推理能力较前代产品提升逾一倍。这款专为应对复杂科学与工程挑战设计的模型,在严苛的逻辑测试中获得了77.1%的优异成绩。开发者可通过多平台获取该模型,而企业用户和订阅者将享有高级功能。

February 20, 2026
AI进展谷歌Gemini机器学习
阿里Qwen3.5-Plus打破纪录成为开源AI新标杆
News

阿里Qwen3.5-Plus打破纪录成为开源AI新标杆

正值农历新年庆祝之际,阿里巴巴重磅推出Qwen3.5-Plus——这款开源AI巨头以更低成本超越行业标杆。这款革命性模型在其紧凑框架中注入了重大创新,提供多模态能力并全面刷新基准测试成绩。全球开发者现在可免费获取媲美谷歌和OpenAI高端产品的技术。

February 17, 2026
AI创新开源技术机器学习
MiniMax全新AI模型实现速度飞跃
News

MiniMax全新AI模型实现速度飞跃

MiniMax最新发布的M2.5-HighSpeed模型以惊人性能提升引发关注。其处理速度达到竞争对手的三倍,每秒可处理100笔交易——这将成为AI应用的颠覆性突破。伴随速度提升,MiniMax还推出灵活定价方案和推荐折扣,使强大AI工具变得前所未有地触手可及。

February 16, 2026
AI加速MiniMax机器学习
豆包AI更智能也更便宜:2.0版本大幅降低成本
News

豆包AI更智能也更便宜:2.0版本大幅降低成本

火山引擎的豆包大模型迎来重大升级。全新2.0版本在全面提升性能的同时,将推理成本降低了90%。四个专精模型满足不同需求,超越Gemini等竞品的多模态理解能力,以及增强的编程功能,使豆包成为AI领域的强力竞争者。开发者将受益于新开放的API接口和亲民定价策略。

February 14, 2026
AI开发机器学习科技创新
蚂蚁集团万亿参数AI模型取得新突破
News

蚂蚁集团万亿参数AI模型取得新突破

蚂蚁集团发布具有里程碑意义的万亿参数AI模型Ring-2.5-1T,该开源模型在数学推理和长文本处理方面树立了新标杆。这款突破性模型在复杂任务中超越竞争对手,同时显著提升效率——从解决奥数级别数学题到驱动AI助手,标志着人工智能能力的重大飞跃。

February 13, 2026
AI创新机器学习开源技术