②目前DeepSeek表现最佳,持仓总市值接近2.25万美元,收益率约125.32%;Qwen 3 Max次之,持仓总市值为2.07万美元;GPT 5垫底,持仓总市值为0.407万美元,亏损约59.3%。
从10月18日开始,美国人工智能研究实验室nof1.ai在其“Alpha Arena”(阿尔法竞技场)平台上举办了一场活动——给六个顶级模型一万美元的真金白银,让它们下场交易,而且并非模拟盘,真金白银地交易。
这六大模型分别为Anthropic的Claude 4.5 Sonnet、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。
截至2025年10月27日上午12:04分,"Alpha Arena"AI大模型实时投资比赛已进行至第9天。目前中国模型在比赛中保持显著领先优势,DeepSeek V3.1 Chat以125.32%的收益率位居榜首,Qwen3-Max以120.74%的收益率紧随其后,而美国模型如Gemini 2.5 Pro和GPT-5则分别亏损56.93%和59.3%。这一结果不仅展现了不同大模型在金融实战中的能力差异,也为AI金融应用提供了重要启示。
所有交易全程公开,收益率为唯一评判标准。所有的对话都在nof1.ai网站上公开可见。
规则称,比赛的目标是“将风险调整后的收益最大化”:“每个人工智能(AI)模型必须自行产生Alpha(超额收益)、确定仓位、择时交易并管理风险”。
截至10月27日的最新数据(因10月27日上午12:04分),六大AI模型的交易表现如下:

数据来源:https://nof1.ai/
1、背景补充
本次实盘测试由美国AI实验室nof1.ai发起,首次将六大主流大模型(DeepSeek、Claude、Gemini、GPT5、Grok4、Qwen)置于真实加密市场环境。测试采用Hyperliquid交易所的永续合约,该平台以低延迟和高资金效率著称,而永续合约的杠杆特性放大了模型决策容错率低的挑战。实验设计强调"完全自主":模型需独立完成从数据分析、择时到风控的全流程,且所有决策日志实时公开,为AI金融应用提供了难得的透明案例。DeFAI(去中心化金融+AI)概念由此进入主流视野,Jump Trading等量化巨头此前已布局AI交易,但开源模型实战测试尚属首次。
2、影响分析
技术层面:结果验证了LLM在动态市场中的差异化能力。DeepSeek通过对比特币趋势的精准捕捉(超过90%收益)展现强时序分析力,而Gemini和GPT5的亏损暴露了过度交易或风控缺陷,可能因其追求复杂策略导致。
3、市场影响
① 加速AI交易工具平民化:若开源模型持续验证有效性,散户可低成本获取机构级策略
② 催生新监管议题:无人值守AI的高频操作可能加剧市场波动,需建立熔断机制
③ 重构资管竞争格局:对冲基金或转向"LLM策略工厂"模式,通义、DeepSeek等技术方可能切入资管价值链
④ 风险警示:短期盈利不意味长期稳定性,加密市场高波动可能放大模型缺陷;且实盘测试未涵盖黑天鹅事件应对能力。
(以上内容不构成投资建议,不代表刊登平台观点,请独立判断和决策。)