六大AI模型被扔进加密市场厮杀,开启AI炒股的时代?

时间:2025-10-27 14:17:50

【事件导读】
①10月18日美国人工智能研究实验室nof1.ai举办活动,让六大主流大语言模型(LLM)各获得1万美元,在真实市场中进行交易;

②目前DeepSeek表现最佳,持仓总市值接近2.25万美元,收益率约125.32%;Qwen 3 Max次之,持仓总市值为2.07万美元;GPT 5垫底,持仓总市值为0.407万美元,亏损约59.3%。


10月18日开始
,美国人工智能研究实验室nof1.ai在其“Alpha Arena”(阿尔法竞技场)平台上举办了一场活动——给六个顶级模型一万美元的真金白银,让它们下场交易,而且并非模拟盘,真金白银地交易。

这六大模型分别为Anthropic的Claude 4.5 Sonnet、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。

截至2025年10月27日上午12:04分,"Alpha Arena"AI大模型实时投资比赛已进行至第9天。目前中国模型在比赛中保持显著领先优势,DeepSeek V3.1 Chat以125.32%的收益率位居榜首,Qwen3-Max以120.74%的收益率紧随其后,而美国模型如Gemini 2.5 ProGPT-5则分别亏损56.93%59.3%这一结果不仅展现了不同大模型在金融实战中的能力差异,也为AI金融应用提供了重要启示。

所有交易全程公开,收益率为唯一评判标准。所有的对话都在nof1.ai网站上公开可见。

规则称,比赛的目标是“将风险调整后的收益最大化”:“每个人工智能(AI)模型必须自行产生Alpha(超额收益)、确定仓位、择时交易并管理风险”。

系统会告诉AI模型当前的时间、账户信息、持仓情况,然后附上实时价格、指标等数据。 然后,要求模型做出决策:如果持有仓位,是继续持有还是平仓;如果空仓,是买入还是继续观望。

截至10月27日的最新数据(因10月27日上午12:04分),六大AI模型的交易表现如下:

数据来源:https://nof1.ai/


1、背景补充

本次实盘测试由美国AI实验室nof1.ai发起,首次将六大主流大模型(DeepSeek、Claude、Gemini、GPT5、Grok4、Qwen)置于真实加密市场环境。测试采用Hyperliquid交易所的永续合约,该平台以低延迟和高资金效率著称,而永续合约的杠杆特性放大了模型决策容错率低的挑战。实验设计强调"完全自主":模型需独立完成从数据分析、择时到风控的全流程,且所有决策日志实时公开,为AI金融应用提供了难得的透明案例。DeFAI(去中心化金融+AI)概念由此进入主流视野,Jump Trading等量化巨头此前已布局AI交易,但开源模型实战测试尚属首次。

2、影响分析

技术层面:结果验证了LLM在动态市场中的差异化能力。DeepSeek通过对比特币趋势的精准捕捉(超过90%收益)展现强时序分析力,而Gemini和GPT5的亏损暴露了过度交易或风控缺陷,可能因其追求复杂策略导致。

3、市场影响

① 加速AI交易工具平民化:若开源模型持续验证有效性,散户可低成本获取机构级策略

② 催生新监管议题:无人值守AI的高频操作可能加剧市场波动,需建立熔断机制

③ 重构资管竞争格局:对冲基金或转向"LLM策略工厂"模式,通义、DeepSeek等技术方可能切入资管价值链

④ 风险警示:短期盈利不意味长期稳定性,加密市场高波动可能放大模型缺陷;且实盘测试未涵盖黑天鹅事件应对能力。

(以上内容不构成投资建议,不代表刊登平台观点,请独立判断和决策。)