Grok 4.20 炒股封神:2周1万美元变1.2万,12%回报率碾压GPT-5.1与 Gemini 3.0

AI行业资讯7小时前更新 墨白
12.6K 0 0

近期,由量化平台 nof1.ai 主办的 Alpha Arena 1.5 赛季公布最终结果:xAI 旗下代号为 Grok4.20 的实验模型以14个交易日内实现 +12.11% 的收益率夺冠,其初始1万美元资金增值至12,193美元,成为本次竞赛中唯一获得正收益的大型语言模型。同期,GPT-51 与 Gemini3.0 分别出现3.4% 与5.7% 的亏损。

“地狱模式”考验:全程零人工干预

比赛规则严禁任何人工干预操作,各模型需在“苦行僧模式”(严格杠杆限制)与“情景感知模式”(可实时获取对手持仓)之间自主切换。Grok4.20 在情景感知回合中提前两小时建立了 Palantir(PLTR)的10倍杠杆多头仓位,当日散户情绪指数上涨38%,收盘时该笔交易获利11.4%,被赛事主办方评价为“情绪套利的范例”。

实时X平台数据流构筑关键优势

据主办方透露,Grok4.20 可毫秒级调用 X(原 Twitter)的全量数据流,日均处理约6800万条英文推文,并借助内置情绪-量价模型生成1-5分钟级别的短期交易信号。相比之下,GPT-51 仅能获取延迟15分钟的新闻摘要,Gemini3.0 则主要依赖财报与美国证券交易委员会文件,信息更新滞后至少30分钟以上。

马斯克公开点赞,Grok5已在规划中

xAI 创始人马斯克在赛后发帖称:“Grok 懂得感知市场情绪。4.20 → 5.0 🚀”,暗示下一代 Grok5 模型将把当前的情绪分析引擎升级为覆盖“市场-社群-宏观”的多维框架。市场消息显示,xAI 计划在2025年第一季度推出面向机构客户的“Grok Trader API”,年费预计达50万美元,目前已有超过20家对冲基金表达了合作意向。

行业警示:传统量化优势面临挑战

nof1.ai 首席执行官指出,本次比赛旨在探索“大语言模型直接执行交易”的可行性,结果证明情绪数据与强化学习的结合能够产生超额收益。“当模型能在两小时内理解散户的 Meme 情绪,传统量化基金在高频交易中的优势可能被削弱。”但他也强调,单一赛季的成功并不代表策略具备长期稳健性,未来赛季将引入 T+0 双向交易、期权及加密货币等复杂品种,以进一步考验模型的适应能力。

行业风向:AI交易进入“实时情绪驱动”时代

此次对决被视为大语言模型在金融实盘场景中的首次公开较量。Grok4.20 的胜出表明,社交媒体实时数据流与大模型推理能力的结合,可能成为下一代量化交易的重要方向,也凸显出数据时效性在某些场景下比模型参数量更为关键。随着更多开源情绪模型的涌现,散户与机构之间的信息不对称格局或将进一步被打破。

© 版权声明

相关文章