AI 炒股到底靠不靠谱——从 Alpha Arena 看大模型的能力边界
## Alpha Arena 简介
Alpha Arena 是近来讨论度很高的 AI 交易比赛。六大主流大模型(Qwen、DeepSeek、GPT、Gemini、Claude、Grok)各拿 1 万美元,在同一个交易所、同样的数据和提示词下自主做短线交易。近期官方又开启了 1.5 赛季,更贴近我们平时炒股的节奏:把战场从加密市场搬到了美股(纳斯达克科技股),规则更复杂,引入新闻和情绪,参赛选手也更多,关注度再次升高。
这个比赛的有趣点在于:模型没有任何人为干预,全靠自己理解行情、解读数据、管理仓位、控制风险。换句话说,它更像是在测试“大模型能否用自己的理解,在真实市场里活下来”。
随着比赛火起来,也出现了一些开源工具,把 Alpha Arena 的流程简单复刻:喂给模型数据,让它自己给出买卖点。于是一个问题自然就冒出来了:我们是不是现在就能跟着大模型炒股了?
本文想结合这个问题,看看:
- 大模型现在到底能做到哪一步?
- 哪些环节它很强?哪些地方暂时解决不了,为什么?
- 在现阶段,我们能采用的相对“最优”的使用方式是什么?
提示词
和其它调用大模型的任务一样,在不做微调的前提下,提示词就是核心设计。从大家反推 Alpha Arena 的提示词可以看出,大致包含两类内容:
- 硬规则:止损、止盈、持仓上限、仓位梯度等,这些用传统程序实现更精确,也完全可以脱离大模型。
- 情境判断:比如选股、买卖时点,这部分靠大模型的推理和语言理解更有优势,它的输入又分成“能量化的技术指标”(RSI、KDJ、布林带等)和“难完全量化的信号”(情绪、新闻、突发事件的理解)。
如果真有一套规则能把所有信息量化,那还需要模型来决策吗?其实,大模型不是只靠量化指标做判断,它本身还隐含了一些策略逻辑。在 Alpha Arena 中,无需自行编写策略,默认的大模型已经掌握了一些策略。只需提供数据,即可触发相应的策略。
策略
策略写法上有两派:把所有规则(如止损、止盈、买入卖出触发条件)塞进一个复杂策略,或者写一组模块化策略逐一代入。前者表面上统一,但复杂性提升后,调试和排错都很困难;后者更利于测试、演进和替换,也是多数实战团队常用的方法。
策略的真正难点不在写 if/else,现今多数编程辅助工具就能做得很好,而难在当同一市场状态代入多策略后该如何选择:什么时候用哪一套规则、并行策略如何排序、冲突时选谁、参数如何调优——这些其实是个典型的机器学习/优化问题。实战里常见解法有元控制器(meta controller)、mixture-of-experts 或基于回测/贝叶斯优化的策略组合权重选择。在这方面,通常需要真实市场的数据来训练调优,需要投入大量高保真仿真、离线 RL 训练并加入真实交易摩擦,这成本和风险都不低。
目前最优方式
综上,量代交易大致可以拆成三块:量化问题、策略实现、决策冲突处理。前两者大模型确实能帮上忙,但第三块——决策冲突——目前仍是难点,往往需要更细的任务数据去调优。
精调大模型本身就不轻松:它用文本来处理计算与推理,天然增加了复杂度;而股价的波动又深受国家、文化、经济周期与事件影响,数据范围很难划定,训练成本也不低。
在我看来,更现实的做法是:把大模型当成因子抽取器,用它来辅助设计策略,而别让它负责整个决策流程。如果要追求收益,更适合在明确的市场上,用实际盈利目标来训练强化学习模型,比起大模型精调,更容易看到效果。
短期来看,大模型更像一个“聪明助手”,而不是那个“包揽一切的经理人”。
