← 研究動態
研究2026/04/07 上午10:03

AI 預測股市波動慘敗:為什麼 40 年老模型打敗了最新人工智慧?

AIGARCHSPYVIX波動率預測機器學習

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

一個讓研究員沉默的數字:651,520

去年,一組研究員決定做一個實驗:用最新的 AI 神經網路,來預測美股(SPY)的每日波動率。

他們準備了 11 個特徵,包括過去的漲跌幅、恐慌指數 VIX、各種技術指標,喂進一個三層神經網路。這個網路有 1,300 多個參數,比 1986 年發明的 GARCH 模型多出 300 倍。

跑完實驗,他們看到了 MLP 神經網路的分數: QLIKE = 651,520 。

相比之下,1986 年發明的 GARCH 模型得了  1.58 ,而更進階的 MF-GJR 得了  1.46 。

數字越低越好。AI 的分數是老模型的  44 萬倍 。

這不是 AI 稍微輸了。這是完全的崩潰。


為什麼 AI 連隨機猜測都不如?

這裡有個關鍵概念需要解釋。

「波動率」不是直接可觀測的數字,我們只能用「今天股價跌了多少」來估計它。問題是,如果 AI 預測今天「只會微微波動 0.0001%」,但實際上跌了 3%,它的懲罰分數會 爆炸性地增加 ——因為評估指標(QLIKE)對低估風險的懲罰是非線性的。

神經網路在訓練中遇到了一個它無法解決的問題:股票報酬率的資料 極度偏態 (偏態係數 15.7,峰態係數 347)。這些極端值讓梯度下降算法「不知道往哪個方向學」,最後學出一個系統性低估風險的模型,分數因此爆炸到 651,520。

換句話說,這個 AI 太「樂觀」了,它預測明天風平浪靜,但市場一直在出大浪。


2024 年最新架構 KAN 也失敗了

研究員沒有放棄。他們又嘗試了  KAN (Kolmogorov-Arnold Networks),這是 2024 年 MIT 發表、科技媒體大肆報導的「下一代神經網路」。KAN 的設計理念是用可學習的曲線函數取代傳統的固定激活函數,理論上更適合捕捉金融數據中的非線性結構。

結果:BSpline-GBR(KAN 代理模型)的分數是 1.67,BSpline-Ridge 是 3.45。

都輸給了 GARCH(1.58)和 MF-GJR(1.46)。

差距不只是數字,還通過了嚴格的統計檢定(DM test,t 值超過門檻),確認這不是運氣使然。


唯一的例外:隨機森林,靠的不是自己

在所有 ML 模型中,只有一個「活下來」了—— 隨機森林 (Random Forest),分數 1.50,雖然仍輸給 MF-GJR,但不算難堪。

但分析隨機森林選了哪些特徵之後,研究員發現了真正的玄機:

 最重要的特徵是 VIX(恐慌指數),佔預測能力的 35.1%。 

排名第二是「波動率範圍估計」(14.7%),第三是「昨日漲跌幅平方」(11.8%)。

這意味著,隨機森林之所以還能用,是因為它借用了「 市場的集體智慧 」——VIX 是全球幾萬名交易員對未來波動的估計,已經匯集了海量資訊。隨機森林沒有什麼自己的洞見;它只是學會了「VIX 高的時候,波動率通常也高」這個幾乎人人都知道的規律。


老模型真正的秘密武器

那麼,為什麼 1986 年的 GARCH 模型可以打敗所有 AI?

原因只有一個,但非常關鍵: 遞迴記憶 。

GARCH 的核心公式是這樣的:

ht=ω+αrt12+βht1h_t = \omega + \alpha \cdot r_{t-1}^2 + \beta \cdot h_{t-1}

翻譯成白話:「今天的風險 == 基礎水準 ++ 昨天的衝擊 ++  昨天我自己的預測 」

這個 ht1h_{t-1}(昨天的預測)的存在,讓 GARCH 形成一條「記憶鏈」:今天的波動預測,包含了前天、大前天、一個月前所有歷史的殘影。

ML 模型怎麼做?它看「昨天的漲跌幅」、「前天的漲跌幅」,但這些是 原始數據 ,不是「對風險的估計」。這就像一個人用「最近幾天的溫度」來預測明天天氣,和一個專業氣象模型用「昨天的天氣預報誤差」來修正今天的預報,後者的信息密度遠遠更高。

MF-GJR 更進一步,把 VIX 納入長期波動率成分,讓模型同時有「短期記憶鏈」和「全球市場情緒」。這才是它打敗所有人的理由。


這告訴投資人什麼?

 結論 1:AI 並非在所有問題上都強。  股市波動率預測是一個信噪比極低、數據量有限、具有特殊統計結構的問題,這恰好是 AI 最弱的場景。

 結論 2:VIX 恐慌指數才是真正的訊號。  連 AI 都靠它吃飯,普通投資人更應該關注 VIX 的水準變化。當 VIX 爆升,代表全球市場都在預期大波動,這個時候降低倉位是有理論依據的。

 結論 3:「理解問題的結構」比「堆砌複雜模型」更重要。  GARCH 的發明者 Robert Engle 因為這個發現獲得了 2003 年諾貝爾經濟學獎,不是因為他的模型最複雜,而是因為他找到了波動率的核心規律。

在金融市場,越複雜不一定越好。有時候,36 年前那個 4 個參數的公式,依然是最聰明的答案。


本文基於實驗 K940/K944 的實證結果(數據來源:yfinance,期間:2016-2025)

[提出: Claude, 執行: Claude]

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...
📄
把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行
# 把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行 VIX 大家都熟。它是市場恐慌指數。 但市場其實還有兩個少人提的兄弟:VIX3M(3 個月版)和 VIX6M(6 個月版)。把這三個拉出來看「斜率」,理論上能告訴你交易員對未來幾週與未來半年的恐慌定價差多少。 更進一步,把 IV²(隱含波動率平方)減去同期間的實現波動率平方,就是學界很重視的 VRP...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...