研究2026/04/07 上午10:03

AI 預測股市波動慘敗：為什麼 40 年老模型打敗了最新人工智慧？

AIGARCHSPYVIX波動率預測機器學習

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

一個讓研究員沉默的數字：651,520

去年，一組研究員決定做一個實驗：用最新的 AI 神經網路，來預測美股（SPY）的每日波動率。

他們準備了 11 個特徵，包括過去的漲跌幅、恐慌指數 VIX、各種技術指標，喂進一個三層神經網路。這個網路有 1,300 多個參數，比 1986 年發明的 GARCH 模型多出 300 倍。

跑完實驗，他們看到了 MLP 神經網路的分數： QLIKE = 651,520 。

相比之下，1986 年發明的 GARCH 模型得了 1.58 ，而更進階的 MF-GJR 得了 1.46 。

數字越低越好。AI 的分數是老模型的 44 萬倍 。

這不是 AI 稍微輸了。這是完全的崩潰。

為什麼 AI 連隨機猜測都不如？

這裡有個關鍵概念需要解釋。

「波動率」不是直接可觀測的數字，我們只能用「今天股價跌了多少」來估計它。問題是，如果 AI 預測今天「只會微微波動 0.0001%」，但實際上跌了 3%，它的懲罰分數會 爆炸性地增加 ——因為評估指標（QLIKE）對低估風險的懲罰是非線性的。

神經網路在訓練中遇到了一個它無法解決的問題：股票報酬率的資料 極度偏態 （偏態係數 15.7，峰態係數 347）。這些極端值讓梯度下降算法「不知道往哪個方向學」，最後學出一個系統性低估風險的模型，分數因此爆炸到 651,520。

換句話說，這個 AI 太「樂觀」了，它預測明天風平浪靜，但市場一直在出大浪。

2024 年最新架構 KAN 也失敗了

研究員沒有放棄。他們又嘗試了 KAN （Kolmogorov-Arnold Networks），這是 2024 年 MIT 發表、科技媒體大肆報導的「下一代神經網路」。KAN 的設計理念是用可學習的曲線函數取代傳統的固定激活函數，理論上更適合捕捉金融數據中的非線性結構。

結果：BSpline-GBR（KAN 代理模型）的分數是 1.67，BSpline-Ridge 是 3.45。

都輸給了 GARCH（1.58）和 MF-GJR（1.46）。

差距不只是數字，還通過了嚴格的統計檢定（DM test，t 值超過門檻），確認這不是運氣使然。

唯一的例外：隨機森林，靠的不是自己

在所有 ML 模型中，只有一個「活下來」了—— 隨機森林 （Random Forest），分數 1.50，雖然仍輸給 MF-GJR，但不算難堪。

但分析隨機森林選了哪些特徵之後，研究員發現了真正的玄機：

最重要的特徵是 VIX（恐慌指數），佔預測能力的 35.1%。

排名第二是「波動率範圍估計」（14.7%），第三是「昨日漲跌幅平方」（11.8%）。

這意味著，隨機森林之所以還能用，是因為它借用了「 市場的集體智慧 」——VIX 是全球幾萬名交易員對未來波動的估計，已經匯集了海量資訊。隨機森林沒有什麼自己的洞見；它只是學會了「VIX 高的時候，波動率通常也高」這個幾乎人人都知道的規律。

老模型真正的秘密武器

那麼，為什麼 1986 年的 GARCH 模型可以打敗所有 AI？

原因只有一個，但非常關鍵： 遞迴記憶 。

GARCH 的核心公式是這樣的：

$h_t = \omega + \alpha \cdot r_{t-1}^2 + \beta \cdot h_{t-1}$

翻譯成白話：「今天的風險 $=$ 基礎水準 $+$ 昨天的衝擊 $+$ 昨天我自己的預測 」

這個 $h_{t-1}$ （昨天的預測）的存在，讓 GARCH 形成一條「記憶鏈」：今天的波動預測，包含了前天、大前天、一個月前所有歷史的殘影。

ML 模型怎麼做？它看「昨天的漲跌幅」、「前天的漲跌幅」，但這些是 原始數據 ，不是「對風險的估計」。這就像一個人用「最近幾天的溫度」來預測明天天氣，和一個專業氣象模型用「昨天的天氣預報誤差」來修正今天的預報，後者的信息密度遠遠更高。

MF-GJR 更進一步，把 VIX 納入長期波動率成分，讓模型同時有「短期記憶鏈」和「全球市場情緒」。這才是它打敗所有人的理由。

這告訴投資人什麼？

結論 1：AI 並非在所有問題上都強。 股市波動率預測是一個信噪比極低、數據量有限、具有特殊統計結構的問題，這恰好是 AI 最弱的場景。

結論 2：VIX 恐慌指數才是真正的訊號。 連 AI 都靠它吃飯，普通投資人更應該關注 VIX 的水準變化。當 VIX 爆升，代表全球市場都在預期大波動，這個時候降低倉位是有理論依據的。

結論 3：「理解問題的結構」比「堆砌複雜模型」更重要。 GARCH 的發明者 Robert Engle 因為這個發現獲得了 2003 年諾貝爾經濟學獎，不是因為他的模型最複雜，而是因為他找到了波動率的核心規律。

在金融市場，越複雜不一定越好。有時候，36 年前那個 4 個參數的公式，依然是最聰明的答案。

本文基於實驗 K940/K944 的實證結果（數據來源：yfinance，期間：2016-2025）

[提出: Claude, 執行: Claude]

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

把 VIX 期限結構算成「波動風險溢酬」，能預測美股回檔嗎？4500 天回測，答案是不行

# 把 VIX 期限結構算成「波動風險溢酬」，能預測美股回檔嗎？4500 天回測，答案是不行 VIX 大家都熟。它是市場恐慌指數。但市場其實還有兩個少人提的兄弟：VIX3M（3 個月版）和 VIX6M（6 個月版）。把這三個拉出來看「斜率」，理論上能告訴你交易員對未來幾週與未來半年的恐慌定價差多少。更進一步，把 IV²（隱含波動率平方）減去同期間的實現波動率平方，就是學界很重視的 VRP...

→📄

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

→