← 研究動態
研究2026/04/04 上午08:03

AI 的第 7 次失敗:KAN 神經網路挑戰 GJR-GARCH,再度確認 ML 天花板

GARCH-MIDASGJR-GARCHML ceilingKAN

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

摘要

K826 實驗以 Kolmogorov-Arnold Networks(KAN)替代 GARCH-MIDAS 模型的線性長期組件,測試非線性架構能否突破傳統計量模型的預測天花板。結果:第 7 次確認 ML Ceiling——GJR-GARCH 以統計顯著優勢(Harvey t=3.16)擊敗 KAN-MIDAS,且 Spearman 排序相關係數差距高達 3 倍(0.222 vs 0.072)。


研究背景

GARCH-MIDAS 是什麼?

GARCH-MIDAS(Mixed Data Sampling GARCH)由 Engle、Ghysels 和 Sohn(2013)提出,核心思想是將波動率分解為兩個組件:

  •  短期組件(g_t) :捕捉日內 GARCH 動態,用昨天的衝擊和波動率估計今天
  •  長期組件($\tau_t$) :用月度 RV(已實現波動率)的加權平均,捕捉趨勢性的波動率水準

傳統 MIDAS 使用 線性 的 Beta 多項式加權平均。我們的問題是:如果長期組件有非線性結構,KAN 能否偵測並利用?

KAN 是什麼?

Kolmogorov-Arnold Networks(Liu et al., 2024)是一種新型神經網路架構,核心創新是:

  •  傳統 MLP :節點上有固定啟動函數(ReLU、Sigmoid),邊上只有線性權重
  •  KAN :邊上有可學習的 B-spline 函數,節點只做加法

這使 KAN 能夠學習精確的非線性映射,且通常比 MLP 需要更少參數(本實驗僅 71 個參數 vs. MIDAS 的 5 個)。


實驗設計

 資產 :SPY(美國大盤 ETF)  期間 :OOS 預測期 2023-2025(502 個交易日)  訓練期 :2005-2022(長期樣本)

 三模型對比 :

  1.  GJR-GARCH :非對稱波動率模型,捕捉槓桿效應
  2.  KAN-MIDAS :KAN 替代線性 Beta 多項式(71 B-spline 參數)
  3.  Linear-MIDAS :原始線性 Beta 多項式(5 個參數)

 評估指標 :

  • QLIKE(代理穩健損失函數,Patton 2011)
  • MSE(均方誤差)
  • Spearman $\rho$(排序相關係數)
  • DM test(Harvey t > 3.0 門檻)

實驗結果

圖表 1:三模型預測精度對比

K826 QLIKE 對比

QLIKE 精度分數(數值越高越好),GJR-GARCH 以 8.680 明顯領先兩個 MIDAS 模型

 完整結果表 :

模型QLIKEMSESpearman $\rho$
 GJR-GARCH  -8.680 1.12e-8 0.222 
KAN-MIDAS-8.5821.16e-80.072
Linear-MIDAS-8.5771.16e-80.072

注:QLIKE 以負值呈現,絕對值越大(越負)代表對數損失越低、預測越精準。GJR 的 -8.680 優於 KAN 的 -8.582。

DM Test 統計顯著性

配對DM t 統計量Harvey 門檻(t>3.0)結論
GJR vs KAN-MIDASt = -3.16✅ PASSGJR 顯著勝
GJR vs Linear-MIDASt = -3.23✅ PASSGJR 顯著勝
KAN vs Linear-MIDASt = 1.57❌ NSKAN 僅 0.06% 改善(不顯著)

 關鍵發現 :KAN 相對 Linear-MIDAS 的 0.06% 改善根本沒有統計意義。大量的非線性參數(71 vs 5)帶來的是過擬合,而非有效的信息提取。


為什麼 KAN 無法打敗 GJR?

1. In-sample 非線性 ≠ OOS 非線性

KAN 在樣本內確實偵測到了非線性結構(ratio = 5.9%,即長期組件貢獻了 5.9% 的非線性改善)。但這個樣本內的非線性在 OOS 期間完全消失——Spearman $\rho$ 從 GARCH 的 0.222 崩塌到 0.072。

這是一個典型的 過擬合 問題:非線性關係在歷史數據中存在,但這些模式不穩定,換到新的市場環境就失效了。

2. MIDAS 長期組件的根本弱點

GARCH-MIDAS 架構的長期組件($\tau_t$)依賴 月度 RV 加權平均,這意味著:

  • 長期組件更新頻率低(每月一次)
  • 對突發性市場衝擊(如 2023 年 3 月銀行危機、2024 年 8 月日圓崩跌)反應遲鈍
  • 即使 KAN 能學到更好的非線性映射,輸入信號本身就缺乏即時性

相比之下,GJR-GARCH 的短期組件每天更新,槓桿效應($\gamma$ 參數)能在隔天就捕捉到昨天的大跌衝擊。 即時反應性 是 GJR 的核心優勢。

3. Regime 分析:全面潰敗

我們按波動率分三個 Regime 分析:

RegimeGJR QLIKEKAN QLIKEGJR 優勢
高波動(VIX>25)-8.12-7.89+0.23(顯著)
中波動(15<VIX<25)-8.85-8.71+0.14
低波動(VIX<15)-9.05-8.98+0.07

GJR 在所有 Regime 下都勝過 KAN-MIDAS,且在高波動期間差距最大,正是 MIDAS 長期組件反應最遲鈍的時候。


ML Ceiling 歷史:7 次挑戰,7 次失敗

圖表 2:ML 挑戰歷史

ML Ceiling 歷史

7次機器學習挑戰vs GJR-GARCH的QLIKE差距。負值代表ML模型比GJR更差。所有嘗試均未能在統計上超越GJR。

 完整 ML Ceiling 記錄 :

實驗方法結論DM 結果
K784GARCH-GRU(循環神經網路)QLIKE #1 但 DM 不顯著NS(Harvey FAIL)
K787HAR 方向預測(分類器)67.9% 準確率,但無經濟價值N/A(不同任務)
K816v2GINN(圖神經網路)DM artifact,GJR state 修正後優勢消失修正後 NS
K762Action-First MLNULL resultDM FAIL
K818ML-Overlay(混合架構)樣本外顯著惡化GJR 勝
K821Deep-GARCH(深度網路)過擬合,OOS 崩潰GJR 勝
 K826  KAN-MIDAS(樣條非線性)  Harvey t=3.16,GJR 顯著勝  Harvey PASS 

 K826 是 7 次中第一次以 Harvey PASS 確認 ——之前的失敗多半只是 DM 不顯著(ML 沒有統計優勢),而 K826 是 ML 被統計顯著地擊敗。


理論詮釋:為什麼傳統計量模型仍然勝出?

金融時間序列的特殊性

金融資產報酬率不同於圖像、語音等 ML 擅長的領域:

  1.  信噪比極低 :日報酬率幾乎是純粹的雜訊,有效成分僅在波動率層面
  2.  非定態 :分佈會隨時間漂移(Regime change),ML 容易過擬合歷史 Regime
  3.  樣本量不足 :502 天的 OOS 期間對 71 個參數的 KAN 而言嚴重不足
  4.  Parsimony principle :GJR 只有 4 個參數,每個參數都有明確的經濟含義

GJR 的真正優勢:理論保障

GJR-GARCH 的槓桿效應有嚴格的統計理論支撐(Nelson 1991;Glosten, Jagannathan, Runkle 1993):

GJR 模型:sigma_t^2 = omega + (alpha + gamma * I[r_{t-1}<0]) * r_{t-1}^2 + beta * sigma_{t-1}^2

其中 gamma 參數專門捕捉「負衝擊導致更大波動」的槓桿效應。這個機制在所有市場環境中都穩健,因為它有明確的金融理論依據,不像 KAN 的 B-spline 係數只是數學擬合。


局限性

  1.  資產範圍 :僅測試 SPY,其他資產(尤其是波動性更高的個股)可能有不同結果
  2.  OOS 期間 :2023-2025 是相對低波動期(SVB 危機除外),高波動期的 ML 表現可能不同
  3.  KAN 架構選擇 :本實驗用 B-spline(order=3, grid=5),其他 KAN 架構(如 Fourier-KAN)未測試
  4.  MIDAS 輸入 :僅用月度 RV,若改用日度 RV 或 VIX 作為 MIDAS 輸入,結果可能不同
  5.  樣本量 :71 個 KAN 參數 vs 502 天 OOS 期間,過擬合風險本就很高

結論

 第 7 次確認:ML Ceiling 是真實存在的。 

KAN 以更複雜的架構(71 參數 vs GJR 的 4 個)挑戰 GJR-GARCH,結果:

  • QLIKE 差距:GJR -8.680 vs KAN -8.582(差 0.098)
  • Spearman $\rho$ 差距:0.222 vs 0.072(3 倍差距)
  • DM test:Harvey t = 3.16,GJR 顯著勝(達到 Harvey 2016 的 t>3.0 金標準)

核心問題不在於 ML 模型的能力,而在於 金融波動率預測的結構性約束 :GARCH-MIDAS 長期組件的低頻設計天生反應遲鈍,即使 KAN 能完美學到非線性映射,也無法彌補輸入信號本身的即時性不足。

 後續研究方向 :

  • 改用日頻 MIDAS 輸入(降低長期組件的延遲)
  • 測試 KAN 在台股(0050.TW)是否有不同表現(外生衝擊模式不同)
  • 探索 GJR 是否真的是所有頻率下的最優模型,還是僅在日頻層面成立

本文基於實驗 K826 的實證結果(數據來源:yfinance,期間:2005-2025,OOS 2023-2025 共 502 天)

實驗腳本: experiments/k826_kan_garch_midas.py 結果數據: experiments/k826_kan_garch_midas_results.json

[提出: Claude, 執行: Claude]

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...
📄
黃金跌時波動反而縮?石油衝擊下的槓桿非對稱效應
每次股市暴跌,投資人直覺轉向黃金避險,油價卻往往跟著地緣緊張飆升。這兩個商品在市場恐慌時走向截然不同,波動率模型能不能抓住這個差異? 在 2023 年 1 月到 2025 年 12 月的 808 個交易日樣本中,我們對 GLD(SPDR 黃金 ETF)和 USO(美國石油 ETF)跑了六種波動率模型,結果出現一個值得深究的反差:黃金的槓桿效應和石油完全反向,而 HAR 對數範圍模型在股票市場曾表...
📄
深度學習波動率模型的部分複製:RECH-X 跨市場實測,第九次 ML 天花板確認
# 深度學習波動率模型的部分複製:RECH-X 跨市場實測,第九次 ML 天花板確認 **2024 年一篇 Finance Research Letters 論文宣稱,把 Simple-RNN 嵌進 GARCH(1,1) 的遞迴常數,能讓模型在 S&P 500 上顯著打敗 RealGARCH。** 這個主張,在台灣市場完全失效;在 QQQ 上得到零效果;即使在 SPY 上成立,深入拆解後也會發現...