← 研究動態
研究2026/06/26 上午11:00

深度學習波動率模型的部分複製:RECH-X 跨市場實測,第九次 ML 天花板確認

volatility-forecastingGARCHmachine-learningreplicationrealized-variancecross-marketdeep-learning

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

深度學習波動率模型的部分複製:RECH-X 跨市場實測,第九次 ML 天花板確認

 2024 年一篇 Finance Research Letters 論文宣稱,把 Simple-RNN 嵌進 GARCH(1,1) 的遞迴常數,能讓模型在 S&P 500 上顯著打敗 RealGARCH。  這個主張,在台灣市場完全失效;在 QQQ 上得到零效果;即使在 SPY 上成立,深入拆解後也會發現,功勞屬於 realized variance covariate,不屬於 RNN 本身。

這是本平台第九次測試「ML 能否打敗簡單 GARCH 家族」,結論與前八次一致:找不到。


被測試的論文與模型

Nguyen, Nguyen & Tran (2024) 在 Finance Research Letters 69:106145 提出 RECH-X(Recurrent Conditional Heteroskedasticity with eXogenous covariates)。

模型結構用一句話說:把 GARCH(1,1) 的常數項 ω 換成隨時間變化的 ω_t,由一個 Simple-RNN 負責在每一步更新這個值,RNN 的輸入包含前一期的 realized variance(RV):

σ²_t  = ω_t + α·ε²_{t-1} + β·σ²_{t-1}
ω_t   = β₀ + β₁·h_t
h_t   = ReLU(v·x_{t-1} + w_h·h_{t-1} + b)
x_{t-1} = [ω_{t-1}, ε_{t-1}, σ²_{t-1}, RV_{t-1}]

論文的核心主張(Table 3,原文 MSE 數字):在 S&P 500 的 MSE 上,RECH-X 比 RealGARCH 低了約五分之一,五項預測指標全面勝出。


測試設計

 市場 :US_SPY(n_oos=479,2007-2024)、US_QQQ(n_oos=479,2007-2024)、台指期 TW_TX(n_oos=320,2017-2021)。

 評估 :Patton QLIKE(lower is better)+ DM-HLN Harvey 小樣本修正,顯著門檻 |t|>3。預先指定的天花板基準(ceiling baseline)為 GJR(1,1),在本計畫首輪設計時就鎖定,不做事後選擇。

 Lookahead 控制 :covariate 一律以 z_{t-1} 進入(lag 一期),OOS 採擴展窗口,每 10 天 refit 一次,fixed seed 1533。全部 RNG 固定,RNN 每個首窗口 ≥12 個隨機初值 multistart。

 保真度缺口(fidelity gaps,先列在此) :

  1. 美股 realized variance 用 Garman-Klass 日頻 proxy(OHLC);論文用 Oxford-Man Institute 5 分鐘 RV,信號雜訊比差很多。這個缺口 偏向不利 RECH-X ,美股薄弱的勝出是保守估計。
  2. 估計方法用 MLE;論文用 Bayesian 似然退火 SMC。
  3. H=22 重疊窗口的 HAC 用 h-1 lag Bartlett,有效樣本相對少,此水平顯著性要打折。
  4. 台灣 RV 是真正 5 分鐘高頻 RV,但只有日盤(不含夜盤),樣本限 2017-2021 四年。

三市場結果

下表整理三個市場、三個預測期 QLIKE,以及 RECH-X 對各基準的 DM-HLN t 統計量(負值代表 RECH-X 損失較低;|t|>3 才算顯著)。

 QLIKE(H=1,越低越好) 

市場RECH-XGARCH-XRealGARCHGJR(1,1)
US_SPY0.3570.3790.3790.378
US_QQQ0.3290.3360.3280.348
TW_TX0.4030.4180.452 0.296 

 DM-HLN t-stat vs RealGARCH(負 = RECH-X 較好;|t|>3 = 顯著) 

市場H=1H=5H=22
US_SPY-1.4 -4.8  ✓ -4.3  ✓
US_QQQ+0.1-2.6-1.8
TW_TX-1.1-0.7+0.6

 DM-HLN t-stat vs GJR(1,1) pre-specified(負 = RECH-X 較好) 

市場H=1H=5H=22
US_SPY-1.6-2.3-2.2
US_QQQ-1.7-1.9-0.5
TW_TX +8.4  ✗ +3.1  ✗+1.4

 三市場 verdict :US_SPY 為 REPLICATED(H≥5 vs RealGARCH);US_QQQ 為 NULL;TW_TX 為 NULL,且 vs GJR 在 H=1 的 DM=+8.4 代表 GJR 顯著優於 RECH-X。

RECH-X vs RealGARCH DM 檢定 heatmap(三市場 × 三 horizon)


逐市場解析

US_SPY:部分複製

US_SPY QLIKE by horizon

H=5 和 H=22 的 DM t 分別是 -4.8 和 -4.3,雙雙超過 |t|>3 門檻,RECH-X 確實打敗 RealGARCH,重現了論文的主張。

但 H=1 的 DM 只有 -1.4(p=0.165),在最基本的單日預測上,兩模型沒有顯著差異。論文的 Table 3 是 1-day ahead 的比較,這裡打成平手。用 Garman-Klass proxy 作為 realized measure 原本是不利 RECH-X 的(信號比論文的 5 分鐘 RV 差很多),所以 H≥5 的薄弱優勢如果是真的,只是保守下限。

重要的是,RECH-X 對 GJR(1,1) 的 DM 在三個 horizon 都不到 -2.3,從未顯著打敗一個連 realized variance 都不用的簡單非對稱 GARCH。

US_QQQ:零效果

US_QQQ QLIKE by horizon

QQQ 的 H=1 DM 是 +0.1,數字上 RealGARCH 反而略好;H=5 和 H=22 雖然 RECH-X 均值較低,DM 分別是 -2.6 和 -1.8,都不過 |t|>3 門檻。三個 horizon 全無顯著差異,verdict = NULL。

值得注意:QQQ 的 H=1 RECH-X QLIKE(0.329)比 RealGARCH(0.328)還略高。同樣有 RV covariate、加上 RNN 的模型,在這市場反而輸掉數值最小的 1-day。

TW_TX:倒過來輸

TW_TX QLIKE by horizon

台指期的情況最清楚。TW_TX 用的是真正 5 分鐘高頻 RV(日盤加總),三個市場裡保真度最高、covariate 信號最強。然而 RECH-X(QLIKE=0.403)不只輸給 RealGARCH(0.452 vs 0.403 差不多,DM=-1.1 未顯著),還輸給根本不用 RV 的 GJR(1,1)(0.296 vs 0.403,DM=+8.4)。

GJR(1,1) 的 DM=+8.4(H=1)是這整個分析裡最大的單一信號:在有真實高頻 RV 的市場上,一個只靠前一期報酬正負不對稱就能跑的簡單模型,打出接近 4 倍 Harvey 臨界值的分數。


拆解:RV covariate 的功勞,不是 RNN

設計了一個比較直接的測試:RECH-X vs GARCH-X。後者把同一個 RV_{t-1} 作為線性附加項加進 GARCH(1,1) 的方差方程,沒有 RNN。如果 RECH-X 的優勢來自深度學習的遞迴,RECH-X 應該系統性打贏 GARCH-X;如果來自 RV covariate,兩者應該差不多。

結果: H=1 和 H=5,三個市場的 RECH-X vs GARCH-X DM 統計量,全部低於 |t|=3 ,其中最大的 TW_TX H=1 只有 -2.68,仍未達顯著。只有 H=22(三市場 DM 各 -3.3、-4.3、-3.0)RECH-X 在數字上勝出。

22 天預測期的勝出,背後是重疊窗口的 HAC 計算,有效樣本有限,結論需要保留。短期(1-5 天)的結論就很清楚:RNN 遞迴結構沒有貢獻,把 RV 線性放進去就能拿到幾乎一樣的 QLIKE。


第九次 ML 天花板

本計畫的 ML-ceiling 系列到目前為止:

  • K1312 LSTM-GARCH(SPY):QLIKE 比 GJR 差 99.4%,NULL
  • K1263 KAN-GARCH-MIDAS:比簡單 GARCH 差 24-33%,NULL
  • K816v2 GINN:NULL
  • K784 GARCH-GRU:NULL
  • K1533 RECH-X:vs RealGARCH 在 SPY H≥5 成立,但 vs GJR 全部不過,TW_TX 反而輸。PARTIAL REPLICATION,第 9 次 ML-ceiling 確認。

RECH-X 的設計比 K1312 精細很多。作者很刻意不把整個 GARCH 換成 RNN,只讓 RNN 驅動常數項;這個選擇在理論上保留了 GARCH 的平穩性和可解釋性。但對手是同樣有 RV covariate 的線性 GARCH-X 時,遞迴結構提供的邊際效益,在 H=1 和 H=5 的三個市場裡統一消失。在保真度最高的台灣市場,GJR(1,1) 以 DM=8.4 把答案說得很清楚。

這個結果本身不是否定深度學習在金融時序的所有可能性。它的邊界是:在有 RV covariate 可用的情況下,把 covariate 線性接進 GARCH,已經拿到了大部分可拿的預測增益;額外加一層 Simple-RNN,在日頻至週頻預測上沒有再增加什麼。


Fidelity 限制摘要

限制方向結論可信度
US 用 GK proxy 非 5-min RV偏向不利 RECH-XUS 薄弱勝出是保守
MLE 非 SMC中性(well-identified 下 MLE≈SMC posterior mean)低影響
H=22 HAC 重疊窗口有效樣本少H=22 結論弱
TW 日盤 only,2017-2021樣本短、缺夜盤TW NULL 結論穩固

實驗詳情、原始統計量與程式碼在 experiments/k1533/,與 k1533_results.json 完整對應。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

深度學習波動率模型的部分複製:RECH-X 跨市場實測,第九次 ML 天花板確認 | VolPred