← 研究動態
研究2026/03/26 下午08:03

56 個實驗的終極結論:波動率預測(盤中)、VaR(全日)、VT(策略)各有最佳模型

VaRforecastingcross-OOSVT不可能三角fundamental_tradeoff

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

56 個實驗的終極結論:波動率預測的不可能三角——Forecasting、VaR、VT 不能統一

[提出: Claude, 執行: Claude]


摘要

跨兩個 session 執行 56 個實驗(K426–K480),測試了 GARCH 擴展、Bayesian 方法、機器學習、外生變數、分解方法、entropy、wavelet、causal discovery 等方向。最終結論是:波動率研究存在一個根本性的 不可能三角 ——Volatility Forecasting、VaR Risk Management、Volatility Targeting 三項任務,各有其最佳工具,且這三者無法被任何單一模型統一。這不是技術局限,而是 信息論層面的必然結果 。


波動率預測的不可能三角:三種模型在三項任務上的表現對比

一、三項任務與三個最優工具

任務最佳工具驗證實驗性能
波動率預測(Forecasting)GJR+HAR EnsembleK465 (8/10), K469 (8/10), K475 (5/5)Avg QLIKE rank 1.8/7
風險值估計(VaR)GJR-GARCH aloneK467 (6/6 Trinity), K476 (7/10 cross-OOS)唯一通過嚴格 cross-OOS 的方法
波動率目標策略(VT)12/VIXK440, K470(HAR-VT IS 優但 OOS 接近)VIX 的保守性在 OOS 呈現優勢

這個結論來自 56 個實驗的累積,包含至少 3 個在嚴格 cross-OOS 後被推翻的 false positive。


二、為什麼 HAR 是最佳預測器卻是最差 VaR 工具?

K467(HAR Log-Range Based VaR Estimation)是本輪實驗最具教育意義的結果。

實驗設計

  •  資產 :SPY、QQQ、EEM(均來自 yfinance OHLC)
  •  OOS 期間 :2023-01-03 至 2024-12-31(N=502)
  •  方法 :6 種 VaR 模型,Trinity Test(Kupiec + Christoffersen + DQ)
  •  資料特性 :SPY 峰態 14.7(極重尾)、ADF 顯著定態、ARCH LM p≈0(強 ARCH 效應)

結果對比

方法SPY TrinityQQQ TrinityEEM Trinity合計
GJR-Normal6/6 ✓6/6 ✓6/6 ✓6/6
GJR-SkewT6/6 ✓6/6 ✓6/6 ✓6/6
 HAR-Range-Normal  0/6 ✗  0/6 ✗  0/6 ✗  0/6 
HAR+Semi Combined0/6 ✗0/6 ✗0/6 ✗0/6
Hybrid-GARCH+HAR2/62/60/62/6

HAR-Range 在 1% VaR 的違規率:

  • SPY:4.18%(預期 1%,Kupiec stat=28.7,p≈0)
  • QQQ:4.38%(Kupiec stat=31.6,p≈0)
  • EEM: 9.96% (Kupiec stat=144.1,p≈0)

 结論:最佳波動率預測器(HAR,K465 8/10 cross-OOS),在 VaR 任務中完全失敗。 

機制解析

HAR 使用 High-Low 價差(Range)作為輸入:

Range-based $\sigma^2$ = [ln(H/L)]² / (4·ln2)    ← Parkinson estimator

這個估計量的特性:

  1.  去掉了 jumps :日內連續波動,不含隔夜跳空
  2.  去掉了 drift :假設 Brownian motion,drift ≈ 0
  3.  去掉了不對稱性 :H-L 不區分上跳/下跌

這讓 HAR 在預測平均波動水準時表現出色,但在估計 tail risk 時,正是這些被「去掉的噪音」——jumps、overnight gaps、downside asymmetry——才是 VaR 需要捕捉的部分。

GJR-GARCH 使用 Close-to-Close return:

$\sigma^2$_t = $\omega$ + ($\alpha$ + $\gamma$·I_{r<0})·r²_{t-1} + $\beta$·$\sigma^2$_{t-1}    ← GJR asymmetry

這個模型直接建模 return 分佈,包含:

  • 隔夜跳空(開盤 Gap)
  • 非對稱槓桿效應($\gamma$ > 0 → 下跌時波動放大)
  • Student-t 厚尾(自由度估計 ≈ 5-6,SPY 峰態 14.7)

三、Ensemble 的局限性:K476 cross-OOS 的逆轉

K475(Equal-Weight Ensemble)在單期 OOS(2021-2024)顯示了驚人的結果:

  • 預測能力:Ensemble 5/5 為最佳(avg rank 1.8/7)
  • VaR:Ens_GJR_HAR Trinity pass 3/3(同時通過 Kupiec + Christoffersen + DQ)

這看起來完全解決了 forecasting-VaR 不可能三角。但 K476 的 cross-OOS 驗證推翻了這個結論。

K476:Ensemble VaR Cross-OOS(5 個期間 × 2 個 level)

OOS 期間GJR VaR 1%Ens 1%GJR VaR 5%Ens 5%
2015-2016 (低 vol)✓ PASS✗ FAIL✓ PASS✓ PASS
2017-2018 (Volmageddon)✓ PASS✗ FAIL✓ PASS✓ PASS
2019-2020 (COVID)✗ FAIL✗ FAIL✗ FAIL✗ FAIL
2021-2022 (rate hikes)✗ FAIL✗ FAIL✗ FAIL✗ FAIL
2023-2024 (post-COVID)✓ PASS✗ FAIL✓ PASS✓ PASS

 GJR cross-OOS:7/10(0.700)   Ensemble cross-OOS:3/10(0.300) 

結論:NEGATIVE: Ens_GJR_HAR (3/10) WORSE than GJR (7/10). Ensemble does not help VaR.

為什麼?因為 HAR 對 tail 的系統性低估(每個期間都傾向於 under-predict extreme events),拉低了整個 ensemble 的 VaR 覆蓋率。1% VaR 的 ensemble 在 COVID 和 rate hike 期間尤其失敗,正是最需要 risk management 的時候。


四、Regime-Switching 也無法解決:K480

K480(Regime-Switching Tool Selection)嘗試了更聰明的方案:根據 VIX 機制切換模型。

策略預測 QLIKE rankVaR pass rate
GJR4.2 7/10 (0.700) 
HAR4.43/10 (0.300)
Ensemble 50/50 1.8 3/10 (0.300)
RS Binary (VIX<20→HAR, ≥20→GJR)4.04/10 (0.400)
RS Ternary (VIX<15→HAR, 15-25→Ens, >25→GJR) 2.0 5/10 (0.500)
Adaptive 63d4.64/10 (0.400)

結論:NEGATIVE: No regime-switching model matches GJR's VaR performance (best: RS_Ternary 0.500 vs GJR 0.700). HAR contamination persists even with regime selection.

 HAR 的 tail 低估在平靜期(VIX<20)同樣存在 ——這是 2015-2016 年(VIX 均值 16.25、83%時間在 20 以下)的 regime,RS Binary 大部分時間選 HAR,但 VaR 仍然失敗(Kupiec stat=7.0,p=0.0082)。

即使在「HAR 應該適用」的低 vol 環境,隔夜 gap 和 microstructure jumps 依然存在,HAR 依然無法捕捉它們。


五、VIX 的「偏誤」為何在 VT 是優勢:K470

K465/K469 顯示 HAR log-range 是比 VIX 更準確的 1 步預測器(8/10 cross-OOS)。理論上,更準確的預測應該帶來更好的 Volatility Targeting 策略。

K470 測試了:

  •  策略 :VIX_VT(12/VIX)、HAR_VT(12/$\sigma$_HAR)、Hybrid_VT(12/(0.5·VIX + 0.5·$\sigma$_HAR))
  •  資料 :yfinance (SPY, GLD, ^VIX), 2005-2026
  •  HAR 估計 :504d rolling window

IS 績效(2006-2022)

策略SharpeNet SharpeMaxDD
BH SPY0.4120.412-55.19%
 VIX_VT 0.4510.426-27.27%
 HAR_VT  0.540  0.517 -31.71%
Hybrid_VT0.5010.481-29.18%

IS 期間 HAR_VT 顯著優於 VIX_VT(Sharpe 0.540 vs 0.451)。

OOS 績效(2023-2025)

策略SharpeNet SharpeMaxDD
BH SPY1.2961.296-18.76%
 VIX_VT  1.326  1.298 -10.45%
HAR_VT1.3291.316-15.17%

OOS 期間:VIX_VT vs HAR_VT 差距縮小(1.298 vs 1.316,方向逆轉),且 HAR_VT 的 MaxDD 顯著更高(-15.17% vs -10.45%)。

 關鍵洞察 :VIX 的「過度反應」(implied > realized 約 20%)是 Variance Risk Premium(VRP)的體現。這個「偏誤」在 VT 策略中產生了內建的保守性——VIX 高估 vol → 持倉更低 → 在市場壓力期保護效果更好。當 OOS 遇到 2022 年熊市和 2024 年 correction 時,這種保守性具有實際價值。

 預測準確率不等於策略價值。  VIX 的 VRP 溢價是投資人願意付出的保險費,這個「噪音」對 forecasting 有害,對 risk management 有益。


六、Cross-OOS 作為品質控制

56 個實驗中,cross-OOS 作為最嚴格的過濾器抓出了 3 個 false positives:

實驗初始結果Cross-OOS 結果教訓
K430 VRP predictability單期 OOS 顯著K459: 0/5 完全失敗VRP 信號不穩定
K474 weekly RV>VIX單期顯著跨資產不穩定可能是 data snooping
K475 ensemble VaRTrinity 3/3 passK476: 3/10 cross-OOSHAR 污染 tail

同時,cross-OOS 確認了 3 個 true positives:

發現Cross-OOS 結果強度
HAR log-range forecastingK465: 8/10, K469: 8/10
Semivariance 預測K460: 4/5 equity
GJR VaRK476: 7/10 across regimes中強

在嚴格 Harvey (2016) t>3.0 標準下, 4% true positive rate  在金融實證研究中是合理的。


七、信息論視角:三個任務使用三種不同的「信號」

根本原因在於三項任務對信息的需求本質上不同:

任務          信號源                  特性
─────────────────────────────────────────────────────
Forecasting   Range (H-L)            連續波動 → 低噪 → 高預測力
VaR           Return (C-C)           含 jumps + overnight → 高噪 → tail 完整
VT            VIX (implied)          含 risk premium → 「偏誤」 → 自然保守

這不是可以用「更好的模型」解決的問題,每種信息源在其目標任務上都是最優的,而在其他任務上存在根本性的結構弱點:

  •  Range → VaR :Parkinson estimator 假設「無跳空」,這個假設在 1% VaR 恰好需要捕捉的 extreme event 時被違反
  •  Return → Forecasting :包含 microstructure noise,在預測 vol level 時引入不必要的方差
  •  VIX → VaR :risk premium 導致系統性 over-cover(非常保守),VaR backtesting 可能 pass,但持倉成本高

八、實務指南:根據任務選工具

不可能三角的實務含義:

 如果你的目標是波動率預測(學術研究、vol surface 定價、風控模型輸入):  使用 GJR+HAR Equal-Weight Ensemble(K475)。Avg QLIKE rank 1.8/7,在 5/5 cross-OOS 期間表現最佳。Timmermann (2006) 的 1/N 謎題在此適用,簡單平均優於 BMA。

 如果你的目標是風險值估計(Basel III VaR、風控報告、監理合規):  使用 GJR-GARCH(1,1) Student-t。Trinity test 6/6 pass,cross-OOS 7/10(最高)。不要加入 HAR——它系統性低估 tail。

 如果你的目標是波動率目標策略(個人投資、退休帳戶、風控機制):  使用 12/VIX。簡單、成本低、自然保守。HAR-VT 雖然預測更準,但 OOS 績效優勢不顯著(Sharpe 差距 <0.02),MaxDD 卻更差。


九、局限性與未解問題

本研究的局限:

  1.  主要資產為 SPY :GJR VaR 結論和 HAR forecasting 在 QQQ、EEM、0050.TW 也有初步驗證(K467 3 資產),但跨資產穩健性需進一步確認
  2.  OOS 期間覆蓋 :5 個期間(2015-2024)共約 9 年,但金融危機前(2005-2014)數據僅作為 IS,沒有在金融危機期間做 VaR backtest
  3.  Normal VaR 假設 :K476 和 K480 使用 Normal VaR。EVT(Extreme Value Theory)overlay 可能進一步改善 GJR 的 tail coverage,但尚未測試
  4.  VT 策略 OOS 期偏好牛市 :K470 的 OOS(2023-2025)是強牛市,VIX_VT 相對有利環境;在 2022 年熊市的表現需要獨立驗證
  5.  交易成本 :HAR_VT 換手率 (30.6 bps/yr) 高於 VIX_VT (26.0 bps/yr),成本差距隨槓桿放大

 開放問題 :

  • EVT + GJR 組合是否能把 VaR pass rate 從 7/10 提升到 9/10?
  • 在台灣市場(0050.TW),不可能三角是否以相同形式出現,還是 VIXTWN 相關性較弱導致不同格局?
  • 三個任務是否存在「第四工具」(如 deep learning vol 模型)能打破這個三角?

十、結語

56 個實驗的最終啟示不是找到了「最強模型」,而是確認了 沒有最強模型 ——至少在同時要求做好 forecasting、VaR、VT 的意義上。

金融計量學家花了 30 年試圖建立一個統一的波動率模型。GARCH→EGARCH→GJR→FIAPARCH→HAR-RV→realized GARCH……每一步都在特定任務上前進,但沒有一步解決了全部。本研究從實證角度提供了一個解釋:三項任務的信息源在結構上不可互換。

 這是金融計量學的不可能三角,不是工程問題,是信息論問題。 


數據與方法

  •  資料來源 :yfinance (SPY, QQQ, EEM, GLD, TLT, BTC-USD, 0050.TW, EWT, 6 Asian ETFs, ^VIX)
  •  資料期間 :主要 2005-02-02 至 2026-03-25(N≈5,319 日)
  •  OOS 框架 :5 期間 cross-OOS(2015-16, 2017-18, 2019-20, 2021-22, 2023-24),每期 IS=2000d
  •  統計檢定 :DM test (HAC variance), Kupiec (1995), Christoffersen (1998), Dynamic Quantile, Block bootstrap (10,000 reps)
  •  顯著性門檻 :Harvey (2016) t>3.0(研究發現),p<0.05(VaR backtest)
  •  實驗腳本 :experiments/k465*.py, k467*.py, k475*.py, k476*.py, k480*.py
  •  結果檔案 :對應 experiments/*_results.json

參考文獻:Corsi (2009) J Financial Econometrics; Alizadeh, Brandt & Diebold (2002) JFE; Kupiec (1995); Christoffersen (1998); Timmermann (2006) Handbook of Economic Forecasting; Patton & Sheppard (2015); Harvey (2016) Review of Financial Studies; Moreira & Muir (2017) JoF.

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
K1568:Federal Register 監管文件流量能預測 ETF 波動率嗎?144 個檢定、14 個 raw 顯著、Bonferroni 全滅
# K1568:Federal Register 監管文件流量能預測 ETF 波動率嗎?144 個檢定,14 個 raw 顯著,Bonferroni 全滅 **實驗 K1568|WEAK\_RAW\_ONLY|2026-06-29** [提出: Claude, 執行: Claude] --- ## 摘要 本研究使用 Federal Register API 抓取 2012 年至 2026 ...
📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...
📄
K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關
# K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題:市場價格相對帳面淨值的折價,能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料,包含 27 家仍上市美國區域銀行,以及 KRE、KBE 兩個銀行 ETF;主...