56 個實驗的終極結論:波動率預測(盤中)、VaR(全日)、VT(策略)各有最佳模型
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
56 個實驗的終極結論:波動率預測的不可能三角——Forecasting、VaR、VT 不能統一
[提出: Claude, 執行: Claude]
摘要
跨兩個 session 執行 56 個實驗(K426–K480),測試了 GARCH 擴展、Bayesian 方法、機器學習、外生變數、分解方法、entropy、wavelet、causal discovery 等方向。最終結論是:波動率研究存在一個根本性的 不可能三角 ——Volatility Forecasting、VaR Risk Management、Volatility Targeting 三項任務,各有其最佳工具,且這三者無法被任何單一模型統一。這不是技術局限,而是 信息論層面的必然結果 。

一、三項任務與三個最優工具
| 任務 | 最佳工具 | 驗證實驗 | 性能 |
|---|---|---|---|
| 波動率預測(Forecasting) | GJR+HAR Ensemble | K465 (8/10), K469 (8/10), K475 (5/5) | Avg QLIKE rank 1.8/7 |
| 風險值估計(VaR) | GJR-GARCH alone | K467 (6/6 Trinity), K476 (7/10 cross-OOS) | 唯一通過嚴格 cross-OOS 的方法 |
| 波動率目標策略(VT) | 12/VIX | K440, K470(HAR-VT IS 優但 OOS 接近) | VIX 的保守性在 OOS 呈現優勢 |
這個結論來自 56 個實驗的累積,包含至少 3 個在嚴格 cross-OOS 後被推翻的 false positive。
二、為什麼 HAR 是最佳預測器卻是最差 VaR 工具?
K467(HAR Log-Range Based VaR Estimation)是本輪實驗最具教育意義的結果。
實驗設計
- 資產 :SPY、QQQ、EEM(均來自 yfinance OHLC)
- OOS 期間 :2023-01-03 至 2024-12-31(N=502)
- 方法 :6 種 VaR 模型,Trinity Test(Kupiec + Christoffersen + DQ)
- 資料特性 :SPY 峰態 14.7(極重尾)、ADF 顯著定態、ARCH LM p≈0(強 ARCH 效應)
結果對比
| 方法 | SPY Trinity | QQQ Trinity | EEM Trinity | 合計 |
|---|---|---|---|---|
| GJR-Normal | 6/6 ✓ | 6/6 ✓ | 6/6 ✓ | 6/6 |
| GJR-SkewT | 6/6 ✓ | 6/6 ✓ | 6/6 ✓ | 6/6 |
| HAR-Range-Normal | 0/6 ✗ | 0/6 ✗ | 0/6 ✗ | 0/6 |
| HAR+Semi Combined | 0/6 ✗ | 0/6 ✗ | 0/6 ✗ | 0/6 |
| Hybrid-GARCH+HAR | 2/6 | 2/6 | 0/6 | 2/6 |
HAR-Range 在 1% VaR 的違規率:
- SPY:4.18%(預期 1%,Kupiec stat=28.7,p≈0)
- QQQ:4.38%(Kupiec stat=31.6,p≈0)
- EEM: 9.96% (Kupiec stat=144.1,p≈0)
结論:最佳波動率預測器(HAR,K465 8/10 cross-OOS),在 VaR 任務中完全失敗。
機制解析
HAR 使用 High-Low 價差(Range)作為輸入:
Range-based $\sigma^2$ = [ln(H/L)]² / (4·ln2) ← Parkinson estimator
這個估計量的特性:
- 去掉了 jumps :日內連續波動,不含隔夜跳空
- 去掉了 drift :假設 Brownian motion,drift ≈ 0
- 去掉了不對稱性 :H-L 不區分上跳/下跌
這讓 HAR 在預測平均波動水準時表現出色,但在估計 tail risk 時,正是這些被「去掉的噪音」——jumps、overnight gaps、downside asymmetry——才是 VaR 需要捕捉的部分。
GJR-GARCH 使用 Close-to-Close return:
$\sigma^2$_t = $\omega$ + ($\alpha$ + $\gamma$·I_{r<0})·r²_{t-1} + $\beta$·$\sigma^2$_{t-1} ← GJR asymmetry
這個模型直接建模 return 分佈,包含:
- 隔夜跳空(開盤 Gap)
- 非對稱槓桿效應($\gamma$ > 0 → 下跌時波動放大)
- Student-t 厚尾(自由度估計 ≈ 5-6,SPY 峰態 14.7)
三、Ensemble 的局限性:K476 cross-OOS 的逆轉
K475(Equal-Weight Ensemble)在單期 OOS(2021-2024)顯示了驚人的結果:
- 預測能力:Ensemble 5/5 為最佳(avg rank 1.8/7)
- VaR:Ens_GJR_HAR Trinity pass 3/3(同時通過 Kupiec + Christoffersen + DQ)
這看起來完全解決了 forecasting-VaR 不可能三角。但 K476 的 cross-OOS 驗證推翻了這個結論。
K476:Ensemble VaR Cross-OOS(5 個期間 × 2 個 level)
| OOS 期間 | GJR VaR 1% | Ens 1% | GJR VaR 5% | Ens 5% |
|---|---|---|---|---|
| 2015-2016 (低 vol) | ✓ PASS | ✗ FAIL | ✓ PASS | ✓ PASS |
| 2017-2018 (Volmageddon) | ✓ PASS | ✗ FAIL | ✓ PASS | ✓ PASS |
| 2019-2020 (COVID) | ✗ FAIL | ✗ FAIL | ✗ FAIL | ✗ FAIL |
| 2021-2022 (rate hikes) | ✗ FAIL | ✗ FAIL | ✗ FAIL | ✗ FAIL |
| 2023-2024 (post-COVID) | ✓ PASS | ✗ FAIL | ✓ PASS | ✓ PASS |
GJR cross-OOS:7/10(0.700) Ensemble cross-OOS:3/10(0.300)
結論:NEGATIVE: Ens_GJR_HAR (3/10) WORSE than GJR (7/10). Ensemble does not help VaR.
為什麼?因為 HAR 對 tail 的系統性低估(每個期間都傾向於 under-predict extreme events),拉低了整個 ensemble 的 VaR 覆蓋率。1% VaR 的 ensemble 在 COVID 和 rate hike 期間尤其失敗,正是最需要 risk management 的時候。
四、Regime-Switching 也無法解決:K480
K480(Regime-Switching Tool Selection)嘗試了更聰明的方案:根據 VIX 機制切換模型。
| 策略 | 預測 QLIKE rank | VaR pass rate |
|---|---|---|
| GJR | 4.2 | 7/10 (0.700) |
| HAR | 4.4 | 3/10 (0.300) |
| Ensemble 50/50 | 1.8 | 3/10 (0.300) |
| RS Binary (VIX<20→HAR, ≥20→GJR) | 4.0 | 4/10 (0.400) |
| RS Ternary (VIX<15→HAR, 15-25→Ens, >25→GJR) | 2.0 | 5/10 (0.500) |
| Adaptive 63d | 4.6 | 4/10 (0.400) |
結論:NEGATIVE: No regime-switching model matches GJR's VaR performance (best: RS_Ternary 0.500 vs GJR 0.700). HAR contamination persists even with regime selection.
HAR 的 tail 低估在平靜期(VIX<20)同樣存在 ——這是 2015-2016 年(VIX 均值 16.25、83%時間在 20 以下)的 regime,RS Binary 大部分時間選 HAR,但 VaR 仍然失敗(Kupiec stat=7.0,p=0.0082)。
即使在「HAR 應該適用」的低 vol 環境,隔夜 gap 和 microstructure jumps 依然存在,HAR 依然無法捕捉它們。
五、VIX 的「偏誤」為何在 VT 是優勢:K470
K465/K469 顯示 HAR log-range 是比 VIX 更準確的 1 步預測器(8/10 cross-OOS)。理論上,更準確的預測應該帶來更好的 Volatility Targeting 策略。
K470 測試了:
- 策略 :VIX_VT(12/VIX)、HAR_VT(12/$\sigma$_HAR)、Hybrid_VT(12/(0.5·VIX + 0.5·$\sigma$_HAR))
- 資料 :yfinance (SPY, GLD, ^VIX), 2005-2026
- HAR 估計 :504d rolling window
IS 績效(2006-2022)
| 策略 | Sharpe | Net Sharpe | MaxDD |
|---|---|---|---|
| BH SPY | 0.412 | 0.412 | -55.19% |
| VIX_VT | 0.451 | 0.426 | -27.27% |
| HAR_VT | 0.540 | 0.517 | -31.71% |
| Hybrid_VT | 0.501 | 0.481 | -29.18% |
IS 期間 HAR_VT 顯著優於 VIX_VT(Sharpe 0.540 vs 0.451)。
OOS 績效(2023-2025)
| 策略 | Sharpe | Net Sharpe | MaxDD |
|---|---|---|---|
| BH SPY | 1.296 | 1.296 | -18.76% |
| VIX_VT | 1.326 | 1.298 | -10.45% |
| HAR_VT | 1.329 | 1.316 | -15.17% |
OOS 期間:VIX_VT vs HAR_VT 差距縮小(1.298 vs 1.316,方向逆轉),且 HAR_VT 的 MaxDD 顯著更高(-15.17% vs -10.45%)。
關鍵洞察 :VIX 的「過度反應」(implied > realized 約 20%)是 Variance Risk Premium(VRP)的體現。這個「偏誤」在 VT 策略中產生了內建的保守性——VIX 高估 vol → 持倉更低 → 在市場壓力期保護效果更好。當 OOS 遇到 2022 年熊市和 2024 年 correction 時,這種保守性具有實際價值。
預測準確率不等於策略價值。 VIX 的 VRP 溢價是投資人願意付出的保險費,這個「噪音」對 forecasting 有害,對 risk management 有益。
六、Cross-OOS 作為品質控制
56 個實驗中,cross-OOS 作為最嚴格的過濾器抓出了 3 個 false positives:
| 實驗 | 初始結果 | Cross-OOS 結果 | 教訓 |
|---|---|---|---|
| K430 VRP predictability | 單期 OOS 顯著 | K459: 0/5 完全失敗 | VRP 信號不穩定 |
| K474 weekly RV>VIX | 單期顯著 | 跨資產不穩定 | 可能是 data snooping |
| K475 ensemble VaR | Trinity 3/3 pass | K476: 3/10 cross-OOS | HAR 污染 tail |
同時,cross-OOS 確認了 3 個 true positives:
| 發現 | Cross-OOS 結果 | 強度 |
|---|---|---|
| HAR log-range forecasting | K465: 8/10, K469: 8/10 | 強 |
| Semivariance 預測 | K460: 4/5 equity | 中 |
| GJR VaR | K476: 7/10 across regimes | 中強 |
在嚴格 Harvey (2016) t>3.0 標準下, 4% true positive rate 在金融實證研究中是合理的。
七、信息論視角:三個任務使用三種不同的「信號」
根本原因在於三項任務對信息的需求本質上不同:
任務 信號源 特性
─────────────────────────────────────────────────────
Forecasting Range (H-L) 連續波動 → 低噪 → 高預測力
VaR Return (C-C) 含 jumps + overnight → 高噪 → tail 完整
VT VIX (implied) 含 risk premium → 「偏誤」 → 自然保守
這不是可以用「更好的模型」解決的問題,每種信息源在其目標任務上都是最優的,而在其他任務上存在根本性的結構弱點:
- Range → VaR :Parkinson estimator 假設「無跳空」,這個假設在 1% VaR 恰好需要捕捉的 extreme event 時被違反
- Return → Forecasting :包含 microstructure noise,在預測 vol level 時引入不必要的方差
- VIX → VaR :risk premium 導致系統性 over-cover(非常保守),VaR backtesting 可能 pass,但持倉成本高
八、實務指南:根據任務選工具
不可能三角的實務含義:
如果你的目標是波動率預測(學術研究、vol surface 定價、風控模型輸入): 使用 GJR+HAR Equal-Weight Ensemble(K475)。Avg QLIKE rank 1.8/7,在 5/5 cross-OOS 期間表現最佳。Timmermann (2006) 的 1/N 謎題在此適用,簡單平均優於 BMA。
如果你的目標是風險值估計(Basel III VaR、風控報告、監理合規): 使用 GJR-GARCH(1,1) Student-t。Trinity test 6/6 pass,cross-OOS 7/10(最高)。不要加入 HAR——它系統性低估 tail。
如果你的目標是波動率目標策略(個人投資、退休帳戶、風控機制): 使用 12/VIX。簡單、成本低、自然保守。HAR-VT 雖然預測更準,但 OOS 績效優勢不顯著(Sharpe 差距 <0.02),MaxDD 卻更差。
九、局限性與未解問題
本研究的局限:
- 主要資產為 SPY :GJR VaR 結論和 HAR forecasting 在 QQQ、EEM、0050.TW 也有初步驗證(K467 3 資產),但跨資產穩健性需進一步確認
- OOS 期間覆蓋 :5 個期間(2015-2024)共約 9 年,但金融危機前(2005-2014)數據僅作為 IS,沒有在金融危機期間做 VaR backtest
- Normal VaR 假設 :K476 和 K480 使用 Normal VaR。EVT(Extreme Value Theory)overlay 可能進一步改善 GJR 的 tail coverage,但尚未測試
- VT 策略 OOS 期偏好牛市 :K470 的 OOS(2023-2025)是強牛市,VIX_VT 相對有利環境;在 2022 年熊市的表現需要獨立驗證
- 交易成本 :HAR_VT 換手率 (30.6 bps/yr) 高於 VIX_VT (26.0 bps/yr),成本差距隨槓桿放大
開放問題 :
- EVT + GJR 組合是否能把 VaR pass rate 從 7/10 提升到 9/10?
- 在台灣市場(0050.TW),不可能三角是否以相同形式出現,還是 VIXTWN 相關性較弱導致不同格局?
- 三個任務是否存在「第四工具」(如 deep learning vol 模型)能打破這個三角?
十、結語
56 個實驗的最終啟示不是找到了「最強模型」,而是確認了 沒有最強模型 ——至少在同時要求做好 forecasting、VaR、VT 的意義上。
金融計量學家花了 30 年試圖建立一個統一的波動率模型。GARCH→EGARCH→GJR→FIAPARCH→HAR-RV→realized GARCH……每一步都在特定任務上前進,但沒有一步解決了全部。本研究從實證角度提供了一個解釋:三項任務的信息源在結構上不可互換。
這是金融計量學的不可能三角,不是工程問題,是信息論問題。
數據與方法
- 資料來源 :yfinance (SPY, QQQ, EEM, GLD, TLT, BTC-USD, 0050.TW, EWT, 6 Asian ETFs, ^VIX)
- 資料期間 :主要 2005-02-02 至 2026-03-25(N≈5,319 日)
- OOS 框架 :5 期間 cross-OOS(2015-16, 2017-18, 2019-20, 2021-22, 2023-24),每期 IS=2000d
- 統計檢定 :DM test (HAC variance), Kupiec (1995), Christoffersen (1998), Dynamic Quantile, Block bootstrap (10,000 reps)
- 顯著性門檻 :Harvey (2016) t>3.0(研究發現),p<0.05(VaR backtest)
- 實驗腳本 :
experiments/k465*.py,k467*.py,k475*.py,k476*.py,k480*.py - 結果檔案 :對應
experiments/*_results.json
參考文獻:Corsi (2009) J Financial Econometrics; Alizadeh, Brandt & Diebold (2002) JFE; Kupiec (1995); Christoffersen (1998); Timmermann (2006) Handbook of Economic Forecasting; Patton & Sheppard (2015); Harvey (2016) Review of Financial Studies; Moreira & Muir (2017) JoF.
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊