K1073: A4f-GARCH 外生變數選擇敏感度 — VIX9D / VIX / VIX3M / VVIX 在 SPY 的橫向比較
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
摘要
[提出: Claude] A4f-GARCH(multiplicative GARCH-MIDAS spec, Engle, Ghysels & Sohn 2013)把 long-run variance component τ 直接綁在 lagged 外生變數上。先前 K988 / K1056 / K1066 三個實驗一致用 VIX² (30-day) 當 τ-driver,且 OOS 表現顯著勝過純 GJR baseline。但 CBOE 同時公布 VIX9D(9 日)、VIX3M(3 月)、VVIX(vol-of-vol)三個替代 implied volatility horizon — 換掉 VIX² 真的會更好嗎?還是 VIX² 的選擇本身就是 robust 的?
K1073 在 SPY 2013-01-02 ~ 2026-04-10(OOS n=3330 日,13 年涵蓋 2018 vol spike、2020 COVID、2022 緊縮、2024-25 貿易戰)對 4 個單一外生變數 spec + 2 個多變數 spec(VIX3M-VIX 期限結構斜率、三 VIX 組合)共 14 個模型同步滾動估計(window=2000、refit_every=63、seed=42、L-BFGS-B 三 multistart)。比較指標 Patton (2011) QLIKE,配對檢定用 Newey-West HAC DM,門檻採 Harvey-Liu-Zhu (2016) |t| > 3.0。
主要結論四項:(1) 四個 VIX-family 單變數 spec 全部 Harvey-顯著勝過 GJR baseline (DM t 在 r²_oc 全 > 3.17,r²_close 三個 > 4.6 一個 2.84)— A4f 的勝出是「VIX-family 含有 ARCH-memory 之外的額外資訊」這個結構性事實,不是 VIX² 的單一選擇問題;(2) VIX9D 在兩個目標都 marginal 最佳 ,但 vs VIX² 的差距只在 r²_oc 通過 Harvey 門檻(DM t=+3.53),r²_close 是 t=+2.70 不夠;(3) VIX3M-VIX 期限結構 slope 不增加邊際資訊 (DM t=-1.10 / -0.28 vs A4f-VIX,FAIL);(4) 三 VIX 組合 spec 在 r²_close 數值不穩定 (MSE blowup 1.79e+8,θ₂ 共線性導致罕見窗口 σ²_t 爆炸)。 Paper 9 政策建議:保留 A4f-VIX 為主規格,VIX9D 進附錄做 robustness check — 跨 horizon 的勝負差距太小,且 VIX9D 樣本只回溯到 2011,犧牲歷史涵蓋換有限統計改進不划算。

研究背景
A4f spec 是把 GARCH 的 long-run unconditional variance 從常數 ω/(1-α-β) 改成「外生 driver 的 lag 變換」:
σ²_t = τ_t · g_t
g_t = ω_g + α·u²_{t-1} + γ·u²_{t-1}·I{u<0} + β·g_{t-1}
u_{t-1} = r_{t-1}/√τ_t
τ_t = θ₀ + θ₁ · X²_{t-1} (single-X)
其中 X 在過去 K988/K1056/K1066 都是 VIX 。這個選擇沒有理論強制 — Engle, Ghysels & Sohn (2013) 原始 paper 用的是 macro variables(CPI volatility、IP growth),CBOE 後續公布的 VIX9D / VIX3M / VVIX 都是 SPY 直接 implied vol 的 alternative horizon。如果 A4f 的勝出機制是「implied vol 對 future RV 的 market-priced 預期」,那麼 任何 horizon 的 VIX 應該都行,只是程度差別 ;但如果 30-day 對 daily target 是某個特殊最佳 horizon,那麼 VIX² 不可替代。K1073 直接檢驗哪個假說正確。
兩個第二序問題同時測:(a) 加 VIX3M-VIX slope 進 spec 是否提供 term-structure 增量資訊 (A4f-SLOPE);(b) 同時放三個 VIX horizon 是否更好還是反而退化 (A4f-COMBO)— 後者特別測 collinearity(VIX-VIX9D ρ=0.972, VIX-VIX3M ρ=0.972)會不會把 A4f 拖垮。
方法與數據
| 項目 | 設定 |
|---|---|
| 標的 | SPY (yfinance Adj Close + Open) |
| 外生變數 | ^VIX, ^VIX9D, ^VIX3M, ^VVIX (yfinance) |
| 期間 | 2011-01-04 ~ 2026-04-10(VIX9D binding:2011-01-03 起公布) |
| 總樣本 | 3,831 個交易日 |
| OOS 起點 | 2013-01-02(n=3,330 OOS 觀測) |
| 滾動估計 | window=2000,refit_every=63,total refits=53 |
| 估計方法 | L-BFGS-B + 3 multi-start,A4f negative log-likelihood numba-compiled |
| Random seed | 42 |
| 預測目標 | r²_close(close-to-close)、r²_oc(open-to-close) |
| 損失函數 | Patton (2011) QLIKE(proxy-robust)、MSE、MAE、Spearman ρ |
| 配對檢定 | Diebold-Mariano with Newey-West HAC(lag = T^(1/3) ≈ 14) |
| 門檻 | Harvey-Liu-Zhu (2016) |t| > 3.0(multiple-testing 修正) |
模型清單(14 個):
| Spec | τ_t formula | n_params (ex GJR core) |
|---|---|---|
| GJR_close / GJR_oc | 標準 GJR(1,1) baseline | — |
| A4f-VIX (×2 targets) | θ₀ + θ₁·VIX²_{t-1} | 2 |
| A4f-VIX9D | θ₀ + θ₁·VIX9D²_{t-1} | 2 |
| A4f-VIX3M | θ₀ + θ₁·VIX3M²_{t-1} | 2 |
| A4f-VVIX | θ₀ + θ₁·VVIX²_{t-1} | 2 |
| A4f-SLOPE | θ₀ + θ₁·VIX² + θ₂·(VIX3M-VIX)_{t-1} | 3 |
| A4f-COMBO | θ₀ + θ₁·VIX9D² + θ₂·VIX² + θ₃·VIX3M²_{t-1} | 4 |
每個 A4f spec 對 r²_close 與 r²_oc 兩個目標各跑一次,共 12 個 A4f model + 2 個 GJR baseline。
Lookahead audit(已通過) :vix_lag[t] = vix[t-1](在 build_vix2_lag 強制;OOS forecast 在 abs_idx 用 X²_{abs_idx-1};g-state 跨 refit 連續 carry,無 future-return leak)。
VIX-family 描述統計(full sample 2011-2026)
| 指標 | mean | std | min | max | AC(1) |
|---|---|---|---|---|---|
| VIX | 18.17 | 6.85 | 9.14 | 82.69 | 0.963 |
| VIX9D | 17.54 | 8.24 | 7.10 | 106.66 | 0.935 |
| VIX3M | 20.05 | 6.07 | 11.85 | 72.98 | 0.979 |
| VVIX | 96.37 | 16.13 | 61.76 | 207.59 | 0.939 |
Pairwise correlation :VIX-VIX9D = 0.972 、VIX-VIX3M = 0.972 、VIX-VVIX = 0.692 、VIX9D-VIX3M = 0.907 、VIX9D-VVIX = 0.671 、VIX3M-VVIX = 0.686 。VIX9D / VIX3M 與 VIX 的相關性都極高(接近完全共線),VVIX 是真正的「different content」。
核心發現
發現一:四個 VIX-family 單變數 A4f spec 全部 Harvey-顯著勝過 GJR baseline
這是 K1073 最具結構意義的觀察。 不論你選哪個 horizon,只要把 VIX-family 當外生變數丟進 τ_t,OOS QLIKE 就能跨過 Harvey 3.0 門檻 (除了 r²_close 的 VVIX 是 t=+2.84 略低於門檻;其他七個全過)。
| Spec | r²_close QLIKE | r²_close DM t (vs GJR) | r²_oc QLIKE | r²_oc DM t (vs GJR) |
|---|---|---|---|---|
| GJR_close | -8.5607 | — | — | — |
| GJR_oc | — | — | -8.9789 | — |
| A4f-VIX | -8.6499 | +7.17 ★ | -9.0768 | +6.08 ★ |
| A4f-VIX9D | -8.6675 | +7.51 ★ | -9.0959 | +6.22 ★ |
| A4f-VIX3M | -8.6116 | +4.64 ★ | -9.0436 | +4.75 ★ |
| A4f-VVIX | -8.5880 | +2.84 | -9.0146 | +3.17 ★ |
★ = Harvey |t| > 3.0 顯著。
詮釋 :A4f 機制的勝出 不在 VIX² 的特殊性 ,而在 implied vol 對 future RV 的市場定價包含 GARCH 遞迴吸收不到的資訊 。連 VVIX(vol-of-vol,跟 VIX 相關性只有 0.69)都能 r²_oc 通過門檻 — 表示 SPY 期權市場對「vol 分布的 second moment」也有 marginal information content。這對 Paper 9 的論述 robust:A4f-VIX 不是 cherry-picked horizon,是「VIX-family 內任意 horizon 的代表」。
發現二:VIX9D marginal 最佳但只有 r²_oc 跨過 Harvey 門檻
直接 head-to-head:
| 配對 | r²_close DM t | r²_close 結果 | r²_oc DM t | r²_oc 結果 |
|---|---|---|---|---|
| VIX9D vs VIX | +2.70 | VIX9D marginal win, 未過門檻 | +3.53 ★ | VIX9D Harvey-sig win |
| VIX9D vs VIX3M | +5.79 ★ | VIX9D 顯著勝 | +5.27 ★ | VIX9D 顯著勝 |
| VIX9D vs VVIX | +6.26 ★ | VIX9D 顯著勝 | +5.06 ★ | VIX9D 顯著勝 |
| VIX vs VIX3M | +7.30 ★ | VIX 顯著勝 | +5.90 ★ | VIX 顯著勝 |
| VIX vs VVIX | +5.63 ★ | VIX 顯著勝 | +5.28 ★ | VIX 顯著勝 |
VIX9D > VIX > VIX3M > VVIX 的排序在兩個目標都成立, 且每個相鄰 step 大多都是 Harvey-sig (r²_close 上 VIX9D vs VIX 是唯一例外,差距 t=+2.70 雖在統計上 marginal 但不夠安全;r²_oc 全 step 過門檻)。
經濟直覺 :VIX9D 對 daily forecast 是「最近期 + 對 1-2 日內 vol 最敏感」,理論上 fit 短期變化最好;VIX3M 是「smoother / 較長 horizon」,對 daily 反而過度平滑;VVIX 是「vol 分布的 dispersion」,second-order 訊息對 first-moment forecast 較弱。但 VIX9D 對 VIX 的提升 magnitude 在 QLIKE 絕對值上非常小:r²_close 只 0.18%(-8.6675 vs -8.6499),r²_oc 0.21%(-9.0959 vs -9.0768)— 統計上 detectable,經濟上 marginal。

發現三:VIX3M-VIX 期限結構斜率不提供額外資訊
VIX3M 跟 VIX 高度相關(ρ=0.972),但兩者差(slope)理論上代表「市場對 vol mean reversion 的預期」— 高 slope = 市場預期 vol 會升高、低 slope = 預期會降。把 slope 當第二個 regressor 加進 A4f-VIX 看會不會改善:
| 比較 | r²_close DM t | r²_oc DM t | 結論 |
|---|---|---|---|
| A4f-SLOPE vs A4f-VIX | -1.10 | -0.28 | FAIL(不顯著,且 sign 上反而 VIX 略勝) |
| A4f-SLOPE vs GJR | +2.21 | +5.60 ★ | r²_oc Harvey-sig,但只是因為 SLOPE 包含 VIX 本身 |
結論 :term structure information 對 daily SPY RV forecast 是 redundant — 它跟 VIX level 之間的訊息重疊度太高,多加一個 regressor 換不到任何 OOS 改善。Paper 9 不需要保留 SLOPE spec。
發現四:A4f-COMBO 在 r²_close 數值不穩定(multicollinearity collapse)
把 VIX9D² + VIX² + VIX3M² 三個一起放進 τ_t,結果在 r²_close 嚴重退化:
| Spec | r²_close QLIKE | r²_close MSE | r²_close DM t (vs GJR) |
|---|---|---|---|
| A4f-COMBO_close | -8.4803 | 1.79e+8 ⚠️ | -0.63(GJR 反勝) |
| A4f-VIX_close (對照) | -8.6499 | 1.53e-7 | +7.17 ★ |
MSE 從 ~1.5e-7 跳到 1.79e+8( 約 1.2 兆倍 ),代表某些 refit 窗口 τ+多項加總出現負值或極大值,導致 σ² 在罕見天數爆炸(具體機制:θ₂、θ₃ 在 ill-conditioned 矩陣下被估到大絕對值的相反符號,遇到 high-VIX 日就 catastrophic cancellation)。QLIKE 因為是 log-scale 較不敏感,但仍從 -8.6499 退到 -8.4803(DM t=-0.63 vs GJR,A4f 連 baseline 都贏不過)。
A4f-COMBO 在 r²_oc 上反而沒爆炸(MSE = 1.68e-7,DM t=+5.53 vs GJR),這個 target-asymmetry 反映兩個 target 對 τ 與 g 的分解負擔不同 — r²_close 信噪比較低,多參數更容易 overfit;r²_oc 因為截掉 overnight gap 而較乾淨。
Lesson :VIX-family 高度共線(pairwise ρ > 0.9),多 horizon 同時放進 A4f 會超出可識別邊界。 保持單變數 spec 。
發現五:θ₁ stability 與預測力呈反向關係(normalization artifact,descriptive)
53 個 refit 跨 13 年的 θ₁ 變動係數(CV = std/|mean|):
| 模型 | θ₁ CV | OOS QLIKE rank |
|---|---|---|
| A4f-VVIX_close | 0.599 (最穩定) | 5/7(最弱單變數 r²_close 預測) |
| A4f-VVIX_oc | 0.744 | 5/7 |
| A4f-VIX9D_close | 1.501 | 1/7(最佳) |
| A4f-VIX3M_oc | 1.787 | 4/7 |
| A4f-VIX3M_close | 1.795 | 4/7 |
| A4f-VIX_close | 3.000 | 2/7 |
| A4f-VIX9D_oc | 4.567 | 1/7 |
| A4f-VIX_oc | 5.545 (最不穩定) | 2/7 |
Caveat :這個反向關係 主要是 normalization artifact 。我們的 A4f 用 free ω_g 不強制 E[g]=1(與 Engle, Ghysels & Sohn 2013 原始 GARCH-MIDAS 不同),所以 τ 與 g 不分別 identified — τ·g 乘積本身有效(forecast 沒問題),但 θ₁ 的 absolute scale 在不同 τ-dominated / g-dominated local optima 間跳。L-BFGS-B 跨 refit 在兩個 basin 之間 alternate(bimodal),所以 CV 大;VVIX 因為 magnitude(mean ≈ 96 vs VIX mean ≈ 18)讓 θ₁ scale 自動小,CV 表面上更穩。 θ₁ 穩定性不是 forecast quality 的真實指標 ,這個 ranking 只能 descriptive 看。
實務意義
- Paper 9 政策 :保留 A4f-VIX 為主規格,VIX9D 進 robustness appendix。理由:(a) VIX9D 對 VIX 的改進 magnitude < 0.21% QLIKE,(b) Harvey 3.0 只在 r²_oc 通過 r²_close 是 t=+2.70,(c) VIX9D 樣本只到 2011 比 VIX 短 21 年,crisis-period(2008-09)無法 cover。
- A4f robustness narrative 加強 :「A4f 的勝出不依賴特定 horizon 選擇 — VIX9D / VIX / VIX3M / VVIX 全 Harvey-sig 勝過 GJR」是 Paper 9 強而 robust 的論述,比「VIX² 表現很好」更有說服力。
- 不要嘗試多 horizon 組合 :VIX-family 共線性高,A4f-COMBO r²_close 數值不穩 + DM 不顯著, 單變數 sufficient 。
- Term structure slope 別加 :A4f-SLOPE 沒贏 A4f-VIX,term structure 訊息對 daily SPY RV 是 redundant。
- Cross-asset 推論審慎 :本實驗只在 SPY;Paper 9 的 cross-asset extension(QQQ/GLD/0050.TW)需獨立做類似 sensitivity,不能直接套用 SPY 結論。
限制與穩健性
- Normalization not imposed :自由 ω_g spec 讓 τ vs g 不分別 identified。τ/σ² 比例僅 descriptive,不可解讀。Forecast σ² = τ·g 仍有效(兩個 basin 的 product 在均衡相同),但參數 trajectory bimodal — 後續可加 E[g]=1 normalization 重估。
- Bimodal optimization :L-BFGS-B 跨 53 個 refit 在 τ-dominated 與 g-dominated 兩個 local optimum 間切換。3 multi-start 找到 basin 後鎖定,但 cross-refit 的 θ₁ 仍跳。 不影響 forecast (兩 basin 的 σ² 預測幾乎一致)。
- OOS 起點 2013 :post-crisis 樣本,無法外推到 2008-09 crisis regime。VIX9D 公布於 2011 是 binding constraint。
- VIX-family 多重共線 :VIX、VIX9D、VIX3M 兩兩 ρ > 0.9。COMBO spec 已證實受影響;單變數 spec 不受影響但 horizon 之間的「真實效力差距」可能比 DM t-stat 顯示的還小(因為 t-stat 反映 loss 序列差,而 loss 已被三個高度相關 driver 中的任一個 absorb 大部分 signal)。
- 單一資產(SPY) :跨資產驗證(QQQ、GLD、0050.TW)尚未做。
- Single-exog scope :未測 VIX + macro variables、VIX + realized variance、log VIX、√VIX 等非線性轉換 — 後續可在 K1073 follow-up 做。
結論
A4f-GARCH 對 VIX-family 外生變數的選擇 robust :VIX9D / VIX / VIX3M / VVIX 四個 horizon 全部 OOS QLIKE 勝過 GJR baseline,三個過 Harvey 門檻。VIX9D marginal 最佳但只在 r²_oc 跨過顯著性閾值;VIX² 仍是 Paper 9 主規格的合理選擇(樣本長、結果穩、社群慣例)。
對 Paper 9 寫作的具體影響:
- Main spec 保持 A4f-VIX 不變
- Appendix 加 K1073 robustness :報告 4 horizons 同時 Harvey-sig vs GJR、VIX9D 邊際勝出但 magnitude 小
- 拒絕 SLOPE / COMBO :term structure 與多 horizon 組合都不提供 incremental forecast value
下一步研究方向:(1) E[g]=1 normalization 重估讓 θ₁ 解讀;(2) log/√VIX 非線性轉換;(3) 跨資產(QQQ、GLD、0050.TW)平行 sensitivity;(4) regime-switching A4f 測試「VIX9D 在 high-vol 規格 vs VIX3M 在 low-vol 規格」的條件最佳化;(5) 預-2008 擴展(VIX/VIX3M 都有歷史,犧牲 VIX9D)capture crisis regime。
本文基於實驗 K1073(腳本:experiments/k1073/k1073.py,結果:experiments/k1073/k1073_results.json,README:experiments/k1073/README.md)。數據來源:yfinance(SPY、^VIX、^VIX9D、^VIX3M、^VVIX)。期間:2011-01-04 至 2026-04-10,總樣本 N=3,831,OOS N=3,330(2013-01-02 起),53 個 rolling refit、window=2,000、refit_every=63、random seed=42。統計門檻:Patton (2011) QLIKE + Newey-West HAC DM + Harvey-Liu-Zhu (2016) |t| > 3.0。
參考文獻 :
- Engle, R.F., Ghysels, E. & Sohn, B. (2013). Stock market volatility and macroeconomic fundamentals. Review of Economics and Statistics 95(3): 776-797.
- Patton, A.J. (2011). Volatility forecast comparison using imperfect volatility proxies. Journal of Econometrics 160(1): 246-256.
- Harvey, C.R., Liu, Y. & Zhu, H. (2016). …and the cross-section of expected returns. Review of Financial Studies 29(1): 5-68.
- Hansen, P.R. & Lunde, A. (2005). A forecast comparison of volatility models: does anything beat a GARCH(1,1)? Journal of Applied Econometrics 20(7): 873-889.
- CBOE. VIX, VIX9D, VIX3M, VVIX methodology white papers.
- 相關前手實驗:K988(A4f-VIX vs GJR DM t=4.48)、K1056(A4f-VIX 5/5 sub-period 一致)、K1066(A4f_oc vs GJR_oc r²_oc DM t=+7.05)。
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊