Bayesian SSVS 再次確認:GJR-GARCH 方差方程自足,0/8 外生變數通過篩選
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
研究背景與動機
GJR-GARCH 模型的方差方程在描述 SPY 波動率動態上已被反覆證實具有高度自足性。K821 實驗(2026-03)曾對 8 個市場外生變數(VIX 水準、VIX 變動、VIX9D、VVIX proxy、TLT 波動率、HYG 信用差距、期限利差、SPY 成交量比率)進行 Bayesian SSVS(Stochastic Search Variable Selection)篩選,結果 0/8 通過 PIP > 0.5 門檻,最高僅 HYG_spread PIP=0.4275。
K895 設計了更具針對性的第二輪實驗:將外生變數替換為 VIX 衍生品與跨資產收益率 (VIX9D、VIX3M、VIX 期限結構比率、TLT、GLD、UUP),探索這些更直接關聯波動率資訊的變數是否能通過 SSVS 篩選,進入 GJR 方差方程。
方法論
SSVS 框架(So, Chen & Liu, 2006)
SSVS 是一種 Bayesian 變數選擇方法(George & McCulloch, 1993, 1997),對每個候選外生變數 引入潛在二元指示變數 。方差方程如下:
t = + \varepsilon^2{t-1} + I(\varepsilon<0)\varepsilon^2_{t-1} + \beta$$\sigma^2{t-1} + \sum_i \delta_i \cdot \cdot X{i,t-1}
先驗分配採用 spike-and-slab 設計:當 (未選入), 的先驗方差極小(spike,);當 (選入),方差放大為 OLS SE 的 10 倍(slab,依 So et al. 2006 校準)。後驗納入機率(PIP)定義為 ,以 PIP > 0.5 作為「中位機率模型(median probability model)」入選標準。
MCMC 設定 :Gibbs sampler,共 20,000 次迭代,燒入期 5,000 次,有效樣本 15,000 次。
樣本設計
- 資產 :SPY,yfinance,2011-01-03 至 2026-04-02(共 3,835 個交易日)
- 估計期 :前 3,020 天(樣本內)
- 樣本外評估 :後 752 天,2023-01-03 至 2025-12-31,每 126 天(半年)重新估計一次
基礎 GJR-GARCH 參數(MLE)
| 參數 | 估計值 |
|---|---|
| 0.0389 | |
| 0.0438 | |
| (槓桿效應) | 0.2786 |
| 0.7959 | |
| 持續性(+/2+) | 0.9791 |
持續性 ≈ 0.98,確認模型本身已高度捕捉方差動態。
核心結果:0/8 外生變數通過篩選
樣本內 PIP 表
| 變數 | PIP | 後驗均值 | 95% CI | OLS 係數 | 入選(中位模型) |
|---|---|---|---|---|---|
| VIX_level | 0.019 | -0.022 | [-0.108, 0.069] | -0.540 | 否 |
| VIX_change | 0.356 | -0.042 | [-0.201, 0.012] | -0.149 | 否 |
| VIX9D | 0.032 | -0.002 | [-0.057, 0.051] | +0.356 | 否 |
| VIX3M | 0.028 | -0.008 | [-0.070, 0.049] | +0.133 | 否 |
| VIX_term_ratio | 0.075 | +0.003 | [-0.043, 0.087] | +0.147 | 否 |
| TLT_ret | 0.111 | -0.007 | [-0.115, 0.019] | -0.055 | 否 |
| GLD_ret | 0.077 | +0.001 | [-0.023, 0.044] | +0.013 | 否 |
| UUP_ret | 0.102 | -0.010 | [-0.199, 0.042] | -0.074 | 否 |
所有 8 個變數的 PIP 遠低於 0.5 門檻。其中 VIX_change 最高(PIP=0.356),但仍未達標。值得注意的是,OLS 係數的數值有時看起來顯著(VIX_level OLS=-0.540),但 SSVS 的 Bayesian 後驗已正確地「縮減」這些係數,揭示其在競爭其他解釋力後並無實質增量貢獻。
樣本外 OOS 評估(QLIKE on r²,2023-2025)
| 模型 | QLIKE | 相對 GJR(%) | Spearman | DM 統計量 | Harvey |
|---|---|---|---|---|---|
| GJR 基準 | 1.5447 | 0.0% | 0.252 | — | — |
| SSVS 中位模型 | 1.5447 | 0.0% | 0.252 | 0.00 | 不顯著 |
| VIX_only(只加 VIX) | 1.5139 | -1.99% | 0.279 | -2.01 | 不顯著 |
| Kitchen Sink(全加) | 1.4793 | -4.23% | 0.306 | -3.63 | 顯著(Harvey) |
SSVS 中位模型與 GJR 基準完全相同(DM=0.00),因為 SSVS 選擇了空模型(0 個變數)。Kitchen Sink 在樣本外 QLIKE 改善 4.23%,DM t=-3.63 達到 Harvey (2016) |t|>3.0 門檻,但這是 過度配適的危險信號 ,而非真實改善。
SSVS 樣本外 6 次重估均選空模型
從 2023-01 到 2025-07,每半年重估一次的 SSVS 結果均顯示所有 8 個變數 PIP 遠低於 0.5:
- VIX_change 的 PIP 跨期間在 0.11-0.36 之間波動,無一達標
- 最晚一期(2025-07)受市場結構變化影響,部分 PIP 略微上升,但最高仍只有 TLT_ret PIP=0.233
敏感性分析:先驗寬嚴不影響結論
更換 spike 方差 (0.001/0.01/0.05/0.1)進行敏感性分析,4 種設定下 0/8 變數在任何設定下通過 0.5 門檻 。隨著 spike 放寬(c_spike 增大),PIP 普遍上升但仍均勻分散,說明變數間競爭激烈、無明顯贏家。
為何 Kitchen Sink DM t=-3.63 不能信任?
Kitchen Sink 的樣本外 QLIKE 改善 4.23% 看起來誘人,但存在以下問題:
- 多重比較 :256 個可能模型中,任何固定配置的樣本外優勢都需要更高的統計門檻
- SSVS 已明確拒絕 :Bayesian 框架在樣本內給每個變數 PIP < 0.36,即使強制全選也是反 SSVS 建議
- OOS 期間只有 752 天 :統計效力有限,4.23% 的改善幅度無法排除偶然性
- Spearman 提升有限 :0.252 → 0.306,排序相關性改善不如 QLIKE 數字顯眼
正確結論:Kitchen Sink 的 DM 顯著性是在 multiple testing context 下的雜訊,不是真實的預測力提升。
與 K821 的對比:兩次實驗,相同結論
| 實驗 | 候選變數類型 | 入選數/候選數 | 最高 PIP |
|---|---|---|---|
| K821 | 市場外生變數(VVIX、TLT vol、HYG spread...) | 0/8 | 0.4275(HYG) |
| K895 | VIX 衍生品 + 跨資產收益(VIX9D、VIX3M、GLD...) | 0/8 | 0.356(VIX_change) |
兩輪 16 個不同外生變數,結論完全一致: GJR-GARCH 方差方程在 SPY 上具有自足性,外生變數無法提供可靠的增量預測力。
研究意涵
對策略應用的啟示 :12/VIX 等簡單策略的有效性不在於「VIX 改善了 GARCH 的方差預測」,而在於 VIX 作為 水準的代理變數,直接調整持倉規模。GARCH 方差方程本身已充分捕捉了 VIX 所反映的波動率動態,疊加 VIX 衍生品變數是冗餘的。
對模型設計的啟示 :高持續性(+/2+≈0.98)的 GARCH 在方差方程中已極為「飢渴」,過去殘差和過去方差幾乎解釋了所有可預測的方差變動,外生變數的邊際貢獻近乎為零。
局限性
- 兩段式做法(先固定 GARCH,再用 SSVS 篩選方差殘差)可能遺漏聯合動態
- r² 是 的噪聲代理(Patton 2011),雖 QLIKE 對此 proxy-robust,但仍有低頻效應
- VIX9D 與 VIX3M 歷史較短(2011 後才有),長期穩定性需進一步驗證
- 日頻分析,未捕捉日內資訊
實驗腳本 :experiments/k895_ssvs_arx_garch.py
結果數據 :experiments/k895_ssvs_arx_garch_results.json
數據來源 :yfinance(SPY、VIX9D、VIX3M、TLT、GLD、UUP);期間:2011-01-03 至 2026-04-02
參考文獻 :So, Chen & Liu (2006) JRSS-C 55(2):201-224;George & McCulloch (1993) JASA;Patton (2011) QLIKE;Harvey (2016) |t|>3.0
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊