← Research Feed
一般讀者2026/05/17 上午11:00

VIX 進入波動率方程式:六分之一的 OOS 改進,但摸到 GARCH 的天花板

GARCHVIX波動率預測模型比較樣本外

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

VIX 進入波動率方程式:六分之一的 OOS 改進,但摸到 GARCH 的天花板

一句話結論

把「市場恐慌指數 VIX」 直接塞進 GARCH 的變異數方程 ,相對於常見的 GJR-GARCH 基準,能讓 SPY 的樣本外波動率預測 QLIKE 改善約  6.3% ——但這個改進在最嚴格的學術門檻下 還沒過關 ,且模型參數出現「邊界退化」的跡象,提醒我們:VIX 帶來的信號雖然真實,卻 重塑了 GARCH 的內部結構 而不只是錦上添花。本實驗(K438)也同時證實:先前在迴歸架構下風光的  VRP(波動率風險溢酬)在 GARCH-X 框架裡幾乎沒有額外貢獻 ——VIX 一旦進場,VRP 的訊號就被吃光了。

K438:GJR baseline vs 三個 GARCH-X 變體的樣本外 QLIKE 比較


為什麼要做這件事

波動率預測在金融實務上的用途很廣:選擇權定價、風險管理(VaR / ES)、波動率目標(Volatility Targeting)策略、衍生性商品避險。學術上的主流工具是  GARCH 家族 ——它假設「明天的波動率」是「今天波動率」+「今天衝擊」的某種加權組合。GJR-GARCH 進一步加了「壞消息比好消息更會放大波動率」的不對稱性。

但 GARCH 有個天生限制:它 只看歷史報酬 。市場其實還有一個更直接的「未來波動率指標」—— VIX 。VIX 是用 S&P 500 選擇權倒推出來的「市場參與者對未來 30 天波動率的定價」,本質上是一個 前瞻性、含選擇權交易者集體預期 的訊號。如果 GARCH 只用過去報酬資訊,那 VIX 應該帶來新的訊息。

這就是  GARCH-X  的概念:在標準 GARCH 的變異數方程上 外掛 一個外生變數 X(X 可以是 VIX、VRP、總體變數、流動性指標)。先前的相關實驗(K430、K433、K436)已經證明:

  • VRP(VIX − 已實現波動率)在「迴歸架構」下對未來報酬有顯著預測力(K436 DM 比較達顯著水準)。
  • VIX 的訊息在「日頻」明顯。

但 GARCH-X 框架 過去多次嘗試外掛 VIX、VIX 期限結構、跨國 panel 都失敗。 K438 的問題很單純:給 GARCH 一個誠實的最後機會——這次直接寫 MLE、固定 lookback window、嚴格樣本外、跑足完整檢定,看看 VRP 與 VIX 在變異數方程裡到底能不能拿到分數。 


資料與設定

項目設定
標的SPY(S&P 500 ETF)
VIX 來源yfinance ^VIX
樣本期間2005-02-03 ~ 2026-03-25(共 5,318 個交易日)
樣本外期間2023-01-03 ~ 2024-12-31(502 個交易日)
Rolling window2,000 天
重新估計頻率每 21 天(約一個月)
共重估次數24 次
估計方法自寫 MLE(L-BFGS-B + 多起始點)

 比較的四個模型 :

  1.  GJR baseline :標準 GJR-GARCH(1,1)(不對稱效應)
  2.  GARCH-X(VRP) :GJR + 變異數方程加 VRP(lagged 1 day)
  3.  GARCH-X(VIX) :GJR + 變異數方程加 VIX²/252(lagged 1 day)
  4.  GARCH-X(VRP+VIX) :兩者同時加進去

 所有外生變數都已確認 lag 1 期 (程式碼第 109-119 行),不存在用「今天的 VIX 預測今天的波動率」這類前視偏誤。

描述統計

變數平均標準差偏態峰度
報酬率(%)0.0471.198-0.00015.36
VRP(lagged)3.5165.502-2.58316.46
VIX²/252(lagged)1.7542.1695.16236.52
VIX 水準19.188.622.549.66

報酬率呈現典型的 胖尾 (峰度 15.36,遠大於常態的 3);VIX²/252 偏態極高(5.16),代表少數極端風險事件主導了長尾。所有外生變數的 ADF 單根檢定都拒絕單根(達顯著水準),符合 GARCH-X 框架對平穩性的要求。


樣本內估計:誰拿到了分數?

把 24 個 rolling window 全跑完之後,看「整個樣本內」的單次估計,比較 AIC / BIC 與 delta(外生變數係數)的統計強度:

模型參數量NLLAICBIC持續性
GJR baseline42568.995145.985168.380.988
GARCH-X(VRP)52543.445096.885124.880.995
 GARCH-X(VIX) 52509.21 5028.42  5056.42 0.822
GARCH-X(VRP+VIX)62509.215030.415064.020.824

 樣本內贏家是 GARCH-X(VIX) ,AIC/BIC 雙雙最低。但這裡已經出現一個 警訊 :GARCH-X(VIX) 的持續性從 baseline 的 0.988 掉到 0.822, ω(intercept)和 α(ARCH 項)幾乎被估到邊界 1e-8 。這代表什麼?答案後面會詳細談。

 Delta 係數的統計強度 (外生變數對變異數的貢獻):

模型Delta標準誤統計強度達顯著水準?
GARCH-X(VRP)0.005420.0004213.04
GARCH-X(VIX)0.132560.025745.15
 VRP+VIX 同時放 
─ Delta(VRP)0.000110.00241 0.04   
─ Delta(VIX)0.131090.031154.21

 這張表是整個 K438 最重要的訊息之一 :VRP 單獨放,係數 統計強度高達 13.04 (看起來很強);但 一旦把 VIX 也放進去,VRP 的係數立刻塌到接近零(強度 0.04) 。VIX 在 GARCH-X 框架裡 完全吸收 了 VRP 的訊號。

換句話說: VRP(=VIX − RV)在 GARCH-X 變異數方程裡是冗餘變數 ——因為 GARCH 自身的 h_{t-1} 遞迴項已經涵蓋了 RV 的歷史資訊;VRP 真正帶來的「新訊息」其實就是  VIX 的成分 。

K438:δ 係數點估計與 95% 信賴區間(Harvey t>3 顯著性檢定)


樣本外:真正的考驗

樣本內好看不算數,學術上能不能站得住腳,靠的是 樣本外 OOS  表現。我們用  QLIKE (衡量波動率預測準確度的標準損失函數)和 MSE:

模型OOS QLIKEOOS MSEOOS MAE
GJR baseline0.55681.15340.7080
GARCH-X(VRP)0.55131.11970.6873
 GARCH-X(VIX)  0.5219 1.13380.6813
GARCH-X(VRP+VIX)0.52441.13540.6817

 GARCH-X(VIX) 的 QLIKE 比 baseline 改善 6.27% ,VRP-only 只改善 0.98%(幾乎沒有),組合模型改善 5.82%。

兩模型比較檢定

只有 QLIKE 數字下降不夠,必須做 兩模型比較檢定 確認改進不是運氣:

模型 vs Baseline比較統計量標準 p重抽樣 p
GARCH-X(VRP)0.3800.7040.623
 GARCH-X(VIX)  1.961  0.050  0.027 
GARCH-X(VRP+VIX)1.8230.0680.039

 關鍵讀法 :

  •  GARCH-X(VRP)  樣本外完全沒過 →  與 K436 的迴歸結果不一致 。理由如前所述:GARCH 的遞迴結構已經吃掉了 VRP 的訊息。
  •  GARCH-X(VIX)  標準 p 值 0.050(剛好觸線),重抽樣 p 值 0.027(達顯著水準)。
  •  GARCH-X(VRP+VIX)  兩個 p 值都接近邊緣,但 VRP 的係數在這個模型已經塌到零,等於是 VIX-only 加了一個冗餘變數。

但——這裡有一個學術界更高的標準: 嚴格學術門檻(HLZ 2016 多重檢定文獻) 。該文獻主張,在金融研究反覆挖掘變數的環境下,「兩模型比較統計量超過 3.0」才算真正可信。 K438 最強的統計量只有 1.96,距離 3.0 還有不小的距離。 

 因此 K438 的判決是「部分正面(PARTIAL POSITIVE)」 :VIX 確實貢獻了訊號,但 還沒強到能在最嚴格的學術門檻下發表為新發現 。這個誠實的判讀方式對應我們專案一貫的「研究誠實原則」——數字沒到就是沒到,不靠話術過關。


為什麼 GARCH-X(VIX) 的 ω 和 α 會塌到 0?

這是 K438 最有趣的副產品。GARCH-X(VIX) 的最佳估計裡:

  • ω(常數項)≈ 1e-8(基本上是零)
  • α(最近一筆衝擊的權重)≈ 1e-8(基本上是零)
  • γ(壞消息不對稱權重)≈ 0.363
  • β(過去波動率慣性)≈ 0.641
  • δ(VIX²/252 的係數)≈ 0.133

 直觀解讀 :模型在告訴我們「不需要常數,也不需要對稱的 ARCH 項——只要有 VIX,VIX 就 自己當常數+前瞻訊號 用」。

換句話說, VIX 進入變異數方程時,並不是「在 GARCH 上加一個 X」,而是「VIX 取代了 GARCH 的部分結構」 。GARCH-X(VIX) 在這個資料集上 退化 成接近:

h_t ≈ γ·壞消息衝擊 + β·h_{t-1} + δ·VIX²/252

這既是好消息(VIX 確實有資訊量、能取代 baseline 結構),也是壞消息( 模型撞到參數邊界,標準誤可能不可信 ,外推到其他樣本期或其他資產時行為可能不穩定)。

K438:24 個 rolling refit 視窗下 δ 係數的穩定性

參數穩定性

把 24 個 rolling window 看下來:

參數平均標準差區間翻號次數
GARCH-X(VRP) δ0.005190.00037[0.00443, 0.00551]0
GARCH-X(VIX) δ0.129400.00598[0.12033, 0.13937]0
共構 δ_VRP-0.000510.00061[-0.00166, 0.00031]5
共構 δ_VIX0.136610.00870[0.11674, 0.15084]0

兩個單變數模型的 δ 都 24/24 視窗同號、變動小 ——這是「真效應」的特徵。但 共構模型裡的 δ_VRP 翻了 5 次號 ——是「冗餘變數被殘餘隨機性推著走」的典型樣貌,再次印證 VRP 在 VIX 出場後沒戲。


哪個情境下 VIX 最有用?

K438 還做了 情境分析 :把樣本外 502 天按 VIX 水準切成三段。

VIX 區段天數GJR baseline QLIKEGARCH-X(VIX) QLIKE改善幅度
低 VIX(<15)2340.06420.0135 −79.0% 
中 VIX(15–25)2610.87790.8667−1.3%

 這張表很驚人 :GARCH-X(VIX) 在 低 VIX 環境下改善幅度高達 79% ,但中 VIX 環境只剩 1.3%。

直觀解釋:低 VIX 期間市場很「平靜」,GJR baseline 容易因為偶發小衝擊「過度反應」(α 項把單日跳動放大);而 VIX 在低水準時 比歷史報酬更早確認「市場真的安定」 ,把預測波動率拉到正確的低位。但中 VIX 環境裡市場本來就劇烈,VIX 與已實現波動率走勢同步,邊際資訊量自然下降。

 對實務的意涵 :如果你用波動率預測來做 槓桿/縮放決策 (VT 策略、選擇權部位 sizing),在低 VIX 期間用 VIX 做外生變數的好處會被放大;但在恐慌期,傳統 GARCH 反而沒輸多少。


三個關鍵洞察

 洞察 1:VIX 在變異數方程裡帶來訊息,VRP 沒有。  這顛覆了從 K436 等迴歸實驗推論「VRP 有預測力 → VRP 應該在 GARCH-X 裡也有用」的直覺。原因:迴歸架構下沒有 h_{t-1} 的遞迴項,VRP 的「VIX 部分」與「歷史 RV 部分」都會貢獻訊號;但 GARCH 的 β·h_{t-1} 已經吸收 RV 訊息,VRP 的真正增量訊息其實只剩 VIX 本身。

 洞察 2:VIX 不是錦上添花,而是改寫 GARCH 結構。  ω 和 α 塌到 0 不是 bug,而是模型告訴你「VIX 當常數+前瞻訊號就夠了」。這對「把 GARCH-X 當 GARCH 的微調」這種傳統認知是個打臉。模型的詮釋與外推必須以「結構性替換」的角度重新看,不能套用傳統 GARCH 的解讀。

 洞察 3:6.3% 的改進在學術門檻外,在實務上仍可能值得。  嚴格統計門檻文獻(統計量 > 3.0)下,K438 的最強改進(1.96) 不算發現 。但對實務交易者來說,OOS QLIKE 改 6.3%(重抽樣 達顯著水準(顯著性 0.027))+ 低 VIX 環境改 79% 已經有實用價值——前提是 承認模型結構的不穩定性 並做敏感性測試。


限制與下一步

 目前的限制 (誠實列出):

  1. 自寫 MLE 沒有 BHHH/OPG 標準誤,只用數值 Hessian——標準誤在邊界附近 可能不可信 。
  2. VRP 用 VIX(30天 IV)對 21天 RV,存在期限不匹配。
  3. OOS 期間(2023–2025)相對平靜,高 VIX 樣本不夠多。
  4. δ 約束在 [-1, 1],極端值未探索。
  5. h_t 正性靠 max(h, 1e-8) 截斷而非 log-volatility 重參數化。

 未來方向 :

  • 用  realized kernel  或  5-min RV  取代 squared returns 當 RV proxy
  • 用  VIX9D  或  VIX 期限結構斜率  而非 VIX level 平方
  • 改用  log-GARCH-X  重參數化避開邊界 + 多起始點 ≥100 的標準
  • 跨資產驗證(QQQ / IWM / 個股 ETF)測試結論的普適性

為什麼這個結果重要

K438 不是「發現新王者」式的故事,而是一個 收斂性實驗 :

  • 它 確認 :VIX 在變異數方程裡有不可忽視的邊際價值。
  • 它 否定 :VRP 在 GARCH-X 框架裡是有效的外生變數。
  • 它 揭露 :GARCH-X(VIX) 的 ω、α 邊界退化是模型結構性問題,不是統計噪音。
  • 它 示範 :「迴歸架構下顯著的變數,在 GARCH-X 裡未必同樣顯著」——這是實證金融常見的陷阱,值得寫進方法論教材。

對讀者更重要的訊息是: 6.3% 的 QLIKE 改進聽起來不大,但分到不同 VIX 區段就會看到 79% 的大改進與 1.3% 的微小改進並存 。波動率模型的價值經常 集中在某些情境下被釋放 ,而不是均勻分佈在所有交易日。實務應用時, 情境分析比平均改進更有指導性 。


資料來源

  •  報酬率 :yfinance,SPY 收盤價,2005-02-03 ~ 2026-03-25(5,318 個交易日)
  •  VIX :yfinance,^VIX 指數收盤價,同期間
  •  VRP 構造 :VIX − sqrt(252 × 21日滾動 RV), 滯後 1 期 進入模型(程式碼 vrp.shift(1)
  •  OOS 期間 :2023-01-03 ~ 2024-12-31(502 個交易日)
  •  完整實驗檔 :experiments/k438/k438_garchx_vrp_results.jsonexperiments/k438/k438_garchx_vrp.py
  •  相關實驗 :K430(VRP 樣本內預測力)、K433(SSVS 變數選擇)、K436(VRP 日頻迴歸預測力)
  •  參考文獻 :
    • Han & Kristensen (2014) "Asymptotic Theory for QMLE in GARCH-X" Econometric Theory 30(1): 95–130
    • Engle & Rangel (2008) "Spline-GARCH" Review of Financial Studies 21(3): 1187–1222
    • Bollerslev, Tauchen & Zhou (2009) "Expected Stock Returns and Variance Risk Premia" Review of Financial Studies 22(11): 4463–4492
    • HLZ (2016) "Editorial: Replication in Financial Economics" Critical Finance Review 5: 1–9

詳情

errata
{"update_at":"2026-05-08T12:14:12.187823+00:00","update_action":"k438_k681_image_regen_2026_05_08","update_history":[{"at":"2026-05-08T12:14:12.187823+00:00","action":"k438_k681_image_regen_2026_05_08","summary":"重新繪製 K438(3 張)與 K681(2 張)原始圖(PNG 已從 disk 遺失),上傳 Supabase 並修復文章中的 broken-image 引用。圖表數據完全來自 k438_garchx_vrp_results.json / k681_results.json(K681 重跑 backtest 對齊 stored MDD:-8.58% / -34.19% identical)。"}],"update_summary":"重新繪製 K438(3 張)與 K681(2 張)原始圖(PNG 已從 disk 遺失),上傳 Supabase 並修復文章中的 broken-image 引用。圖表數據完全來自 k438_garchx_vrp_results.json / k681_results.json(K681 重跑 backtest 對齊 stored MDD:-8.58% / -34.19% identical)。"}
experiment_refs
K438

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
美國 VIX 預測台灣 0050 的波動率?跨市場時差讓訊號被稀釋的真實案例
# 美國 VIX 預測台灣 0050 的波動率?跨市場時差讓訊號被稀釋的真實案例 ## 一個直覺:美國的恐慌指數,是不是台灣交易日早盤的「先行指標」? 很多投資人都注意過一件事:美國股市收盤之後,台灣股市才剛開盤。當美股當晚劇烈震盪、VIX(波動率指數,俗稱恐慌指數)大幅跳升時,隔天早上 09:00 一開盤,台灣 0050 似乎也會跟著動盪。這個「美國先動、台灣再動」的時差結構,看起來像是一個...
📄
門檻 ARMA 真的能打贏 GARCH 嗎?一場關於波動率預測的誠實檢驗
# 門檻 ARMA 真的能打贏 GARCH 嗎?一場關於波動率預測的誠實檢驗 ## 一句話結論 我們花了相當功夫,在 SPY 上實作了 Chen, Liu, Gerlach (2011) 提出的「門檻 ARMA(TARMA)」波動率模型,與經典的 GARCH 家族在十年資料上正面交鋒。最後得到的結論很樸實:**TARMA 沒有顯著贏過 GARCH**,連最寬鬆的比較標準也過不了關。這是一篇關於...
📄
加上長記憶就能贏過 VIX?我們把兩個強模型合在一起,結果反而爆炸
# 加上長記憶就能贏過 VIX?我們把兩個強模型合在一起,結果反而爆炸 ## 一個直覺得不能再直覺的研究問題 做波動率預測的人,幾乎人人都同意兩件事: 第一,**VIX 指數很有用**。它是市場用選擇權報價反推出來的「未來 30 天預期波動率」,它把整個 SPX 選擇權市場的集體共識壓縮成一個數字。先前的實驗 K889 已經確認,把 VIX 當作外部驅動因子放進 GJR-GARCH 模型(這...