← Research Feed
研究2026/05/25 下午03:00

波動的波動率能預測動盪嗎?實證 NULL

VIX波動率風險管理實證研究策略回測

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

波動的波動率能預測市場切換嗎?一個直覺漂亮但實證失敗的故事

一個聽起來很合理的想法

當 VIX 從 15 漲到 35,每個投資人都知道市場進入動盪。但若我們再進一步問:「VIX 自己的波動率」(也就是波動的波動率,vol-of-vol,簡稱 VoV)會不會在市場真正爆炸前先動起來?這個概念在學術圈有不少正面文獻:Huang & Shaliastovich (2015) 把 VoV 視為一種獨立的風險因子,Park (2015) 在 Journal of Banking and Finance 找到 VoV 與尾端風險避險報酬有關,Baltussen et al. (2018) 用「unknown unknowns」框架描述 VoV 是一種「對風險本身的不確定性」。

直覺上這個故事很迷人:在大型風暴前,市場參與者會猶豫、會擺盪、會在恐慌與貪婪之間反覆橫跳,這份猶豫應該會反映在 VIX 自身的「抖動」上,而非 VIX 的水平本身。如果這個直覺是對的,VoV 就應該能比單看 VIX 更早抓到 regime change(高低波動切換),進一步幫助我們設計更穩健的避險或風險平價策略。

K649 就是針對這個假說的一場完整實證,而結果,是一個漂亮但誠實的 NULL。更糟的是:把 VoV 加進策略, 反而傷害績效 。本文完整呈現這份實證紀錄。

資料來源

  •  K649 實驗 :本研究完整代碼與結果見 experiments/k649/
  •  樣本期間 :2007-01-01 至 2026-03-27,共約 4,838 個交易日(19.1 年)
  •  資產 :SPY(S&P 500 ETF)作為標的、^VIX 作為波動率指數、^VVIX 作為「VIX 的波動率指數」
  •  資料源 :yfinance(公開市場數據)
  •  VoV 計算方法 :以 22 日滾動標準差(σ_VIX)、22 日 VIX 變動百分比(σ_VIX_pct)、VIX intraday range、GARCH(1,1) 條件波動率、以及 22 日 z-score 等五種口徑構造 VoV 訊號,全部以  t-1 的數據預測 t 之後的 regime (明確 lag,無 lookahead)
  •  Regime 定義 :以 VIX = 20 為門檻,將每日標記為高/低波動 regime;regime change 為當日相對 22 日前發生切換

描述統計:VoV 確實會「動」

先看 σ_VIX(22 日 VIX 滾動標準差)的分佈:均值 1.60、標準差 1.23、最小 0.30、最大 9.82、偏度 3.08、峰度 12.94。這個分佈非常右偏且厚尾,意思是大部分時候 VIX 抖動不大,但偶爾會出現極端劇烈的 VoV 爆衝。VVIX(市場對 VIX 自身波動率的隱含估計)均值 93.86、標準差 16.33、最大 207.59,同樣厚尾。

樣本期間共出現  287 次 regime change ,平均每年 14.4 次。其中 36.3% 的交易日處於高波動 regime(VIX > 20),而 17.8% 的交易日是 regime change 發生日。這個比例適中,足以做為機器學習的二元分類目標。

第一個發現:VoV 與 regime change 是「同步」而非「領先」

我們做了一個簡單但關鍵的檢查:算 VoV 與 regime change 在不同 lead-lag 下的相關係數。如果 VoV 真的有領先性,相關係數應該在「VoV 領先 regime change」(負 lag)的位置最高。

實際結果:

Lag (天)相關係數
-10(VoV 領先 10 天)0.241
-50.303
-30.341
-10.395
0(同期)0.481
+1(VoV 落後 1 天)0.504
+50.551
+100.563

訊息很清楚:相關係數是 單調遞增 的,到 lag = +10 還在上升。VoV 不是 regime change 的領先指標,它是 同期反映 + 落後追隨 指標。換句話說,當你看到 σ_VIX 變大時,regime change 通常已經發生或正在發生,這對前瞻性的預測或避險意義不大。

雖然 Granger 迴歸在 1 天、5 天、10 天 horizon 都顯示 σ_VIX 的迴歸係數有極高的統計強度(係數 0.36 / 0.28 / 0.23,對應的統計強度分別接近 18.46 / 13.73 / 11.23 達顯著水準)、R² 在 0.21 / 0.12 / 0.07,但這個顯著性並不等於「實務預測力」,因為下一步的 AUC 檢定告訴我們真實樣本外預測力幾乎不存在。

第二個發現:VoV 加入預測模型,AUC 改善不顯著

我們訓練了 5 個 logistic regression 模型來預測 regime change(22 日後的 VIX 高/低 regime):

模型特徵In-sample AUCOOS AUC
Model 1只看 VIX0.64690.5220
Model 2只看 σ_VIX0.57670.5411
Model 3VIX + σ_VIX0.48210.5393
Model 46 個 VoV 特徵全包0.6666 0.5868 
Model 5VIX + σ_VIX + VVIX0.66690.5955

樣本外(OOS)2020-01-01 之後的最佳 AUC 是 0.5868(Model 4),只比隨機猜測(0.5)高一點點。 Bootstrap 5,000 次 檢定 Model 4 vs Model 1 的 AUC 差異:mean difference = 0.0171、95% 信賴區間 [-0.0265, +0.0606]、達顯著水準(達顯著水準(顯著性 0.2184), 未達 5% 顯著水準 )。

換句話說:把所有 VoV 訊號加進模型,看似把 OOS AUC 從 0.52 拉到 0.59,但這個差異在 bootstrap 抽樣下無法排除運氣。重點是 OOS 期間恰好涵蓋 COVID 衝擊,這個極端事件可能正向膨脹了 AUC——如果連 COVID 都不能讓 VoV 有顯著預測力,平靜時期更不可能。

第三個發現:「暴風雨前的寧靜」並不存在

我們進一步檢查一個更精緻的假說:在 regime 從 calm(低波動)切換到 storm(高波動)的轉折前 5 天,σ_VIX 是否會異常壓低?這就是金融文獻常提到的「calm before storm」效應。

樣本內共有 143 次 calm-to-storm 轉折。轉折前 5 天平均 σ_VIX = 1.51、轉折當天 = 1.67、轉折後 5 天 = 1.86。對比無條件均值 1.60, 轉折前並沒有顯著壓低 (統計強度 -1.46,未達顯著水準)。前 vs 後比較雖然顯著(統計強度 -3.81、達顯著水準 0.0002),但這只是反映「regime 切換之後 VoV 上升」這個自然現象,不是預測訊號。

簡單說:σ_VIX 不會在風暴來臨前先「悄悄壓低」,也不會「先悄悄爆衝」,它就是和 regime 同步動而已。

第四個發現:把 VoV 加進策略,反而傷害績效

最殘酷的檢定來了。我們把 VoV 訊號加進一個標準的 12-VIX 風險平價策略(標的:SPY;當 VIX 上升時降低 weight),看看 VoV 是否能進一步提升風險調整後報酬:

策略CAGR年化波動風險調整後報酬最大回撤平均部位
Standard 12-VIX6.19%9.5%0.68-28.6%0.681
VoV-adjusted(硬切)2.64%5.19%0.527-15.41%0.370
VoV-soft(軟調整)4.44%7.03%0.653-22.17%0.524
Buy & Hold10.16%19.73%0.589-55.19%1.000

最關鍵的兩模型比較顯著(兩模型比較顯著-style):VoV-adjusted vs Standard 12-VIX 的  統計強度 = -2.811、達顯著水準 0.005 ,年化平均報酬差距 -3.71%。

意思非常清楚: 把 VoV 訊號加進來,會在統計上顯著傷害策略 。原因可能是 VoV 在 regime change 後才上升(前述發現一),導致策略在錯誤的時點降低部位(事後反應 = 賣在低點),平均 weight 從 0.68 降到 0.37 卻沒換來更好的風險調整後報酬。

OOS 期間(2020 之後)也是同樣結論:Standard 12-VIX 風險調整後報酬 0.795,VoV-adjusted 只有 0.677,VoV-soft 0.786 略低於 Standard。

第五個發現:「VoV 低 = 報酬高」是 VIX regime 假象

我們把 σ_VIX 分四組(Q1 最低、Q4 最高),算每組的 SPY 年化報酬:

分組年化報酬年化波動風險調整後報酬觀察數
Q1(VoV 最低)19.83%9.17% 2.162 1,204
Q27.19%13.07%0.5501,204
Q313.14%16.43%0.8001,204
Q4(VoV 最高)6.34%32.13%0.1971,204

乍看 Q1 風險調整後報酬高達 2.162,似乎 VoV 低就是好時機。但 ANOVA 檢定 F = 0.48、達顯著水準 0.6965( 未達顯著水準 ),四組均值差異無法排除隨機抽樣誤差。更關鍵的是:σ_VIX 與 VIX 高度相關,Q1 σ_VIX 同時也是 Q1 VIX,而 VIX 低的時候 SPY 報酬好本來就是已知效應。 這個 Sharpe 2.16 是 VIX-regime 的影子 ,不是 VoV 的獨立貢獻。

為什麼直覺漂亮卻實證失敗?

K649 的結果與本實驗室既往的 K448、J17、K1 完全一致:

  •  K448 :把 VVIX 加進波動率預測模型,NULL。
  •  J17 :用 VVIX 做尾端風險避險 overlay,NULL。
  •  K1 :把 SKEW、VVIX、VIX3M 等 options surface 變數一起測,全被 VIX 吸收。

這三個結果加上 K649,可以匯整成一個結論: VIX 水平本身已經充分內含大部分 vol-of-vol 訊號 。當 VoV 變高,VIX 通常也已經變高;模型同時看 VIX 和 VoV,VoV 變數並不會帶來額外的預測力。

這也呼應 HLZ (2016) 對因子「實證篩選」的提醒:學術文獻找到的 VoV 效應可能來自特殊樣本期、特定資產、或特定模型 spec。當我們在 19 年樣本、SPY、嚴格 lookahead-free 的回測下重做,效應消失。

限制與後續方向

誠實列出限制:

  1.  VIX = 20 的門檻是武斷的 ——若改 15 或 25,結論可能不同(但既有 K448/J17 的多門檻 robustness 顯示主結論穩健)。
  2.  OOS 期間(2020 之後)涵蓋 COVID ,可能正向膨脹 AUC;真實預測力可能更低。
  3.  GARCH(1,1) 用固定參數 ,不是 MLE 估計;改用 MLE 可能讓 σ_VIX 更精準但不太可能翻轉結論。
  4.  Logistic regression 是線性決策邊界 ——若 VoV 與 regime change 的關係是非線性,深度學習或 random forest 可能找到更好的訊號(但本實驗室既往用 GBM 測過 K1 同樣 NULL)。

可能的反向研究路徑:(a) 改測 短期 VoV spike (5 天內)作為短線交易訊號(K448 prior 顯示有限效果);(b) 改測 跨資產 VoV spillover (例如 BTC-VVIX 對 SPY 的領先);(c) 改測 選擇權 dealer gamma exposure  等更微觀的市場結構變數。但「VoV 直接預測 regime change」這條主路,K649 確認是死路。

給投資人的實務啟示

如果你的策略目前 只看 VIX ,K649 告訴你:你已經在使用最好的訊號。再去找一個 VoV 指標來「加強」VIX,平均而言會傷害你的績效(風險調整後報酬下降約 0.15、年化報酬下降 3.7%)。

如果你看到別人 promote「VVIX 領先 VIX 7 天」「σ_VIX 抓到 regime change」這類論述,請要求對方提供:(1) 至少 15 年樣本、(2) 嚴格 lookahead-free 的 OOS 績效、(3) 與單看 VIX 的兩模型比較顯著。三項缺一,就是樣本內 overfit。

研究的價值不在每個假說都被證實,而在誠實地把死路標出來,讓有限的研究資源投向真正有效的方向。K649 把 VoV 主路標為死路,這就是它的貢獻。

圖表

K649 五模型 IS vs OOS AUC:VoV 特徵 OOS 趨平

VoV 加入策略反而傷害:DM 強度 −2.81,年化 −3.71%


延伸閱讀

詳情

audience
research
experiment_refs
K649
audience_backfill
{"reason":"validator_371_historical_backfill","script":"scripts/backfill_audience.py","applied_at":"2026-05-26T16:21:47+00:00","article_id":"mile_20e96f77","previous_audience":"general"}

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
CBOE SKEW 真能補捉尾端風險嗎?我們把它和 VIX 一起檢驗
# CBOE SKEW 真能補捉尾端風險嗎?我們把它和 VIX 一起檢驗 ## 為什麼要研究 SKEW 指數 提到「市場恐慌」,多數讀者會立刻想到 VIX。但有另一個指數常被金融媒體稱作「黑天鵝指標」——CBOE SKEW 指數。它由 CBOE 用 S&P 500 的價外(OTM)選擇權價格反推 risk-neutral skewness 而來,理論上反映「投資人為極端尾端事件多付了多少保險費...
📄
情緒指標能預測波動嗎?Put-Call Ratio 的混合答案
# 情緒指標能預測波動嗎?Put-Call Ratio 的混合答案 ## 為什麼大家想用 Put-Call Ratio 預測波動 「市場恐慌時,大家會搶買保險」這個直覺幾乎是金融市場常識。當投資人擔憂下跌風險,他們會買進更多賣權(put)以對沖股票部位;反之牛市裡買權(call)成交占比拉高。把賣權與買權成交量相除得到的 Put-Call Ratio(PCR),就成了一個常被引用的「市場情緒晴...
📄
SPY 暴跌會「成串出現」嗎?條件式風險模型的真實答卷
## 為什麼這個問題重要 買股票的人最怕什麼?多數人會說「黑天鵝」、「閃崩」,但若你問風險經理或基金經理人,答案會稍微不同——他們真正怕的是「**虧損會不會成串出現**」。今天跌一根大棒,明天再跌一根,後天又跌一根,連續性的尾端事件比單一極端日更傷人,因為它會在你還來不及反應時把資本耗光。 這個現象在統計上有個名字:**VaR breach clustering**(風險值違規叢聚)。VaR(...