VIX 真的會均值回歸,但你抓不到比 12/VIX 更多的肉
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
VIX 真的會均值回歸,但你抓不到比 12/VIX 更多的肉
一句話結論
VIX 確實會均值回歸(一階自相關 0.975、20 年平均 19.46、標準差 8.74,Spike 日佔比約 7.93%)—— 這是統計上百分百真實的事實。但本實驗 K503 用四種不同的 VIX 均值回歸訊號(z-score 反向買進、分級加碼、期限結構 VIX/VIX3M、加上半變異數調整)去打 SPY, 沒有任何一個策略能在嚴格統計檢定下贏過簡單的 12/VIX 加權 。換句話說, 12/VIX 公式本身已經把均值回歸內建進去了 ,你再額外疊一層「VIX 暴衝就抄底」的訊號,多半只是製造交易成本與績效波動。
這是一個漂亮的 NULL 結果,也再次確認了我們在 K301 提出的 Claim 1: VIX 在波動率交易中是充分統計量(sufficient statistic) 。
為什麼會做這個實驗
這個問題的動機很單純: 既然 VIX 會均值回歸,那為什麼不利用?
VIX 的均值回歸是教科書級的事實。Whaley (2009) 和後續一票文獻都記錄過:高 VIX 之後,未來幾週到幾個月通常會回落;低 VIX 之後,常常會反彈。直覺上,這應該可以變成一個交易訊號 —— 當 VIX 暴衝(z-score > 2)就重押 SPY,等市場恐慌過去;當 VIX 太低(z-score < -1)就減碼,等回歸。
但「直覺合理」和「能在統計上打贏 benchmark」是兩回事。我們已經在過去多個實驗(K301、K877、K1073 等 VIX 家族)中發現一個反覆出現的現象: VIX 本身就是一個極強的單一狀態變數 ,幾乎所有試圖在它之上加額外訊號的設計,都很難在嚴格的同期間比較中存活。K503 的目的就是把 VIX 均值回歸這個「最直觀的訊號」徹底測一次,看它能不能擠出超額 alpha。
資料與方法
資料來源 :
- 標的:SPY(S&P 500 ETF,做多曝險)、GLD(黃金 ETF,作為 50/50 防禦組合配對)
- 訊號:^VIX(CBOE 30 天隱含波動率)、^VIX3M(3 個月期 VIX)
- 抓取:yfinance
- 樣本期:2006-01-03 ~ 2025-12-31,共 4,967 個交易日(涵蓋 GFC、復甦、長多、COVID 衝擊四個完整 regime)
- 交易成本:往返 0.05%(保守設定)
- 無風險利率:年化 4%
訊號設計 (四個策略 + 一個混合):
| 策略 | 邏輯 |
|---|---|
| S1 VIX Spike Buy | VIX 的 63 日 z > 2 時買進,z < 0.5 時平倉 |
| S2 VIX Z-Score | 分級加碼:z>2 → 100%、z>1 → 75%、|z|<1 → 50%、z<-1 → 25% |
| S3 Term Structure | 用 VIX/VIX3M 比率:weight = clip(1.5 - 比率, 0.2, 1.0) |
| S4 Combined VIX+SV | S2 再疊半變異數比率(RS⁻/RS⁺)做不對稱調整 |
| Hybrid 12/VIX + MR | 在 12/VIX 上加均值回歸 overlay(Mild / Medium / Strong 三種強度) |
Benchmark :
- BM Buy & Hold:純買進持有 SPY 或 50/50 SPY-GLD
- BM 12/VIX:每天用 12/VIX 計算 SPY 權重(高 VIX 自動降低曝險)
Lookahead 防護 :所有策略都明確使用 t-1 的訊號 × t 期報酬(weights × ret 的 weights 是用 t-1 收盤計算)。如果這個 lag 沒做好,VIX 策略最容易看似「神準」其實只是偷看到當天暴跌。本實驗已經在程式中嚴格 enforce。
結果一:12/VIX 是國王
先看 SPY 單側組合的整體表現:
| 策略 | 年化報酬 | 年化波動 | 風險調整後報酬 | 最大回撤 | 換手 |
|---|---|---|---|---|---|
| Buy & Hold SPY | 8.39% | 19.54% | 0.43 | -83.18% | 0 |
| 12/VIX × SPY | 14.84% | 9.26% | 1.60 | -15.42% | 175 |
| S1 Spike Buy | -4.89% | 12.94% | -0.38 | -105.5% | 136 |
| S2 Z-Score | -10.24% | 14.06% | -0.73 | -214.9% | 301 |
| S3 Term Structure | 11.65% | 9.48% | 1.23 | -22.72% | 106 |
| S4 Combined SV | -4.74% | 12.63% | -0.37 | -109.7% | 338 |
幾個關鍵觀察:
1. 12/VIX 的風險調整後報酬 1.60 直接碾壓所有對手 。它的年化報酬比 Buy & Hold 高 6.46 個百分點,波動只有它的一半,最大回撤從 -83% 壓到 -15%。Calmar 比率 0.96 表示「賺多少 ≈ 最大回撤」,這是相當乾淨的曲線。
2. S1、S2、S4 全部負報酬,且 -100% 以上的最大回撤代表使用了槓桿後爆倉 。S2 z-score 分級加碼的最大回撤達 -214.9%,統計強度 -10.35(達顯著水準,極度顯著),是「均值回歸抄底反而加速死亡」的反面教材。問題在於:z>2 暴衝時加倉,等於在市場仍在恐慌、波動仍在擴張時加碼曝險,後續往下還能再往下。
3. 唯一能跟 12/VIX 同列比較的是 S3 期限結構 (風險調整後報酬 1.23)。VIX/VIX3M 比率本身就是一個強訊號(contango / backwardation 對未來行情有預測力),但與 12/VIX 的兩模型比較顯著性並不通過嚴格統計(HLZ 2016 標準需 |統計強度| > 3.0)。
結果二:跨期間穩健性
K503 把樣本切成四個子期間,看 12/VIX 是不是只在某個 regime 才好:
| 期間 | S1 | S2 | S4 | 12/VIX | Buy & Hold |
|---|---|---|---|---|---|
| 2006-2009 GFC | -0.43 | -1.00 | -0.61 | +0.90 | -0.16 |
| 2010-2014 復甦 | -0.36 | -0.60 | -0.31 | +1.86 | +0.77 |
| 2015-2019 多頭 | -0.32 | -0.56 | -0.17 | +1.84 | +0.66 |
| 2020-2025 COVID+ | -0.34 | -0.59 | -0.17 | +1.85 | +0.60 |
12/VIX 在四個 regime 全部正報酬、全部贏 Buy & Hold;S1/S2/S4 在四個 regime 全部負報酬 。這不是運氣問題,這是訊號本身的問題。換言之,VIX 均值回歸訊號 不是某個年份失靈 ,而是 結構性地無法產生超額報酬 。
結果三:Hybrid 也救不了
實驗還測試了一組「12/VIX 為主、上面加一層均值回歸 overlay」的混合策略(Mild / Medium / Strong 三種強度)。理論上這應該是最公平的:保留 12/VIX 的風險管理本體,只在邊際上加 overlay。
| Hybrid 強度 | 年化報酬 | 風險調整後報酬 | 兩模型比較 vs 12/VIX |
|---|---|---|---|
| 12/VIX + MR Mild | 9.31% | 0.96 | 統計強度 -19.56(達顯著水準,極度顯著惡化) |
| 12/VIX + MR Medium | 5.88% | 0.58 | 統計強度 -19.32(達顯著水準) |
| 12/VIX + MR Strong | -1.94% | -0.17 | 統計強度 -18.56(達顯著水準) |
三個混合都在嚴格統計下顯著差於純 12/VIX,且強度越高越差。這非常清楚地告訴我們: 12/VIX 已經把均值回歸該抓的部分抓完了 ,再額外加 overlay 只是把訊號從一個乾淨的版本污染成更吵雜的版本。
為什麼 12/VIX 已經內建均值回歸?
仔細想想 12/VIX 的權重函數,會發現它本身就是均值回歸 logic 的一個極簡實現:
- VIX 暴衝(例如 35)→ 12/35 = 0.34, 自動降低 SPY 曝險到 34% (保護期)
- VIX 回落(例如 15)→ 12/15 = 0.80, 自動加回曝險到 80% (再進場)
- VIX 極低(例如 10)→ 12/10 = 1.20, 自動加碼到 120% (享受平靜時的高曝險)
這個 weight schedule 完全就是「高 VIX → 退、VIX 降 → 進」的均值回歸劇本,而且 它是連續、平滑、無門檻、無交易成本爆衝 的版本。相對之下,z-score 分級或 spike-buy 是 不連續、有門檻、換手率高(S2 換手 301%、S4 換手 338%) 的離散版本,本質上是把同一個資訊用更糟的形式表達。
從訊號工程的角度,12/VIX 是 VIX 這個原料的 canonical, lossless 提煉 ;其他訊號則是它的 lossy 變形。
與其他研究的呼應
這個結論不是孤立的:
- K301 Claim 1(VIX sufficiency) :在波動率擇時策略中,VIX 是充分統計量,加額外訊號(HAR-RV、隱含尾部、跨資產相關等)幾乎都無法在嚴格檢定下改善。
- K877(GS 跨資產驗證) :VIX 對不同資產(SPY / GLD / TLT)的解釋力都遠超它們自己的歷史波動率訊號。
- K1073(VIX family 系列) :VIX9D、VIX3M、VIX6M 等期限結構變數雖然有額外資訊,但在實際策略層級難以擠出顯著 alpha。
K503 加入這條 evidence chain,把「VIX 均值回歸訊號」這個最直觀的角度也釘死。
給讀者的三個 takeaway
1. 真實但不可交易的訊號很常見 。VIX 均值回歸在統計上 100% 真實(自相關 0.975),但這不代表你能用它賺錢。一個訊號要 actionable,需要的是「 邊際資訊量 大於 交易成本 + 既有訊號 」,而不只是統計顯著。
2. 簡單的訊號往往已經吃飽 。12/VIX 是個 30 年前就有人提過的極簡公式,但它在 20 年的長樣本中持續贏過花俏的 z-score / 期限結構 / 半變異數 overlay。當你發現一個簡單訊號很強,不要急著「優化」它,因為大部分優化反而把它劣化。
3. 研究誠實是核心資產 。我們完全可以選擇只報告 S3 期限結構的 1.23(看起來不錯),但跨期間穩健性、與 12/VIX 的兩模型比較顯著性、以及 hybrid 全敗的結果,誠實地告訴我們這條路走不通。把 NULL 結果如實寫出,是這個平台的基本盤,也是 VIX sufficiency 這條 claim 越來越站得住腳的原因。
圖表


詳情
- audience
- research
- experiment_refs
- K503
- audience_backfill
- {"reason":"validator_371_historical_backfill","script":"scripts/backfill_audience.py","applied_at":"2026-05-26T16:21:47+00:00","article_id":"mile_73161403","previous_audience":"general"}
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊