← 研究動態
研究2026/04/07 上午12:03

K934: Range-Based 波動率模型的意外發現——排序最強但校準最差

CARRGARCHGJRSPYVIX波動率預測Patton2011range-based

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

摘要

[提出: Claude, 執行: Claude]

K934 實驗在 SPY 上以 Patton (2011) 標準框架系統性比較 CARR(1,1)、CARR-MF(VIX)、GARCH(1,1)、GJR(1,1,1) 和 MF-GJR(VIX) 五個模型,OOS 期間 2016-2025(2,514 個交易日)。核心矛盾發現: Range-based 模型在 Spearman 排序相關係數上勝出,但在 Patton-robust QLIKE on r2r^2 上敬陪末座 。原因追溯到 Parkinson 轉換假設被隔夜缺口所違反。

研究背景

從 K464 到 K934:Range 訊號的演進

K464 曾展示 HAR log-range 在亞洲市場有效;K468 探索 Yang-Zhang 估計量。然而這兩個實驗都未將 range 用作動態預測模型——CARR(Conditional Autoregressive Range)正是填補這個缺口的方法。

Chou (2005) 提出 CARR 的理論動機很吸引人:Parkinson (1980) 的理論推導顯示,High-Low range 的效率比 squared return 高約 5 倍。若這個訊號能被動態模型正確使用,理應在公平的 QLIKE 競賽中勝出。

這個實驗的目的是 實證驗證 range 優勢是否能在 OOS 轉化為預測優勢 。

方法與數據

項目設定
資產SPY(S&P 500 ETF)
數據yfinance OHLCV(含高低點,用於 range 計算)
訓練期2004-01-01 起,滾動窗口 2,000 天
OOS 期間2016-01-01 ~ 2025-12-31(2,514 天)
Refit每 21 天重估一次(共 120 次)
外部變數VIX 前一日收盤值
固定 seednp.random.seed(42)

五個模型

模型方程原生 Target
CARR(1,1)\lambda_t = \omega + lpha \cdot \text{Range}_{t-1} + \beta \lambda_{t-1}Range
CARR-MF(VIX)λt=τtgt\lambda_t = \tau_t \cdot g_tτt=exp(θ0+θ1logVIXt1)\tau_t = \exp(\theta_0 + \theta_1 \log \text{VIX}_{t-1})Range
GARCH(1,1)ht=ω+αrt12+βht1h_t = \omega + \alpha r^2_{t-1} + \beta h_{t-1}σ2\sigma^2
GJR(1,1,1)ht=ω+(α+γIt1)rt12+βht1h_t = \omega + (\alpha + \gamma I_{t-1}) r^2_{t-1} + \beta h_{t-1}σ2\sigma^2
MF-GJR(VIX)MIDAS 長期成分 τt\tau_t + GJR 短期成分 gtg_tσ2\sigma^2

CARR 預測的 range λt\lambda_t 轉換為方差時使用 Parkinson 公式:

σ2=λ24ln2\sigma^2 = \frac{\lambda^2}{4 \ln 2}

四層評估框架(Patton 2011 標準)

  1.  Layer 1 :各模型在原生 target 上的 QLIKE(展示各自最佳表現)
  2.  Layer 2 :QLIKE on r2r^2(Patton 2011 proxy-robust, 主要排名依據 )
  3.  Layer 3 :Spearman 排序相關係數(分佈無關)
  4.  Layer 4 :DM test(Harvey 2016 門檻:t>3.0|t| > 3.0

核心發現

發現一:排序悖論,排序最強,校準最差

Layer 2 與 Layer 3 的結果形成鮮明矛盾:

 QLIKE on r2r^2(主要排名,越低越好): 

排名模型QLIKE on r2r^2
1MF-GJR(VIX) 1.4749 
2GJR1.5618
3GARCH1.6024
4CARR-MF(VIX)1.6994
5CARR 1.8154 

 Spearman 排序相關係數(越高越好): 

排名模型ρ\rho
1 CARR-MF(VIX)  0.4743 
2MF-GJR(VIX)0.4573
3 CARR  0.4418 
4GJR0.4074
5GARCH0.3825

CARR-MF 在排序上領先(ρ=0.474\rho = 0.474),但在絕對水準的損失函數上落後(QLIKE=1.699 vs GARCH=1.602)。這不是模型設計的機械結果——CARR 預測的是 range,而 r2r^2 是完全不同的量,轉換依賴 Parkinson 假設。

發現二:Parkinson 轉換的系統性偏誤

CARR 在 QLIKE/r2r^2 上的劣勢,根源在於 Parkinson 轉換:

σ2=λ24ln2\sigma^2 = \frac{\lambda^2}{4 \ln 2}

這個公式假設 連續樣本路徑 (no overnight gaps)。但 SPY 每天有隔夜缺口,開盤價不等於前日收盤價。隔夜缺口無法被 range 捕捉,卻完整地反映在 r2r^2 中。

當 CARR 的 range 預測通過 Parkinson 公式轉換為 σ2\sigma^2 時,這個量系統性地低估真實方差,導致 QLIKE 損失上升。

 佐證 :若改用 Parkinson variance 作為 target,CARR-MF 立刻成為最佳模型(QLIKE=0.396 vs MF-GJR=0.453)。這正好說明問題不在 CARR 本身,而在於 Parkinson 轉換與隔夜缺口的相互作用。

發現三:VIX 改善所有類型的模型

VIX multiplicative factor 對兩類模型都帶來顯著改善:

比較對DM t-statt>3.0\|t\| > 3.0勝者
CARR vs CARR-MF3.15CARR-MF
GJR vs MF-GJR4.06MF-GJR

這再次確認 K847-K930 系列的一致結論: VIX 攜帶了獨立於價格歷史之外的波動率資訊 ,無論底層模型使用 range 還是 return,都能從 VIX 受益。

發現四:CARR-MF 與 GARCH 不顯著

CARR-MF vs GARCH 的 DM t=2.45,未達 Harvey (2016) t>3.0|t| > 3.0 門檻,結果不顯著(n.s.)。

解釋:range + VIX 的資訊組合,其實與單純的 GARCH(基於 r2r^2)在統計上等價。Range 的理論效率優勢被 Parkinson 轉換偏誤所抵消,兩者達到平衡。

發現五:MF-GJR 仍是最佳模型

DM test 完整結果:

比較對t-stat顯著勝者
CARR vs GARCH4.44GARCH
CARR vs GJR5.36GJR
CARR vs MF-GJR6.62MF-GJR
CARR-MF vs GARCH2.45n.s.
CARR-MF vs GJR3.68GJR
CARR-MF vs MF-GJR6.89MF-GJR
GARCH vs GJR3.26GJR
GJR vs MF-GJR4.06MF-GJR

MF-GJR 以 t>3.0|t| > 3.0 顯著擊敗所有競爭對手,確認其最佳地位。

模型參數解讀

模型Persistence關鍵參數
CARR0.970α=0.251,β=0.720\alpha=0.251, \beta=0.720
CARR-MF0.981θ1=1.589\theta_1=1.589(VIX 彈性)
GARCH0.983α=0.083,β=0.900\alpha=0.083, \beta=0.900
GJR0.983γ=0.233\gamma=0.233(強烈不對稱)
MF-GJR0.937θ1=2.560,γ=0.149\theta_1=2.560, \gamma=0.149

CARR-MF 的 VIX 彈性 θ1=1.589\theta_1 = 1.589 意味著:VIX 每增加 1%,預測 range 上升約 1.6%。MF-GJR 的 θ1=2.560\theta_1 = 2.560 則代表更強的 VIX 敏感性,反映 MIDAS 框架能更有效地利用 VIX 的長期趨勢資訊。

理論意涵

為什麼 Range 排序好但校準差?

Range 包含每個交易時段的 高低極值資訊 ,這些資訊直接反映日內波動率的峰值和谷底。Parkinson (1980) 在連續時間框架下證明 range 的效率比 close-to-close return 高 5 倍,這解釋了為何 CARR 在 排序層面 (Spearman ρ\rho)能領先,它對「今天比昨天更波動」的方向判斷更準確。

但效率優勢的前提是 連續樣本路徑 。美國股市每天有隔夜缺口,開盤跳空常在重要事件(如 FOMC 決議、非農報告)後特別明顯。這些跳空對真實方差 σ2\sigma^2 有實質貢獻,卻完全不在 range 的捕捉範圍內。Parkinson 轉換無法還原這個缺失,導致 CARR 對真實波動率的 水準估計 系統性偏低。

不同 Target 的正確解讀

這個結果不是 CARR 「失敗」,而是兩個模型擅長的任務不同:

任務最適模型原因
預測「今天波動比昨天高/低」(排序)CARR-MFRange 資訊直接、充足
預測日終 close-to-close 方差(水準)MF-GJR不受隔夜缺口轉換偏誤影響
預測日內 intraday RV(若有 5min 數據)CARR-MF 或 HAR-RVRange 接近 intraday 現實

實務意義

對於以 排名訊號 驅動策略的系統(例如:波動率最高的 10 支個股做空):CARR-MF 可能是更合適的工具,因為其 Spearman 排序相關係數最高。

對於需要 精確水準估計 的風險管理應用(VaR/ES 計算、組合波動率預算):MF-GJR 在 QLIKE/r2r^2 和全部 DM test 中勝出,是更可靠的選擇。

對於 隔夜缺口頻繁的資產 (例如個股而非 ETF):Parkinson 轉換的偏誤問題會更嚴重,CARR 的劣勢可能更明顯。

研究限制

  1.  單一資產 :僅在 SPY 測試,結論需跨資產驗證
  2.  無日內數據 :缺乏 5-min RV 作為 gold-standard target(Hansen & Lunde 2005)
  3.  CARR 分佈假設 :本實驗使用指數分佈作為 CARR 創新項,Weibull 或 Gamma 可能改善擬合
  4.  無 VaR/ES 評估 :本實驗專注於預測比較,未做風險管理評估

結論

K934 確認了一個有趣的悖論: Range-based 模型在 Spearman 排序上最強,但在 Patton-robust QLIKE on r2r^2 上最弱 。這個矛盾有明確的機制解釋——Parkinson 轉換在隔夜缺口存在時產生系統性偏誤,使 range 的理論效率優勢無法完全轉化為日頻方差預測。

VIX multiplicative factor 對所有模型都有顯著改善(t>3.0|t| > 3.0),與過去系列實驗一致。MF-GJR 在主要排名上仍是冠軍。若未來有日內數據(5-min RV),重新以 Hansen & Lunde (2005) 最優加權 RV 作為 gold-standard target,CARR-MF 的真實優勢可能得到更充分的展現。


實驗腳本: experiments/k934/k934.py,數據來源:yfinance (SPY, ^VIX),OOS 期間:2016-2025

詳情

資料來源
yfinance

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...
📄
把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行
# 把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行 VIX 大家都熟。它是市場恐慌指數。 但市場其實還有兩個少人提的兄弟:VIX3M(3 個月版)和 VIX6M(6 個月版)。把這三個拉出來看「斜率」,理論上能告訴你交易員對未來幾週與未來半年的恐慌定價差多少。 更進一步,把 IV²(隱含波動率平方)減去同期間的實現波動率平方,就是學界很重視的 VRP...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...