K934: Range-Based 波動率模型的意外發現——排序最強但校準最差
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
摘要
[提出: Claude, 執行: Claude]
K934 實驗在 SPY 上以 Patton (2011) 標準框架系統性比較 CARR(1,1)、CARR-MF(VIX)、GARCH(1,1)、GJR(1,1,1) 和 MF-GJR(VIX) 五個模型,OOS 期間 2016-2025(2,514 個交易日)。核心矛盾發現: Range-based 模型在 Spearman 排序相關係數上勝出,但在 Patton-robust QLIKE on 上敬陪末座 。原因追溯到 Parkinson 轉換假設被隔夜缺口所違反。
研究背景
從 K464 到 K934:Range 訊號的演進
K464 曾展示 HAR log-range 在亞洲市場有效;K468 探索 Yang-Zhang 估計量。然而這兩個實驗都未將 range 用作動態預測模型——CARR(Conditional Autoregressive Range)正是填補這個缺口的方法。
Chou (2005) 提出 CARR 的理論動機很吸引人:Parkinson (1980) 的理論推導顯示,High-Low range 的效率比 squared return 高約 5 倍。若這個訊號能被動態模型正確使用,理應在公平的 QLIKE 競賽中勝出。
這個實驗的目的是 實證驗證 range 優勢是否能在 OOS 轉化為預測優勢 。
方法與數據
| 項目 | 設定 |
|---|---|
| 資產 | SPY(S&P 500 ETF) |
| 數據 | yfinance OHLCV(含高低點,用於 range 計算) |
| 訓練期 | 2004-01-01 起,滾動窗口 2,000 天 |
| OOS 期間 | 2016-01-01 ~ 2025-12-31(2,514 天) |
| Refit | 每 21 天重估一次(共 120 次) |
| 外部變數 | VIX 前一日收盤值 |
| 固定 seed | np.random.seed(42) |
五個模型
| 模型 | 方程 | 原生 Target |
|---|---|---|
| CARR(1,1) | \lambda_t = \omega + lpha \cdot \text{Range}_{t-1} + \beta \lambda_{t-1} | Range |
| CARR-MF(VIX) | , | Range |
| GARCH(1,1) | ||
| GJR(1,1,1) | ||
| MF-GJR(VIX) | MIDAS 長期成分 + GJR 短期成分 |
CARR 預測的 range 轉換為方差時使用 Parkinson 公式:
四層評估框架(Patton 2011 標準)
- Layer 1 :各模型在原生 target 上的 QLIKE(展示各自最佳表現)
- Layer 2 :QLIKE on (Patton 2011 proxy-robust, 主要排名依據 )
- Layer 3 :Spearman 排序相關係數(分佈無關)
- Layer 4 :DM test(Harvey 2016 門檻:)
核心發現
發現一:排序悖論,排序最強,校準最差
Layer 2 與 Layer 3 的結果形成鮮明矛盾:
QLIKE on (主要排名,越低越好):
| 排名 | 模型 | QLIKE on |
|---|---|---|
| 1 | MF-GJR(VIX) | 1.4749 |
| 2 | GJR | 1.5618 |
| 3 | GARCH | 1.6024 |
| 4 | CARR-MF(VIX) | 1.6994 |
| 5 | CARR | 1.8154 |
Spearman 排序相關係數(越高越好):
| 排名 | 模型 | |
|---|---|---|
| 1 | CARR-MF(VIX) | 0.4743 |
| 2 | MF-GJR(VIX) | 0.4573 |
| 3 | CARR | 0.4418 |
| 4 | GJR | 0.4074 |
| 5 | GARCH | 0.3825 |
CARR-MF 在排序上領先(),但在絕對水準的損失函數上落後(QLIKE=1.699 vs GARCH=1.602)。這不是模型設計的機械結果——CARR 預測的是 range,而 是完全不同的量,轉換依賴 Parkinson 假設。
發現二:Parkinson 轉換的系統性偏誤
CARR 在 QLIKE/ 上的劣勢,根源在於 Parkinson 轉換:
這個公式假設 連續樣本路徑 (no overnight gaps)。但 SPY 每天有隔夜缺口,開盤價不等於前日收盤價。隔夜缺口無法被 range 捕捉,卻完整地反映在 中。
當 CARR 的 range 預測通過 Parkinson 公式轉換為 時,這個量系統性地低估真實方差,導致 QLIKE 損失上升。
佐證 :若改用 Parkinson variance 作為 target,CARR-MF 立刻成為最佳模型(QLIKE=0.396 vs MF-GJR=0.453)。這正好說明問題不在 CARR 本身,而在於 Parkinson 轉換與隔夜缺口的相互作用。
發現三:VIX 改善所有類型的模型
VIX multiplicative factor 對兩類模型都帶來顯著改善:
| 比較對 | DM t-stat | ? | 勝者 |
|---|---|---|---|
| CARR vs CARR-MF | 3.15 | 是 | CARR-MF |
| GJR vs MF-GJR | 4.06 | 是 | MF-GJR |
這再次確認 K847-K930 系列的一致結論: VIX 攜帶了獨立於價格歷史之外的波動率資訊 ,無論底層模型使用 range 還是 return,都能從 VIX 受益。
發現四:CARR-MF 與 GARCH 不顯著
CARR-MF vs GARCH 的 DM t=2.45,未達 Harvey (2016) 門檻,結果不顯著(n.s.)。
解釋:range + VIX 的資訊組合,其實與單純的 GARCH(基於 )在統計上等價。Range 的理論效率優勢被 Parkinson 轉換偏誤所抵消,兩者達到平衡。
發現五:MF-GJR 仍是最佳模型
DM test 完整結果:
| 比較對 | t-stat | 顯著 | 勝者 |
|---|---|---|---|
| CARR vs GARCH | 4.44 | 是 | GARCH |
| CARR vs GJR | 5.36 | 是 | GJR |
| CARR vs MF-GJR | 6.62 | 是 | MF-GJR |
| CARR-MF vs GARCH | 2.45 | 否 | n.s. |
| CARR-MF vs GJR | 3.68 | 是 | GJR |
| CARR-MF vs MF-GJR | 6.89 | 是 | MF-GJR |
| GARCH vs GJR | 3.26 | 是 | GJR |
| GJR vs MF-GJR | 4.06 | 是 | MF-GJR |
MF-GJR 以 顯著擊敗所有競爭對手,確認其最佳地位。
模型參數解讀
| 模型 | Persistence | 關鍵參數 |
|---|---|---|
| CARR | 0.970 | |
| CARR-MF | 0.981 | (VIX 彈性) |
| GARCH | 0.983 | |
| GJR | 0.983 | (強烈不對稱) |
| MF-GJR | 0.937 |
CARR-MF 的 VIX 彈性 意味著:VIX 每增加 1%,預測 range 上升約 1.6%。MF-GJR 的 則代表更強的 VIX 敏感性,反映 MIDAS 框架能更有效地利用 VIX 的長期趨勢資訊。
理論意涵
為什麼 Range 排序好但校準差?
Range 包含每個交易時段的 高低極值資訊 ,這些資訊直接反映日內波動率的峰值和谷底。Parkinson (1980) 在連續時間框架下證明 range 的效率比 close-to-close return 高 5 倍,這解釋了為何 CARR 在 排序層面 (Spearman )能領先,它對「今天比昨天更波動」的方向判斷更準確。
但效率優勢的前提是 連續樣本路徑 。美國股市每天有隔夜缺口,開盤跳空常在重要事件(如 FOMC 決議、非農報告)後特別明顯。這些跳空對真實方差 有實質貢獻,卻完全不在 range 的捕捉範圍內。Parkinson 轉換無法還原這個缺失,導致 CARR 對真實波動率的 水準估計 系統性偏低。
不同 Target 的正確解讀
這個結果不是 CARR 「失敗」,而是兩個模型擅長的任務不同:
| 任務 | 最適模型 | 原因 |
|---|---|---|
| 預測「今天波動比昨天高/低」(排序) | CARR-MF | Range 資訊直接、充足 |
| 預測日終 close-to-close 方差(水準) | MF-GJR | 不受隔夜缺口轉換偏誤影響 |
| 預測日內 intraday RV(若有 5min 數據) | CARR-MF 或 HAR-RV | Range 接近 intraday 現實 |
實務意義
對於以 排名訊號 驅動策略的系統(例如:波動率最高的 10 支個股做空):CARR-MF 可能是更合適的工具,因為其 Spearman 排序相關係數最高。
對於需要 精確水準估計 的風險管理應用(VaR/ES 計算、組合波動率預算):MF-GJR 在 QLIKE/ 和全部 DM test 中勝出,是更可靠的選擇。
對於 隔夜缺口頻繁的資產 (例如個股而非 ETF):Parkinson 轉換的偏誤問題會更嚴重,CARR 的劣勢可能更明顯。
研究限制
- 單一資產 :僅在 SPY 測試,結論需跨資產驗證
- 無日內數據 :缺乏 5-min RV 作為 gold-standard target(Hansen & Lunde 2005)
- CARR 分佈假設 :本實驗使用指數分佈作為 CARR 創新項,Weibull 或 Gamma 可能改善擬合
- 無 VaR/ES 評估 :本實驗專注於預測比較,未做風險管理評估
結論
K934 確認了一個有趣的悖論: Range-based 模型在 Spearman 排序上最強,但在 Patton-robust QLIKE on 上最弱 。這個矛盾有明確的機制解釋——Parkinson 轉換在隔夜缺口存在時產生系統性偏誤,使 range 的理論效率優勢無法完全轉化為日頻方差預測。
VIX multiplicative factor 對所有模型都有顯著改善(),與過去系列實驗一致。MF-GJR 在主要排名上仍是冠軍。若未來有日內數據(5-min RV),重新以 Hansen & Lunde (2005) 最優加權 RV 作為 gold-standard target,CARR-MF 的真實優勢可能得到更充分的展現。
實驗腳本: experiments/k934/k934.py,數據來源:yfinance (SPY, ^VIX),OOS 期間:2016-2025
詳情
- 資料來源
- yfinance
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊