K906: SPY HAR-RV vs GJR 初步 Horse Race——隔夜波動遺漏導致四個數量級的 QLIKE 差距
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
[提出: Claude, 執行: Claude]
摘要
K906 實驗對 SPY 進行了 GJR-GARCH 與 HAR-RV 的初步 horse race。在 Patton (2011) 與 Hansen & Lunde (2005) 兩個統一比較框架下,GJR 的 QLIKE 損失分別為 1.14 和 0.28,而 HAR-RV 則高達 41,845 和 26,126——差距超過四個數量級。根本原因:SPY 隔夜波動佔全日波動的 49.8% ,而 HAR-RV 僅捕捉日內部分,遺漏了近一半的風險。
重要聲明 :本實驗 OOS 期間僅 29 天,遠低於 252 天的統計最低要求。DM test 未達 Harvey (2016) t > 3.0 門檻(t = 1.13,p = 0.27)。以下結論屬 初步觀察 ,需延伸至 252+ 天 OOS 才可正式確認。
研究背景
Corsi (2009) 的 HAR-RV 模型因其簡單、直觀、且能捕捉波動率的長記憶性,成為高頻金融計量的標杆。許多研究(包括本研究系統的 K849 台指期實驗)發現 HAR-RV 在日內 RV target 上以壓倒性優勢勝過 GJR-GARCH。
然而,K849 的核心洞見是: HAR 在 RV-only target 上勝 GJR 是 mechanical result ——HAR 本來就預測日內 RV,GARCH 預測 close-to-close $\sigma^2$,在各自原生 target 上誰贏是模型設計的必然,不是 empirical finding。
真正的問題是: 在統一的公平比較框架下,哪個模型對全日波動有更好的預測力?
K906 延伸 K782(SPY HAR vs GJR on r²)的結論,進一步引入 Hansen & Lunde (2005) 的 RV_total = RV_intraday + overnight_r² 作為第二個統一目標,回答「就算考慮日內高頻數據,HAR 在 SPY 上能擊敗 GJR 嗎?」
方法與數據
| 項目 | 設定 |
|---|---|
| 資產 | SPY(S&P 500 ETF) |
| 訓練樣本 | 2,799 個交易日 daily returns(yfinance) |
| 日內數據 | 55 個交易日 5 分鐘 K 線(yfinance intraday) |
| OOS 期間 | 2026-02-23 ~ 2026-04-02( 29 天,初步 ) |
| GJR-GARCH 設定 | GJR(1,1) + Student-t 分佈,遞歸 OOS 估計 |
| HAR-RV 設定 | Corsi (2009) 三尺度(日/週/月),expanding window OLS |
| 比較框架 1 | QLIKE on r² (Patton 2011 proxy-robust) |
| 比較框架 2 | QLIKE on RV_total (Hansen & Lunde 2005,含隔夜) |
| 比較框架 3 | Spearman rank correlation(分佈無關) |
| 統計檢定 | DM test(Harvey 2016 |t| > 3.0 門檻) |
| VaR 回測 | Kupiec LR test(5%/1%) |
GJR 估計參數 :
- omega = 0.03145, alpha = 0.0018, gamma = 0.306 (槓桿效應顯著)
- beta = 0.834, persistence = 0.989 (接近單位根,合理)
- nu = 6.04(厚尾分佈)
核心發現
發現一:QLIKE 差距四個數量級

| 評估框架 | GJR-GARCH | HAR-RV | 差距倍數 |
|---|---|---|---|
| QLIKE on r²(Patton 2011) | 1.14 | 41,845 | ~36,700× |
| QLIKE on RV_total(H&L 2005) | 0.28 | 26,126 | ~93,000× |
這個差距不是 "HAR 稍微差一點"——而是 HAR 完全失準 。原因在下一個發現。
發現二:隔夜波動佔全日 49.8%
| 統計量 | 數值 |
|---|---|
| RV_intraday 均值 | 6.48 × 10⁻⁵ |
| RV_total 均值 | 12.91 × 10⁻⁵ |
| overnight_r² 均值 | 6.43 × 10⁻⁵ |
| 隔夜佔比 | 49.8% |
HAR-RV 的預測均值為 6.72 × 10⁻⁵,只覆蓋日內部分(約 50%)。它預測的是"半個波動",然後用這個數字去預測"全日波動"——自然大幅低估,且在 RV_total target 上表現極差。
這是 K849 發現(台指期隔夜 24~57% 比重)在美股市場的鏡像驗證。
發現三:VaR 違規率

| 模型 | 5% VaR 違規數 | 違規率 | Kupiec p-value |
|---|---|---|---|
| GJR-GARCH | 2 / 29 | 6.9% | 0.657(通過) |
| HAR-RV | 6 / 29 | 20.7% | 0.003(失敗) |
GJR 違規率接近理論值 5%(2/29 = 6.9%);HAR 在 OOS 期間有 6 次違規(20.7%),Kupiec LR test 顯著拒絕(p = 0.003)。
注意:N=29 在統計上過小,VaR 回測結論不可靠。但方向一致:HAR 的波動低估導致 VaR 太寬鬆。
發現四:Spearman 相關係數全不顯著
| 配對 | $\rho$ | p-value |
|---|---|---|
| HAR vs RV_intraday | 0.237 | 0.216(不顯著) |
| GJR vs RV_intraday | 0.140 | 0.469(不顯著) |
| HAR vs r² | -0.089 | 0.646(不顯著) |
| GJR vs r² | 0.070 | 0.718(不顯著) |
| HAR vs RV_total | 0.101 | 0.603(不顯著) |
| GJR vs RV_total | 0.161 | 0.404(不顯著) |
所有 Spearman $\rho$ 最大僅 0.24,全部不顯著。這反映 N=29 的根本限制——29 天 OOS 太短,無法建立統計意義。兩個模型在排名一致性上都表現不佳。
與前期研究的連結
| 實驗 | 目標 | HAR 表現 | 結論 |
|---|---|---|---|
| K849(TAIFEX) | RV_intraday(原生) | DM t = -11.14,大勝 | Mechanical result ,非 empirical finding |
| K782(SPY) | r²(GJR 原生) | 全輸 GJR | 首次修正 |
| K906(SPY) | r² + RV_total(統一目標) | QLIKE 差四個數量級 | 在含隔夜的統一框架下 HAR 仍輸 |
三個實驗共同揭示: HAR-RV 的優勢僅存在於日內 RV-only 的評估框架 。一旦換成全日波動(含隔夜),GJR 更勝一籌,至少在 SPY 上是如此。
實務意義
-
風控模型選擇 :若用 HAR-RV 計算 VaR 卻不考慮隔夜風險,會系統性低估尾部風險。在 SPY 上,隔夜暴跌(如開盤跳空)佔總波動約一半。
-
模型互補而非替代 :HAR 擅長日內 RV 預測,GJR 擅長全日(含隔夜)$\sigma^2$ 預測。最理想的做法可能是 Hansen & Lunde (2005) 框架:用 HAR 預測日內、加上隔夜 return² 作為隔夜部分,再加權合成 RV_total。
-
HAR 需要隔夜調整 :在美股(尤其是 ETF 如 SPY),若要用 HAR 做全日風控,必須加入隔夜 jump 組件或以 RV_total 重新校準。
限制與後續研究
本實驗的主要限制 :
- OOS 期間僅 29 天 ,遠低於最低 252 天要求,所有數字僅供參考
- DM test 未達 Harvey (2016) |t| > 3.0 門檻(t = 1.13, p = 0.27),無統計意義
- HAR 採用 Normal 殘差假設,未做尾部分佈調整
- 單一資產(SPY),無跨市場驗證
下一步(需 252+ 天 5-min 數據) :
- 延伸 5-min 數據收集至 1 年以上
- 加入 log-HAR、HAR-J(含跳躍項)對比
- 對 HAR 殘差做 Student-t 分佈擬合,做正確的 VaR 計算
- 加入 EGARCH 三模型比較
- 在 0050.TW 台指期數據上做跨市場驗證
結論
在 Patton (2011) 和 Hansen & Lunde (2005) 兩個統一比較框架下,GJR-GARCH 初步勝出。根本原因是 SPY 隔夜波動佔全日約 50%,而 HAR-RV 完全遺漏這部分。這個現象與 K849 台指期的隔夜佔比上升趨勢(2017: 24% → 2026: 57%)一致,顯示在全球市場中隔夜風險正在系統性上升。
HAR-RV 不是壞模型,它只是被用在了錯誤的評估框架上。 若目標是預測全日波動(含隔夜),必須做隔夜調整或改用 GARCH 類模型。
實驗腳本: experiments/k906_spy_har_rv_preliminary.py 結果數據: experiments/k906_spy_har_rv_preliminary_results.json 數據來源: yfinance(日頻 2799 天 + 5-min 日內 55 天),期間: 2019-2026 ⚠️ 本文結果為初步性(Preliminary),OOS=29 天。待延伸至 252+ 天後正式結論。
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊