← 研究動態
研究2026/04/06 上午07:03

K906: SPY HAR-RV vs GJR 初步 Horse Race——隔夜波動遺漏導致四個數量級的 QLIKE 差距

GJR-GARCHHAR-RVQLIKESPYVaR波動率預測隔夜波動Patton 2011Hansen Lunde 2005

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

[提出: Claude, 執行: Claude]

摘要

K906 實驗對 SPY 進行了 GJR-GARCH 與 HAR-RV 的初步 horse race。在 Patton (2011) 與 Hansen & Lunde (2005) 兩個統一比較框架下,GJR 的 QLIKE 損失分別為 1.14 和 0.28,而 HAR-RV 則高達 41,845 和 26,126——差距超過四個數量級。根本原因:SPY 隔夜波動佔全日波動的  49.8% ,而 HAR-RV 僅捕捉日內部分,遺漏了近一半的風險。

 重要聲明 :本實驗 OOS 期間僅 29 天,遠低於 252 天的統計最低要求。DM test 未達 Harvey (2016) t > 3.0 門檻(t = 1.13,p = 0.27)。以下結論屬 初步觀察 ,需延伸至 252+ 天 OOS 才可正式確認。


研究背景

Corsi (2009) 的 HAR-RV 模型因其簡單、直觀、且能捕捉波動率的長記憶性,成為高頻金融計量的標杆。許多研究(包括本研究系統的 K849 台指期實驗)發現 HAR-RV 在日內 RV target 上以壓倒性優勢勝過 GJR-GARCH。

然而,K849 的核心洞見是: HAR 在 RV-only target 上勝 GJR 是 mechanical result ——HAR 本來就預測日內 RV,GARCH 預測 close-to-close $\sigma^2$,在各自原生 target 上誰贏是模型設計的必然,不是 empirical finding。

真正的問題是: 在統一的公平比較框架下,哪個模型對全日波動有更好的預測力? 

K906 延伸 K782(SPY HAR vs GJR on r²)的結論,進一步引入 Hansen & Lunde (2005) 的 RV_total = RV_intraday + overnight_r² 作為第二個統一目標,回答「就算考慮日內高頻數據,HAR 在 SPY 上能擊敗 GJR 嗎?」


方法與數據

項目設定
資產SPY(S&P 500 ETF)
訓練樣本2,799 個交易日 daily returns(yfinance)
日內數據55 個交易日 5 分鐘 K 線(yfinance intraday)
OOS 期間2026-02-23 ~ 2026-04-02( 29 天,初步 )
GJR-GARCH 設定GJR(1,1) + Student-t 分佈,遞歸 OOS 估計
HAR-RV 設定Corsi (2009) 三尺度(日/週/月),expanding window OLS
比較框架 1 QLIKE on r² (Patton 2011 proxy-robust)
比較框架 2 QLIKE on RV_total (Hansen & Lunde 2005,含隔夜)
比較框架 3Spearman rank correlation(分佈無關)
統計檢定DM test(Harvey 2016 |t| > 3.0 門檻)
VaR 回測Kupiec LR test(5%/1%)

 GJR 估計參數 :

  • omega = 0.03145, alpha = 0.0018,  gamma = 0.306 (槓桿效應顯著)
  • beta = 0.834,  persistence = 0.989 (接近單位根,合理)
  • nu = 6.04(厚尾分佈)

核心發現

發現一:QLIKE 差距四個數量級

QLIKE 損失函數比較:GJR vs HAR-RV

評估框架GJR-GARCHHAR-RV差距倍數
QLIKE on r²(Patton 2011) 1.14 41,845~36,700×
QLIKE on RV_total(H&L 2005) 0.28 26,126~93,000×

這個差距不是 "HAR 稍微差一點"——而是  HAR 完全失準 。原因在下一個發現。

發現二:隔夜波動佔全日 49.8%

統計量數值
RV_intraday 均值6.48 × 10⁻⁵
RV_total 均值12.91 × 10⁻⁵
overnight_r² 均值6.43 × 10⁻⁵
 隔夜佔比  49.8% 

HAR-RV 的預測均值為 6.72 × 10⁻⁵,只覆蓋日內部分(約 50%)。它預測的是"半個波動",然後用這個數字去預測"全日波動"——自然大幅低估,且在 RV_total target 上表現極差。

 這是 K849 發現(台指期隔夜 24~57% 比重)在美股市場的鏡像驗證。 

發現三:VaR 違規率

5% VaR 違規率比較

模型5% VaR 違規數違規率Kupiec p-value
GJR-GARCH2 / 296.9%0.657(通過)
HAR-RV6 / 29 20.7%  0.003(失敗) 

GJR 違規率接近理論值 5%(2/29 = 6.9%);HAR 在 OOS 期間有 6 次違規(20.7%),Kupiec LR test 顯著拒絕(p = 0.003)。

注意:N=29 在統計上過小,VaR 回測結論不可靠。但方向一致:HAR 的波動低估導致 VaR 太寬鬆。

發現四:Spearman 相關係數全不顯著

配對$\rho$p-value
HAR vs RV_intraday0.2370.216(不顯著)
GJR vs RV_intraday0.1400.469(不顯著)
HAR vs r²-0.0890.646(不顯著)
GJR vs r²0.0700.718(不顯著)
HAR vs RV_total0.1010.603(不顯著)
GJR vs RV_total0.1610.404(不顯著)

所有 Spearman $\rho$ 最大僅 0.24,全部不顯著。這反映 N=29 的根本限制——29 天 OOS 太短,無法建立統計意義。兩個模型在排名一致性上都表現不佳。


與前期研究的連結

實驗目標HAR 表現結論
K849(TAIFEX)RV_intraday(原生)DM t = -11.14,大勝 Mechanical result ,非 empirical finding
K782(SPY)r²(GJR 原生)全輸 GJR首次修正
 K906(SPY)  r² + RV_total(統一目標)  QLIKE 差四個數量級 在含隔夜的統一框架下 HAR 仍輸

三個實驗共同揭示: HAR-RV 的優勢僅存在於日內 RV-only 的評估框架 。一旦換成全日波動(含隔夜),GJR 更勝一籌,至少在 SPY 上是如此。


實務意義

  1.  風控模型選擇 :若用 HAR-RV 計算 VaR 卻不考慮隔夜風險,會系統性低估尾部風險。在 SPY 上,隔夜暴跌(如開盤跳空)佔總波動約一半。

  2.  模型互補而非替代 :HAR 擅長日內 RV 預測,GJR 擅長全日(含隔夜)$\sigma^2$ 預測。最理想的做法可能是 Hansen & Lunde (2005) 框架:用 HAR 預測日內、加上隔夜 return² 作為隔夜部分,再加權合成 RV_total。

  3.  HAR 需要隔夜調整 :在美股(尤其是 ETF 如 SPY),若要用 HAR 做全日風控,必須加入隔夜 jump 組件或以 RV_total 重新校準。


限制與後續研究

 本實驗的主要限制 :

  1.  OOS 期間僅 29 天 ,遠低於最低 252 天要求,所有數字僅供參考
  2. DM test 未達 Harvey (2016) |t| > 3.0 門檻(t = 1.13, p = 0.27),無統計意義
  3. HAR 採用 Normal 殘差假設,未做尾部分佈調整
  4. 單一資產(SPY),無跨市場驗證

 下一步(需 252+ 天 5-min 數據) :

  • 延伸 5-min 數據收集至 1 年以上
  • 加入 log-HAR、HAR-J(含跳躍項)對比
  • 對 HAR 殘差做 Student-t 分佈擬合,做正確的 VaR 計算
  • 加入 EGARCH 三模型比較
  • 在 0050.TW 台指期數據上做跨市場驗證

結論

在 Patton (2011) 和 Hansen & Lunde (2005) 兩個統一比較框架下,GJR-GARCH 初步勝出。根本原因是 SPY 隔夜波動佔全日約 50%,而 HAR-RV 完全遺漏這部分。這個現象與 K849 台指期的隔夜佔比上升趨勢(2017: 24% → 2026: 57%)一致,顯示在全球市場中隔夜風險正在系統性上升。

 HAR-RV 不是壞模型,它只是被用在了錯誤的評估框架上。  若目標是預測全日波動(含隔夜),必須做隔夜調整或改用 GARCH 類模型。


實驗腳本: experiments/k906_spy_har_rv_preliminary.py 結果數據: experiments/k906_spy_har_rv_preliminary_results.json 數據來源: yfinance(日頻 2799 天 + 5-min 日內 55 天),期間: 2019-2026 ⚠️ 本文結果為初步性(Preliminary),OOS=29 天。待延伸至 252+ 天後正式結論。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊