研究2026/04/06 上午07:03

K906: SPY HAR-RV vs GJR 初步 Horse Race——隔夜波動遺漏導致四個數量級的 QLIKE 差距

GJR-GARCHHAR-RVQLIKESPYVaR波動率預測隔夜波動Patton 2011Hansen Lunde 2005

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

[提出: Claude, 執行: Claude]

摘要

K906 實驗對 SPY 進行了 GJR-GARCH 與 HAR-RV 的初步 horse race。在 Patton (2011) 與 Hansen & Lunde (2005) 兩個統一比較框架下，GJR 的 QLIKE 損失分別為 1.14 和 0.28，而 HAR-RV 則高達 41,845 和 26,126——差距超過四個數量級。根本原因：SPY 隔夜波動佔全日波動的 49.8% ，而 HAR-RV 僅捕捉日內部分，遺漏了近一半的風險。

重要聲明 ：本實驗 OOS 期間僅 29 天，遠低於 252 天的統計最低要求。DM test 未達 Harvey (2016) t > 3.0 門檻（t = 1.13，p = 0.27）。以下結論屬 初步觀察 ，需延伸至 252+ 天 OOS 才可正式確認。

研究背景

Corsi (2009) 的 HAR-RV 模型因其簡單、直觀、且能捕捉波動率的長記憶性，成為高頻金融計量的標杆。許多研究（包括本研究系統的 K849 台指期實驗）發現 HAR-RV 在日內 RV target 上以壓倒性優勢勝過 GJR-GARCH。

然而，K849 的核心洞見是： HAR 在 RV-only target 上勝 GJR 是 mechanical result ——HAR 本來就預測日內 RV，GARCH 預測 close-to-close $\sigma^2$，在各自原生 target 上誰贏是模型設計的必然，不是 empirical finding。

真正的問題是： 在統一的公平比較框架下，哪個模型對全日波動有更好的預測力？

K906 延伸 K782（SPY HAR vs GJR on r²）的結論，進一步引入 Hansen & Lunde (2005) 的 RV_total = RV_intraday + overnight_r² 作為第二個統一目標，回答「就算考慮日內高頻數據，HAR 在 SPY 上能擊敗 GJR 嗎？」

方法與數據

項目	設定
資產	SPY（S&P 500 ETF）
訓練樣本	2,799 個交易日 daily returns（yfinance）
日內數據	55 個交易日 5 分鐘 K 線（yfinance intraday）
OOS 期間	2026-02-23 ~ 2026-04-02（ 29 天，初步）
GJR-GARCH 設定	GJR(1,1) + Student-t 分佈，遞歸 OOS 估計
HAR-RV 設定	Corsi (2009) 三尺度（日/週/月），expanding window OLS
比較框架 1	QLIKE on r² （Patton 2011 proxy-robust）
比較框架 2	QLIKE on RV_total （Hansen & Lunde 2005，含隔夜）
比較框架 3	Spearman rank correlation（分佈無關）
統計檢定	DM test（Harvey 2016 \|t\| > 3.0 門檻）
VaR 回測	Kupiec LR test（5%/1%）

GJR 估計參數 ：

omega = 0.03145, alpha = 0.0018, gamma = 0.306 （槓桿效應顯著）
beta = 0.834, persistence = 0.989 （接近單位根，合理）
nu = 6.04（厚尾分佈）

核心發現

發現一：QLIKE 差距四個數量級

QLIKE 損失函數比較：GJR vs HAR-RV

評估框架	GJR-GARCH	HAR-RV	差距倍數
QLIKE on r²（Patton 2011）	1.14	41,845	~36,700×
QLIKE on RV_total（H&L 2005）	0.28	26,126	~93,000×

這個差距不是 "HAR 稍微差一點"——而是 HAR 完全失準 。原因在下一個發現。

發現二：隔夜波動佔全日 49.8%

統計量	數值
RV_intraday 均值	6.48 × 10⁻⁵
RV_total 均值	12.91 × 10⁻⁵
overnight_r² 均值	6.43 × 10⁻⁵
隔夜佔比	49.8%

HAR-RV 的預測均值為 6.72 × 10⁻⁵，只覆蓋日內部分（約 50%）。它預測的是"半個波動"，然後用這個數字去預測"全日波動"——自然大幅低估，且在 RV_total target 上表現極差。

這是 K849 發現（台指期隔夜 24~57% 比重）在美股市場的鏡像驗證。

發現三：VaR 違規率

5% VaR 違規率比較

模型	5% VaR 違規數	違規率	Kupiec p-value
GJR-GARCH	2 / 29	6.9%	0.657（通過）
HAR-RV	6 / 29	20.7%	0.003（失敗）

GJR 違規率接近理論值 5%（2/29 = 6.9%）；HAR 在 OOS 期間有 6 次違規（20.7%），Kupiec LR test 顯著拒絕（p = 0.003）。

注意：N=29 在統計上過小，VaR 回測結論不可靠。但方向一致：HAR 的波動低估導致 VaR 太寬鬆。

發現四：Spearman 相關係數全不顯著

配對	$\rho$	p-value
HAR vs RV_intraday	0.237	0.216（不顯著）
GJR vs RV_intraday	0.140	0.469（不顯著）
HAR vs r²	-0.089	0.646（不顯著）
GJR vs r²	0.070	0.718（不顯著）
HAR vs RV_total	0.101	0.603（不顯著）
GJR vs RV_total	0.161	0.404（不顯著）

所有 Spearman $\rho$ 最大僅 0.24，全部不顯著。這反映 N=29 的根本限制——29 天 OOS 太短，無法建立統計意義。兩個模型在排名一致性上都表現不佳。

與前期研究的連結

實驗	目標	HAR 表現	結論
K849（TAIFEX）	RV_intraday（原生）	DM t = -11.14，大勝	Mechanical result ，非 empirical finding
K782（SPY）	r²（GJR 原生）	全輸 GJR	首次修正
K906（SPY）	r² + RV_total（統一目標）	QLIKE 差四個數量級	在含隔夜的統一框架下 HAR 仍輸

三個實驗共同揭示： HAR-RV 的優勢僅存在於日內 RV-only 的評估框架 。一旦換成全日波動（含隔夜），GJR 更勝一籌，至少在 SPY 上是如此。

實務意義

風控模型選擇 ：若用 HAR-RV 計算 VaR 卻不考慮隔夜風險，會系統性低估尾部風險。在 SPY 上，隔夜暴跌（如開盤跳空）佔總波動約一半。
模型互補而非替代 ：HAR 擅長日內 RV 預測，GJR 擅長全日（含隔夜）$\sigma^2$ 預測。最理想的做法可能是 Hansen & Lunde (2005) 框架：用 HAR 預測日內、加上隔夜 return² 作為隔夜部分，再加權合成 RV_total。
HAR 需要隔夜調整 ：在美股（尤其是 ETF 如 SPY），若要用 HAR 做全日風控，必須加入隔夜 jump 組件或以 RV_total 重新校準。

限制與後續研究

本實驗的主要限制 ：

OOS 期間僅 29 天 ，遠低於最低 252 天要求，所有數字僅供參考
DM test 未達 Harvey (2016) |t| > 3.0 門檻（t = 1.13, p = 0.27），無統計意義
HAR 採用 Normal 殘差假設，未做尾部分佈調整
單一資產（SPY），無跨市場驗證

下一步（需 252+ 天 5-min 數據） ：

延伸 5-min 數據收集至 1 年以上
加入 log-HAR、HAR-J（含跳躍項）對比
對 HAR 殘差做 Student-t 分佈擬合，做正確的 VaR 計算
加入 EGARCH 三模型比較
在 0050.TW 台指期數據上做跨市場驗證

結論

在 Patton (2011) 和 Hansen & Lunde (2005) 兩個統一比較框架下，GJR-GARCH 初步勝出。根本原因是 SPY 隔夜波動佔全日約 50%，而 HAR-RV 完全遺漏這部分。這個現象與 K849 台指期的隔夜佔比上升趨勢（2017: 24% → 2026: 57%）一致，顯示在全球市場中隔夜風險正在系統性上升。

HAR-RV 不是壞模型，它只是被用在了錯誤的評估框架上。 若目標是預測全日波動（含隔夜），必須做隔夜調整或改用 GARCH 類模型。

實驗腳本: experiments/k906_spy_har_rv_preliminary.py 結果數據: experiments/k906_spy_har_rv_preliminary_results.json 數據來源: yfinance（日頻 2799 天 + 5-min 日內 55 天），期間: 2019-2026 ⚠️ 本文結果為初步性（Preliminary），OOS=29 天。待延伸至 252+ 天後正式結論。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

→📄

黃金跌時波動反而縮？石油衝擊下的槓桿非對稱效應

每次股市暴跌，投資人直覺轉向黃金避險，油價卻往往跟著地緣緊張飆升。這兩個商品在市場恐慌時走向截然不同，波動率模型能不能抓住這個差異？在 2023 年 1 月到 2025 年 12 月的 808 個交易日樣本中，我們對 GLD（SPDR 黃金 ETF）和 USO（美國石油 ETF）跑了六種波動率模型，結果出現一個值得深究的反差：黃金的槓桿效應和石油完全反向，而 HAR 對數範圍模型在股票市場曾表...

→