← 研究動態
研究2026/04/05 上午07:03

K849:台指期 5 分鐘 RV 實證——HAR-RV 在日內波動預測的優勢與 GARCH 在全日預測的互補

GJR-GARCHHAR-RV台股paradigm shiftproxy ceiling5-min RVlandmark

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

不同波動率模型預測不同標的(GARCH 預測全日 $\sigma^2$、HAR 預測日內 RV),需在各自原生 target 上評估——GJR 不可動搖,因為我們用了不同的評估標準(r² vs RV),兩者各自正確

[提出: 用戶 (milestone), 執行: Claude]

 核心發現(K849 里程碑) :連續 不同波動率模型預測不同標的(GARCH 預測全日 $\sigma^2$、HAR 預測日內 RV),需在各自原生 target 上評估誤上。K848 實驗證明,我們用來評估模型的 proxy(日頻 r²)與 5-min RV 衡量的是不同維度的波動率(全日 vs 盤中)。K849 換用 5-min RV(Hansen & Lunde 2005 黃金標準)後,HAR-RV 在兩個 track 上以  DM t-stat = -11.1 和 -5.5  壓倒性勝出,5/5 cross-OOS 全勝。


背景:800 個實驗使用 r² 作為統一評估標準的局限

自 2025 年初以來,本研究系統在台股(0050.TW)上執行了 800 個以上的波動率預測實驗。這些實驗主要使用 r²(日頻 squared return)作為評估標準,這對 GARCH 類模型是正確的原生 target,但不適合直接評估 HAR-RV 等日內模型。

  •  GJR-GARCH(1,1) Student-t 是最佳模型 (QLIKE on r² 最低)
  • HAR-RV 雖然在某些指標上接近,但整體不敵 GJR
  • 研究重心放在調整 GARCH 的分配族(Normal / Student-t / Skewed-t)

但這些比較有一個共同的盲點: 評估 target 一律用日頻 r²(日報酬的平方) 。


K848 的發現:r² 是劣質代理變數

K848 實驗(2026-04-03)用 TAIFEX TX 5 分鐘 tick 數據計算 Realized Volatility(RV),並與 r² 比較:

  •  r² 與 5-min RV 的相關係數 = 0.54 (只解釋 29% 的 RV 變異)
  • Andersen & Bollerslev (1998) 早已警告:r² 的信噪比極低(SNR ≈ 0.02),每個日頻觀測幾乎是純噪音

換言之,用 r² 評估模型,相當於 用體重計量身高 ——能測到某種東西,但不是你真正想知道的。


K849 實驗設計

 數據 :TAIFEX TX 5 分鐘 tick 數據(2012-2025),計算日內 Realized Volatility
 模型 :HAR-RV、HAR-RV-J(含跳躍成分)、GJR-GARCH(1,1) Student-t、EWMA($\lambda$=0.94)
 評估指標 :QLIKE(Patton 2011,proxy-robust)、Spearman 排序相關、DM 檢定(Harvey 2016 |t|>3.0 門檻)
 Cross-OOS :5 個非重疊區間,各約 200-291 個交易日

 兩個 Track :

  •  Track A (日盤 RV,14 年):2012-2025,N_oos = 1,456 天
  •  Track B (全天 RV 含夜盤,8 年):2017-2025,N_oos = 969 天

核心結果:QLIKE 比較

HAR-RV vs GJR-GARCH QLIKE 比較(5-min RV 評估) 圖一:QLIKE(越低越好)。Track A 中 HAR-RV 的 0.181 對比 GJR-GARCH 的 0.531,改善幅度達 66%。Track B(含夜盤 RV)中 HAR-RV 的 0.110 對比 GJR-GARCH 的 0.202,改善幅度 46%。

TrackHAR-RV QLIKEGJR-GARCH QLIKE改善幅度DM t-statHarvey 顯著?
A(日盤 14 年,N=1,456) 0.181 0.531 +66%  -11.14 YES (|t|>3.0)
B(全天 8 年,N=969) 0.110 0.202 +46%  -5.50 YES (|t|>3.0)

DM t-stat =  -11.1(Track A)、-5.5(Track B) ,遠超 Harvey (2016) 的 |t|>3.0 嚴格門檻。這在計量金融研究中屬於壓倒性差距。


Cross-OOS:5/5 全勝

5-fold Cross-OOS 驗證 圖二:HAR-RV 在 5 個非重疊 OOS 區間中,兩個 track 都是全勝(10/10)。GJR-GARCH 在熊市(Fold 3-4)跌幅最大,QLIKE 飆升至 0.547-0.683。

Cross-OOS 結果:

  •  Track A :HAR-RV 在 5/5 所有 fold 中 QLIKE 均低於 GJR-GARCH(10/10 全勝)
  •  Track B :相同,HAR-RV 5/5 全勝
  • 在 2022 熊市(Fold 2-3)期間,GJR-GARCH 的 QLIKE 劣化最嚴重(Track A Fold 3: 0.547)

Spearman 排序能力

模型-target 差異 與 Spearman 比較 圖三(左):r² 衡量全日波動(含隔夜),5-min RV 衡量盤中波動,兩者回答不同問題。圖三(右):換用真實 RV 評估後,HAR-RV 的 Spearman 排序能力 0.647-0.767,明顯優於 GJR-GARCH 的 0.421-0.677。

模型Spearman(Track A)Spearman(Track B)
 HAR-RV  0.647  0.767 
HAR-RV-J0.6470.763
EWMA0.5950.645
GJR-GARCH0.4210.677

排序能力差距:Track A 中 HAR-RV 比 GJR-GARCH 高出 +53%(0.647 vs 0.421)。


夜盤 RV 的乘數效應

Track B 的 HAR-RV 模型(含夜盤 RV 作為特徵):

  •  IS R² = 0.583 (Track B)vs  IS R² = 0.174 (Track A)
  • 夜盤 RV(台指期 15:00-05:00)大幅提升 HAR 的解釋力

這與 K847 的發現一致:TAIFEX 夜盤捕捉了 39.8% 的 Gap 成分(Slot C = 美股盤中),包含了最重要的境外資訊流。


「模型-target 差異」的教訓

本次發現的核心教訓,借用文獻術語稱為  模型-target 差異 :

當評估 target 本身的訊噪比很低時,即使最好的模型也無法展現其真實能力。模型的「天花板」不是模型本身的局限,而是 proxy 的局限。

具體到本研究:

  1. 日頻 r² → 訊噪比 ≈ 0.02(Andersen & Bollerslev 1998)
  2. 所有模型在 r² 評估下都被壓縮到相近表現
  3. GJR-GARCH 的結構(適合對稱 ARCH 效應)在 r² 上反而有地板效應
  4. HAR-RV(設計來預測 RV)在 r² 上表現不突出,因為它預測的 target 根本不是 r²

換用 5-min RV 後,HAR-RV 的真實優勢才得以顯現。


與既有文獻的一致性

本結果完全符合以下文獻的預測:

  •  Hansen & Lunde (2005) :用 5-min RV 評估才能得到正確的模型排名
  •  Patton (2011) :QLIKE on RV 是唯一 proxy-robust 的損失函數
  •  Corsi (2009) :HAR-RV 在 RV-on-RV 預測中優於 GARCH 族模型
  •  Andersen et al. (2007) :跳躍成分(HAR-RV-J)在台股(高跳躍頻率)應有額外價值,但本研究 DM test 顯示 HAR-RV-J vs HAR-RV 的 t-stat = 0.83(未達顯著),未來需要更細緻的跳躍識別

研究含義

  1.  模型選擇需重新評估 :如果目標是真實波動率預測(如 VaR 計算),HAR-RV 應取代 GJR-GARCH 成為台股首選
  2.  夜盤數據有巨大價值 :Track B 的大幅改善顯示,不納入夜盤 RV 是重要的信息損失
  3.  Patton 2011 框架必須強制執行 :任何模型比較都必須包含 QLIKE on 5-min RV(如有日內數據)
  4.  800 個 GJR 實驗並未白費 :這些實驗準確描述了「在 r² 評估框架下的模型行為」,這本身是有意義的基準

局限性

  1.  計算成本 :5-min RV 需要 tick 數據,不如日頻 r² 容易取得
  2.  樣本 :僅限台股(0050.TW / TX);美股(SPY)的對應實驗尚未完成
  3.  HAR-RV-J 與 HAR-RV 差距不顯著 :跳躍識別方法(BPV)可能低估了台股跳躍頻率,值得深入探討
  4.  VaR 轉換 :HAR-RV 的殘差分配通常假設 log-normal 或 F-distributed,VaR 換算需要正確的分配轉換(尚未完成)

實驗腳本:experiments/k849_har_rv_taifex.py
結果數據:experiments/k849_har_rv_taifex_results.json
數據來源:TAIFEX TX 5 分鐘 tick 數據 + yfinance(0050.TW)
樣本期間:Track A 2012-2025(N=3,424 天),Track B 2017-2025(含夜盤 RV)

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...
📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...