研究2026/04/05 上午07:03

K849：台指期 5 分鐘 RV 實證——HAR-RV 在日內波動預測的優勢與 GARCH 在全日預測的互補

GJR-GARCHHAR-RV台股paradigm shiftproxy ceiling5-min RVlandmark

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

不同波動率模型預測不同標的（GARCH 預測全日 $\sigma^2$、HAR 預測日內 RV），需在各自原生 target 上評估——GJR 不可動搖，因為我們用了不同的評估標準（r² vs RV），兩者各自正確

[提出: 用戶 (milestone), 執行: Claude]

核心發現（K849 里程碑） ：連續不同波動率模型預測不同標的（GARCH 預測全日 $\sigma^2$、HAR 預測日內 RV），需在各自原生 target 上評估誤上。K848 實驗證明，我們用來評估模型的 proxy（日頻 r²）與 5-min RV 衡量的是不同維度的波動率（全日 vs 盤中）。K849 換用 5-min RV（Hansen & Lunde 2005 黃金標準）後，HAR-RV 在兩個 track 上以 DM t-stat = -11.1 和 -5.5 壓倒性勝出，5/5 cross-OOS 全勝。

背景：800 個實驗使用 r² 作為統一評估標準的局限

自 2025 年初以來，本研究系統在台股（0050.TW）上執行了 800 個以上的波動率預測實驗。這些實驗主要使用 r²（日頻 squared return）作為評估標準，這對 GARCH 類模型是正確的原生 target，但不適合直接評估 HAR-RV 等日內模型。

GJR-GARCH(1,1) Student-t 是最佳模型 （QLIKE on r² 最低）
HAR-RV 雖然在某些指標上接近，但整體不敵 GJR
研究重心放在調整 GARCH 的分配族（Normal / Student-t / Skewed-t）

但這些比較有一個共同的盲點： 評估 target 一律用日頻 r²（日報酬的平方） 。

K848 的發現：r² 是劣質代理變數

K848 實驗（2026-04-03）用 TAIFEX TX 5 分鐘 tick 數據計算 Realized Volatility（RV），並與 r² 比較：

r² 與 5-min RV 的相關係數 = 0.54 （只解釋 29% 的 RV 變異）
Andersen & Bollerslev (1998) 早已警告：r² 的信噪比極低（SNR ≈ 0.02），每個日頻觀測幾乎是純噪音

換言之，用 r² 評估模型，相當於 用體重計量身高 ——能測到某種東西，但不是你真正想知道的。

K849 實驗設計

數據：TAIFEX TX 5 分鐘 tick 數據（2012-2025），計算日內 Realized Volatility
模型：HAR-RV、HAR-RV-J（含跳躍成分）、GJR-GARCH(1,1) Student-t、EWMA（$\lambda$=0.94）
評估指標 ：QLIKE（Patton 2011，proxy-robust）、Spearman 排序相關、DM 檢定（Harvey 2016 |t|>3.0 門檻）
Cross-OOS ：5 個非重疊區間，各約 200-291 個交易日

兩個 Track ：

Track A （日盤 RV，14 年）：2012-2025，N_oos = 1,456 天
Track B （全天 RV 含夜盤，8 年）：2017-2025，N_oos = 969 天

核心結果：QLIKE 比較

HAR-RV vs GJR-GARCH QLIKE 比較（5-min RV 評估）圖一：QLIKE（越低越好）。Track A 中 HAR-RV 的 0.181 對比 GJR-GARCH 的 0.531，改善幅度達 66%。Track B（含夜盤 RV）中 HAR-RV 的 0.110 對比 GJR-GARCH 的 0.202，改善幅度 46%。

Track	HAR-RV QLIKE	GJR-GARCH QLIKE	改善幅度	DM t-stat	Harvey 顯著？
A（日盤 14 年，N=1,456）	0.181	0.531	+66%	-11.14	YES (\|t\|>3.0)
B（全天 8 年，N=969）	0.110	0.202	+46%	-5.50	YES (\|t\|>3.0)

DM t-stat = -11.1（Track A）、-5.5（Track B） ，遠超 Harvey (2016) 的 |t|>3.0 嚴格門檻。這在計量金融研究中屬於壓倒性差距。

Cross-OOS：5/5 全勝

5-fold Cross-OOS 驗證 圖二：HAR-RV 在 5 個非重疊 OOS 區間中，兩個 track 都是全勝（10/10）。GJR-GARCH 在熊市（Fold 3-4）跌幅最大，QLIKE 飆升至 0.547-0.683。

Cross-OOS 結果：

Track A ：HAR-RV 在 5/5 所有 fold 中 QLIKE 均低於 GJR-GARCH（10/10 全勝）
Track B ：相同，HAR-RV 5/5 全勝
在 2022 熊市（Fold 2-3）期間，GJR-GARCH 的 QLIKE 劣化最嚴重（Track A Fold 3: 0.547）

Spearman 排序能力

模型-target 差異與 Spearman 比較圖三（左）：r² 衡量全日波動（含隔夜），5-min RV 衡量盤中波動，兩者回答不同問題。圖三（右）：換用真實 RV 評估後，HAR-RV 的 Spearman 排序能力 0.647-0.767，明顯優於 GJR-GARCH 的 0.421-0.677。

模型	Spearman（Track A）	Spearman（Track B）
HAR-RV	0.647	0.767
HAR-RV-J	0.647	0.763
EWMA	0.595	0.645
GJR-GARCH	0.421	0.677

排序能力差距：Track A 中 HAR-RV 比 GJR-GARCH 高出 +53%（0.647 vs 0.421）。

夜盤 RV 的乘數效應

Track B 的 HAR-RV 模型（含夜盤 RV 作為特徵）：

IS R² = 0.583 （Track B）vs IS R² = 0.174 （Track A）
夜盤 RV（台指期 15:00-05:00）大幅提升 HAR 的解釋力

這與 K847 的發現一致：TAIFEX 夜盤捕捉了 39.8% 的 Gap 成分（Slot C = 美股盤中），包含了最重要的境外資訊流。

「模型-target 差異」的教訓

本次發現的核心教訓，借用文獻術語稱為 模型-target 差異 ：

當評估 target 本身的訊噪比很低時，即使最好的模型也無法展現其真實能力。模型的「天花板」不是模型本身的局限，而是 proxy 的局限。

具體到本研究：

日頻 r² → 訊噪比 ≈ 0.02（Andersen & Bollerslev 1998）
所有模型在 r² 評估下都被壓縮到相近表現
GJR-GARCH 的結構（適合對稱 ARCH 效應）在 r² 上反而有地板效應
HAR-RV（設計來預測 RV）在 r² 上表現不突出，因為它預測的 target 根本不是 r²

換用 5-min RV 後，HAR-RV 的真實優勢才得以顯現。

與既有文獻的一致性

本結果完全符合以下文獻的預測：

Hansen & Lunde (2005) ：用 5-min RV 評估才能得到正確的模型排名
Patton (2011) ：QLIKE on RV 是唯一 proxy-robust 的損失函數
Corsi (2009) ：HAR-RV 在 RV-on-RV 預測中優於 GARCH 族模型
Andersen et al. (2007) ：跳躍成分（HAR-RV-J）在台股（高跳躍頻率）應有額外價值，但本研究 DM test 顯示 HAR-RV-J vs HAR-RV 的 t-stat = 0.83（未達顯著），未來需要更細緻的跳躍識別

研究含義

模型選擇需重新評估 ：如果目標是真實波動率預測（如 VaR 計算），HAR-RV 應取代 GJR-GARCH 成為台股首選
夜盤數據有巨大價值 ：Track B 的大幅改善顯示，不納入夜盤 RV 是重要的信息損失
Patton 2011 框架必須強制執行 ：任何模型比較都必須包含 QLIKE on 5-min RV（如有日內數據）
800 個 GJR 實驗並未白費 ：這些實驗準確描述了「在 r² 評估框架下的模型行為」，這本身是有意義的基準

局限性

計算成本 ：5-min RV 需要 tick 數據，不如日頻 r² 容易取得
樣本：僅限台股（0050.TW / TX）；美股（SPY）的對應實驗尚未完成
HAR-RV-J 與 HAR-RV 差距不顯著 ：跳躍識別方法（BPV）可能低估了台股跳躍頻率，值得深入探討
VaR 轉換 ：HAR-RV 的殘差分配通常假設 log-normal 或 F-distributed，VaR 換算需要正確的分配轉換（尚未完成）

實驗腳本：experiments/k849_har_rv_taifex.py
結果數據：experiments/k849_har_rv_taifex_results.json
數據來源：TAIFEX TX 5 分鐘 tick 數據 + yfinance（0050.TW）
樣本期間：Track A 2012-2025（N=3,424 天），Track B 2017-2025（含夜盤 RV）

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

→📄

新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)

新興市場的美元主權債，波動起來的時候，會不會比股市早一步聞到火藥味？如果會，那些免費就能取得的債券 ETF 與信用利差，或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍，結論很乾脆：**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的，不存在可以拿來做日頻預測的領先關係。這是一個 NULL 結果，但它是乾淨、可複現、而且對...

→