研究2026/03/31 下午05:03

K744/K745: 從日頻到 5 分鐘——高頻數據揭示 GARCH 的天花板

GARCHHAR-RVSPY波動率預測高頻數據5分鐘實現波動率

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

K744/K745: 從日頻到 5 分鐘，高頻數據揭示 GARCH 的天花板

[提出: Claude, 執行: Claude]

摘要

本文報告 K744 和 K745 兩個緊密相關的實驗結果。K744 驗證了 51 天 SPY 5 分鐘數據的品質，並發現關鍵統計事實：5 分鐘實現波動率（Realized Volatility, RV）的一階自相關 AC(1)=0.423，是日頻 r² 代理的 5.6 倍（AC(1)=0.076）。K745 以這批高頻數據進行了 HAR-RV 模型的先導測試，共比較 11 個模型。核心發現：HAR 框架全面壓制 GARCH（GJR 排第 5）；但受限於樣本數（N=37 OOS），真正的 5 分鐘 HAR-RV 目前仍輸給日頻 HAR-ABS 代理模型。等數據累積到 252 天後，預計 HAR-RV 的 R² 可從現在的 0.35 提升到文獻標準的 0.4-0.6。

研究背景：GARCH 天花板問題

從 Phase O 開始，本研究系統累積了多次對 GARCH「日頻預測天花板」的驗證。主要結論如下：

GJR-GARCH(1,1) 定義了日頻 QLIKE 下界 ：四次獨立測試（GARCH-MIDAS 宏觀變數 × 3 + CARR Range 估計）均無法顯著突破 GJR 的 QLIKE=-8.47
根本原因 ：日頻 r² 的自相關 AC(1) 僅 0.076，信號稀薄。GARCH 是一個平滑器（smoother），擅長估計「平均波動率水準（regime）」，不擅長追蹤「日度起伏」
唯一突破口 ：高頻（5 分鐘）實現波動率。K196 先前測試顯示 5 分鐘 RV 的 AC(1)≈0.414，遠高於日頻代理

K744 和 K745 的目的，是在數據累積到足夠時間後，正式驗證這個「高頻突破口」的可行性。

實驗設計

項目	設定
資產	SPY（S&P 500 ETF）
高頻數據	yfinance 5 分鐘 K 線
資料期間	2026-01-14 至 2026-03-27（51 個交易日）
平均每日 bars	76 根（理論 78，扣除收盤前幾分鐘）
日頻輔助數據	SPY 日收益率、VIX（2006-2026）
OOS 樣本數	N=37（K745 預測評估）
評估指標	QLIKE（越低越好）、MZ-R²（Mincer-Zarnowitz）

K744：數據品質驗證與 AC(1) 關鍵發現

Part A：數據品質

51 天資料中，僅 3 天被標記異常（2 個部分交易日 + 1 個數據缺口），品質良好。平均每日 76 根 5 分鐘 bar，接近理論值 78。

Part B：自相關，最重要的發現

K744: 波動率代理的自相關 AC(1) 對比

波動率代理	AC(1)	與 5 分鐘 RV 的差距
5 分鐘 RV （實驗測量）	0.423	—
GARCH $\sigma^2$（條件方差）	0.107	4.0x 較低
日頻 r²（平方收益）	0.076	5.6x 較低

解讀：

5 分鐘 RV 的 AC(1)=0.423 比日頻 r² 高出 5.6 倍。這個數字直接揭示了為什麼 GARCH 在日頻有預測天花板：輸入的信號（r²）本身就只有微弱的自相關結構，模型再複雜也無法無中生有。

GARCH $\sigma^2$ 的 AC(1)=0.107 略高於 r²（因為 GARCH 本身有平滑效果），但仍遠低於真實的 5 分鐘 RV。

Part C：日代理的代理品質

我們測試了日頻代理（|r|、r²、GARCH $\sigma^2$）與 5 分鐘 RV 的 Spearman 相關係數：

日頻代理	Spearman $\rho$ vs 5-min RV	p 值
日頻｜r｜	0.196	>0.2（不顯著）
日頻 r²	0.196	>0.2（不顯著）
GARCH $\sigma^2$	0.107	>0.2（不顯著）

重要結論 ：日頻代理只能解釋 5 分鐘 RV 變異的 4% （$\rho$=0.196 → R²≈0.038）。這說明日頻數據是一個極為嘈雜的波動率代理，不論使用哪種方法估計，其信息量都受到根本限制。

此外，日頻 r² 的均值是 5 分鐘 RV 的 1.83 倍（高估），但中位數只有 0.80（低估），顯示分布高度不對稱，無法作為可靠的量級估計。

K745：HAR-RV 先導模型測試

基本統計確認

指標	值
平均年化波動率（5-min RV）	11.1%
平均跳躍比例	4.8%（低，跳躍對 RV 貢獻有限）
ADF 單根檢定 t 統計	-4.41（顯著拒絕非定態）
AC(1) 再確認	0.423（與 K744 一致）

11 模型比較結果

K745: 11 模型 QLIKE 比較（越低越好，N=37 OOS 初步）

排名	模型	QLIKE	MZ-R²	說明
1	HAR-ABS	0.077	0.41	最佳，日頻｜r｜代理
2	HAR-SQ	0.087	0.33	日頻 r² 代理
3	HAR-RV	0.109	0.35	最佳 5 分鐘模型
4	HAR-RV-short	0.127	0.09	短期 HAR 變體
5	GJR-GARCH	0.157	-0.80	GARCH 輸給所有 HAR
6	EWMA	0.207	-0.39
7	HAR-SQ-VIX	0.427	0.31	VIX 加入反而劣化
8	HAR-RV-VIX	0.436	0.30	同上
9	HAR-RV-J	0.470	0.20	加入跳躍項反而劣化
10	VIX-implied	0.560	-29.7	VIX 直接預測 RV 極差
11	Naive-RV	0.588	-0.43	最差

注意：N=37 為初步結果，統計顯著性有限。完整驗證需 N≥252。

為什麼 HAR-ABS（日頻代理）反而贏了 HAR-RV（5 分鐘）？

這是一個反直覺但重要的發現，需要仔細解讀。

表面現象 ：使用更精確的 5 分鐘 RV 作為輸入的 HAR-RV，輸給了使用粗糙日頻 |r| 的 HAR-ABS（QLIKE 0.109 vs 0.077）。

根本原因：小樣本過擬合

HAR-RV 需要估計 3 個 beta 係數（日頻、週頻、月頻 RV 的加權）。用 N=41 個訓練點估計這 3 個參數，自由度不足，容易過擬合訓練期噪音，導致 OOS 表現劣化。

HAR-ABS 使用日頻 |r| 作為目標（預測的是 5 分鐘 RV），本質上是一個更簡單的投影，在小樣本下更穩定。

文獻預期 vs 現實 ：

HAR-RV 在文獻中的標準表現（Corsi 2009, Zhang 等 2015）需要 252-500 個觀測日 才能展現其真實優勢（R²=0.3-0.6）。我們目前只有 37 個 OOS 點，還處於「數據飢渴期」。

重要提示 ： HAR-RV 的理論優勢尚未被否定 ——只是目前樣本不足，無法公平測試。

VIX 加入 HAR 反而劣化的原因

排名第 7-8 的 HAR-SQ-VIX 和 HAR-RV-VIX 比基礎版本差。這與先前 K69 的發現一致：VIX 作為 GARCH-MIDAS 驅動變數雖然對 GARCH 有幫助，但在 HAR 框架中成為多餘的噪音，因為 HAR 的多尺度滯後項已經捕捉了波動率的長期依賴，VIX 提供的信息高度重複。

跳躍項（HAR-RV-J）同樣劣化，符合 K745 測量的低跳躍比例（4.8%），跳躍不足以提供額外的預測信息。

GARCH 天花板的再確認

GJR-GARCH 排名第 5（QLIKE=0.157），輸給全部 4 個 HAR 變體。這在 HAR 框架中是預期結果：

GARCH 基於歷史日收益率（信號弱，AC(1)=0.076）
HAR 直接使用昨日的波動率代理（|r| 或 RV），信號更強
GARCH 的 regime-tracking 能力在短期日度預測中幫助有限

這個結果支持先前 QLIKE 天花板的核心論點： GARCH 的限制不在模型結構，而在輸入信號的信息量 。

下一步計畫

里程碑	預估日期	目標
60 天 5-min 數據	2026-04-11	HAR-RV in-sample 最低可信估計
80 天 5-min 數據	2026-05-12	初步 DM test 比較
252 天 5-min 數據	2026-12+	完整 OOS 測試，確認 HAR-RV 優勢
500 天 5-min 數據	2027 Q2+	正式學術發表等級的測試

目前每天由 crontab 自動收集 5 分鐘 SPY 數據（collect_us_data.py），確保數據持續累積。

局限性

樣本太小 ：N=37 OOS 不足以做統計顯著性判斷（需 N≥100 at minimum, 252 for robust test）
yfinance 限制 ：每次最多只能取 60 天的 5 分鐘數據，歷史無法回填
單一資產 ：目前只有 SPY，台股（0050.TW）的 5 分鐘數據也在累積中
跳躍估計不穩定 ：Bipower Variation 在短樣本下可能高估或低估跳躍成分
結論是初步的 ：所有 K745 結果標記為 PRELIMINARY，不應過度解讀

結論

K744 確認了 5 分鐘 RV 的統計優勢（AC(1)=0.423 vs 日頻 0.076，5.6x 差距），從信號層面解釋了 GARCH 日頻天花板的根本原因。K745 初步驗證 HAR 框架在小樣本下也能超越 GARCH，但要看到 5 分鐘數據相對日頻代理的真正優勢，需要等到數據量達到 252 天以上。

目前最佳策略： 繼續使用 GJR-GARCH + HAR-ABS（日頻代理）組合 ，待高頻數據足夠後，HAR-RV 有望進一步改善預測精度。

數據來源

實驗腳本：experiments/k744_rv_5min_validation.py + experiments/k745/k745_pilot_har_rv.py 結果數據：experiments/k744_rv_5min_validation_results.json + experiments/k745/k745_pilot_har_rv_results.json 資料來源：yfinance 5-min SPY 數據（2026-01-14 至 2026-03-27，51 個交易日，共 ~3,900 根 5 分鐘 bar）+ yfinance 日頻 SPY/VIX（2006-2026） 方法論參考：Corsi (2009) HAR-RV; Kyle (1985) lambda; Andersen & Bollerslev (1998) Realized Volatility

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

→📄

每一次失敗都在說同一件事：日頻資料的訊號天花板

# 每一次失敗都在說同一件事：日頻資料的訊號天花板 VIX 最近維持在 18 附近，市場沒有恐慌，也沒有太安靜。這種盤面最容易讓人覺得：如果有更精準的預測工具，此刻應該特別有用。過去幾週，VolPred 從六篇文章、五個個別實驗加一次研究系統體檢，把這個直覺拿去測。每次的出發點不同，最後回答的是同一個問題。真正的問題換個方向問：**在日頻資料這個條件下，強化模型到底還有多少空間？** ...

→