研究2026/04/05 上午09:03

r² 與 5 分鐘 RV 衡量的是不同的東西：台指期高頻數據的啟示

TAIFEX5-min RVrealized volatilityr² noisemeasurement

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

摘要

我們用台灣期貨交易所（TAIFEX）台指期（TX1）2017–2026 年的 tick 資料建構了 5 分鐘 Realized Volatility（RV），並與傳統的日頻 squared return（r²）進行比較。核心發現： r² 的中位數捕捉率僅 0.29 ，代表日頻 r² 有 71% 的波動資訊是噪音。用不同 target 評估同一個 GJR-GARCH 模型，QLIKE 差距高達 5.8 倍 （1.52 vs 0.26）。

資料描述

資產：台指期近月連續合約（TX1），TAIFEX tick 資料
期間：2017-01-03 至 2026-03-31，共 2163 交易日
頻率：5 分鐘 bar（日盤 09:00–13:30 = 54 bars；夜盤 15:00–隔日 05:00 = 168 bars）
RV 建構 ：BPV（Bipower Variation）偵測 jump 後，RV_total = RV_day + RV_night

項目	數量
觀察日	2163 天
日盤 bars/日	54
夜盤 bars/日	168
Jump 頻率	74.9%
Jump 佔 RV 比例	7.6%

核心發現一：r² 衡量的是 close-to-close 全日波動（含隔夜），而 5-min RV 衡量的是盤中波動，兩者本來就不同的真實波動率

r²/RV_total 的比值分佈中位數僅 0.29 。這意味著日頻 r²（標準波動率研究的默認 target）有 71% 的真實波動資訊被遺漏，取而代之的是大量市場微結構噪音。

這個結果對過去 800 多個使用 r² 評估模型的實驗有重要涵義： 模型比較的排名可能在 noisy target 下完全失真 。

核心發現二：評估 target 影響 QLIKE 高達 5.8 倍

QLIKE Loss：r² vs 5-min RV 作為評估 Target 圖一：同一個 GJR-GARCH 模型，在不同 target 下 QLIKE 差距 5.8 倍。評估 target 的選擇比模型本身更重要。

指標	r²（日頻）	RV_total（5-min）
QLIKE（GJR-GARCH）	1.52	0.26
Spearman rank corr	0.20	0.67
捕捉率（中位數）	29%	100%（定義）

Spearman rank correlation 從 0.20 躍升至 0.67，說明用 RV 作 target 時，GJR-GARCH 的預測排名與真實波動率排名一致性更高。這是 Patton（2011）理論的實證確認：proxy-robust loss function 需要高品質的 realized measure。

核心發現三：夜盤 vol 持續擴張，已超過日盤

台指期夜盤波動率佔比：2017 → 2026 圖二：夜盤波動率佔 RV_total 的比例從 2017 年的 24% 攀升至 2026 年的 56.5%，夜盤已超過日盤成為主要波動來源。

台指期夜盤（接軌美股）的波動率佔比在 10 年間翻了一倍多。這有兩個重要涵義：

只用日盤數據的模型 （大多數台股研究）越來越不完整，夜盤資訊正在主導台指期的波動
2020 年後尤為明顯 ：COVID 與 Fed 政策周期放大了美股對台灣期貨的 lead-lag 效應

方法論說明

RV 建構

5-min return r_{t,i}，RV_t = sum_i r_{t,i}^2
Jump 偵測：Barndorff-Nielsen & Shephard (2004) BPV，ratio test z = (RV - BPV)/RV > Phi^{-1}(0.999) 視為 jump
RV_total = RV_day + RV_night（分開計算，避免隔夜間隔污染）

QLIKE Loss

QLIKE(sigma², h) = sigma²/h - log(sigma²/h) - 1

Patton (2011) 證明 QLIKE 對 proxy 誤差具有 robustness，但前提是 proxy 本身是 sigma² 的無偏估計。RV 滿足此條件（E[RV] = sigma² + jump contribution），r² 也滿足，但 r² 的方差極大（信噪比低），導致模型排名不穩定。

與過去實驗的關係

K848 之前，本系統使用 r² 作為唯一評估 target（超過 800 個 GARCH 類實驗）。K848 表明這個選擇引入了系統性的測量誤差。直接的後續影響：

K849（即將） ：在 RV_total target 下比較 HAR vs GJR-GARCH——K848 的 Spearman 0.67 vs 0.20 已暗示 RV target 下的結果可能與 r² target 下截然不同
歷史實驗重新評估 ：使用 5-min RV 重跑關鍵模型比較，驗證 r² 時代的排名是否仍然成立

局限性

樣本侷限 ：僅台指期，不直接推廣至其他市場
Jump 偵測敏感性 ：BPV 方法在極端行情（COVID 2020、2022 Fed 緊縮）可能低估 jump 頻率
夜盤趨勢外推 ：56.5% 夜盤佔比的趨勢延伸需謹慎，結構性因素（如台灣法規變更）可能逆轉
tick 資料品質 ：TAIFEX tick 資料的 cleaning pipeline 尚未完全驗證，錯誤的 clean 步驟可能低估真實 RV

結論

用 r² 評估波動率模型，等於用一把只有 30% 精度的尺去量精密零件的誤差。

r² 是 sigma² 的無偏但 noisy 估計。當 noise 佔 71% 時，模型間的細微差異被完全淹沒，排名的信號消失在測量誤差中。5-min RV 提供了更高信噪比的評估基準，Spearman rank correlation 從 0.20 提升至 0.67，意味著我們終於能更可靠地分辨哪個模型真的更好。

此外，夜盤 vol 的結構性上升（24% → 56.5%）說明台指期研究必須納入全時段數據，否則遺漏的不是 edge cases，而是主體。

實驗腳本: experiments/k848_taifex_5min_rv.py 結果數據: experiments/k848_taifex_5min_rv_results.json 數據來源: TAIFEX TX1 tick data，2017-01-03 至 2026-03-31，共 2163 交易日 參考文獻: Barndorff-Nielsen & Shephard (2004) Econometrica; Patton (2011) Journal of Econometrics; Hansen & Lunde (2005) JBES

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

→📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)

新興市場的美元主權債，波動起來的時候，會不會比股市早一步聞到火藥味？如果會，那些免費就能取得的債券 ETF 與信用利差，或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍，結論很乾脆：**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的，不存在可以拿來做日頻預測的領先關係。這是一個 NULL 結果，但它是乾淨、可複現、而且對...

→