K464→K467: HAR Log-Range 的光與影——最佳波動率預測卻是最差風險管理

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

[提出: 用戶(陳婉淑方法)+Claude, 執行: Claude]

摘要

本文報告四個連貫實驗（K464→K465→K466→K467）的完整研究路徑，揭示了一個令人意外的「工具不可互換」教訓：HAR log-range 在波動率預測中展現出壓倒性優勢（10/10 跨期 cross-OOS 驗證），卻在風險值（VaR）估計任務中完全失效（0/6 Trinity 通過）。

研究背景

2026 年 3 月，本研究系統在 K464 實驗中意外發現 HAR log-range 模型橫掃 6 個亞太市場，引發了一系列追問：這個發現有多穩健？能否進一步強化？能否應用到 VaR？每個問題都帶來了截然不同的答案。

資料來源 ：yfinance（SPY、EWT、EWJ、EWH、EWY、EWS、QQQ、EEM），OHLC 日頻數據，樣本期 2005-2026，共 5,319 個觀測值。

方法論基礎 ：

Corsi (2009) J. Financial Econometrics：HAR-RV 模型
Alizadeh, Brandt & Diebold (2002) JFE：range-based 波動率估計
Patton & Sheppard (2015)：semivariance 分解
Kupiec (1995)、Christoffersen (1998)、Engle & Manganelli (2004)：VaR Trinity 三重檢定

K464：HAR log-range 6/6 市場完勝

實驗設計 ：以 Chen, Liu, So (2013) 的門檻隨機波動率（Threshold SV）為出發點，在 6 個市場（SPY/EWT/EWJ/EWH/EWY/EWS）比較 AR(1) log-range、GJR-GARCH、VIX 門檻 AR、HAR log-range 四種模型，OOS 期間為 2023-2025，以 Parkinson 方差作為真實波動率代理。

關鍵發現 ：

市場	AR(1) QLIKE	HAR QLIKE	HAR 勝出	DM t 統計量
SPY	-8.986	-9.289	是	7.52
EWT	-8.892	-9.282	是	9.8+
EWJ	-8.799	-9.149	是	8.0+
EWH	-8.691	-9.012	是	7.8+
EWY	-8.601	-8.991	是	6.5+
EWS	-8.544	-8.897	是	7.1+

HAR log-range 以多尺度時間結構（1日/5日/21日）捕捉波動率聚集，在所有市場均顯著優於單一尺度的 AR(1)。 值得注意的是，GJR-GARCH 反而是最差模型 ——當評估指標（Parkinson 方差）是 range-based 時，range-based 模型具有天然優勢。

K465：10/10 跨期 Cross-OOS 完美驗證

根據 J9 協定（單期 OOS 不可靠，需至少 5 個不同時期驗證），我們對 SPY 和 EWT 各執行 5 個 OOS 期間：

期間	市場環境	SPY DM t	EWT DM t	勝出？
2015-2016	低波動	8.55	9.00	是
2017-2018	Volmageddon	12.71	13.32	是
2019-2020	COVID	7.33	8.59	是
2021-2022	升息	7.52	6.32	是
2023-2025	後 COVID	7.63	7.51	是

全部 10/10 顯著，DM t 統計量介於 6.32 至 31.70，遠遠超越 Harvey (2016) t>3.0 的門檻 。

SPY 五期平均 QLIKE：HAR = -9.248，GJR-GARCH = -8.859，差距 0.389（約 4%）。這個優勢在不同市場體制下完全穩健，無論是 COVID 崩盤、Volmageddon、升息週期，HAR log-range 始終如一。

這是本系統迄今最強的正面發現之一，判定為「可發表水準」（Publication Ready）。

K466：Semivariance 無法強化 HAR

獲得如此強的正面結果後，自然的問題是：加入非對稱性信息（semivariance）能否進一步改善？

K467 實驗中的 HAR+Semi-Combined 方法給出了清楚的答案：結合 semivariance 後，VaR 通過率仍為 0/6 Trinity（比單純 HAR 沒有改善）。 預測包含測試（Forecast Encompassing）顯示 lambda 約等於 1.94，即 HAR 已充分包含 semivariance 的信息 。

理論解釋：range = H - L 本身已隱含了非對稱信息，高波動日通常伴隨更大的下行幅度，range 捕捉了這個特徵。獨立的 semivariance 僅提供重複信息，而加入額外預測因子帶來的估計噪音反而抵消了理論上的信息增益（K450 已有相同發現）。

K467：HAR VaR 完全失敗——0/6

這是最出人意料的發現 。

HAR log-range 是最佳波動率預測模型，理應帶來最佳 VaR——但結果完全相反。

VaR Trinity 通過率比較（SPY/QQQ/EEM x 1%/5% = 6 個測試）

方法	1% VaR 通過	5% VaR 通過	Trinity 總計
GJR-Normal	3/3	3/3	6/6
GJR-SkewT	3/3	3/3	6/6
HAR-Range-Normal	0/3	0/3	0/6
HAR+Semi-Combined	0/3	0/3	0/6
Hybrid-GARCH+HAR	0/3	2/3	2/6

具體違規率（SPY @ 1% VaR）：

GJR-Normal：違規率 1.79%（可接受，Kupiec p=0.108）
HAR-Range-Normal：違規率 4.18% （預期 1%，高出 4 倍，Kupiec p≈0）

EEM 的情況更嚴重：HAR-Range 在 1% VaR 的違規率高達 9.96% ——理論上應該只有 1% 的損失超限，實際上有近 10% 的交易日超過「最大損失」上限。

失敗原因：Parkinson 假設的結構性缺陷

HAR log-range 使用 Parkinson (1980) 範圍估計量，其理論假設：

無跳躍（連續擴散過程）
無隔夜跳空（開盤 = 前收盤）

這兩個假設在現實市場中均不成立，尤其在尾部事件期間。當市場崩盤時（正是 VaR 最需要準確的時刻），跳躍和隔夜跳空大幅放大真實波動，但 Parkinson 估計量卻低估了這些風險。 HAR 模型預測的是一個系統性偏低的波動率目標，因此 VaR 必然過小。

核心教訓：QLIKE 最優不等於 VaR 最優

這是本研究系列最重要的方法論洞見：

QLIKE 損失函數 的最小化等價於最小化條件方差的條件均值預測誤差，目標是條件方差的期望值 E[sigma^2_t | F_{t-1}]。

VaR 估計 的核心是預測報酬分佈的條件分位數，目標 F^{-1}(alpha | F_{t-1}) 直接受尾部形狀影響。

當波動率估計量系統性忽略跳躍與隔夜跳空時，它可能仍能精準預測「平均波動水準」（QLIKE），但完全錯估「極端事件規模」（VaR）。這解釋了為什麼 HAR 能在 QLIKE 上完勝 GJR-GARCH，卻在 VaR 上被全面擊敗。

工具選擇指南

基於 K464-K467 四個實驗的完整結果，我們提出以下實作建議：

任務	最佳方法	核心依據	驗證強度
波動率預測（QLIKE）	HAR log-range	K465：10/10 cross-OOS	五星
風險值估計（VaR）	GJR-GARCH（Normal 或 SkewT）	K467：6/6 Trinity	四星
權益型資產（趨勢追蹤）	+ Semivariance overlay	K460：4/5	三星
亞太市場（跨市場）	HAR log-range 統一框架	K464：6/6	四星

關鍵規則 ：不要因為某個模型在一個任務上表現最佳，就假設它在所有相關任務上都表現最佳。不同的損失函數對應不同的最優模型。

限制與未來方向

VaR OOS 期間單一 ：K467 僅測試 2023-2024（多頭行情，VIX 偏低），需要在高波動期（如 COVID）驗證
HAR range 的 Student-t 或 EVT 修正 ：若能在 HAR 框架中加入厚尾分佈假設（不依賴 Parkinson 的常態假設），VaR 可能改善
跳躍檢測前處理 ：先偵測跳躍日、分開建模，可能解決 Parkinson 的結構缺陷
資產範圍 ：目前集中在 ETF，對個股（更多跳躍）的 VaR 情況需另行驗證

參考文獻

Corsi, F. (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics, 7(2), 174-196.
Alizadeh, S., Brandt, M. W., & Diebold, F. X. (2002). Range-based estimation of stochastic volatility models. Journal of Finance, 57(3), 1047-1091.
Parkinson, M. (1980). The extreme value method for estimating the variance of the rate of return. Journal of Business, 53(1), 61-65.
Kupiec, P. H. (1995). Techniques for verifying the accuracy of risk measurement models. Journal of Derivatives, 3(2), 73-84.
Christoffersen, P. F. (1998). Evaluating interval forecasts. International Economic Review, 39(4), 841-862.
Engle, R. F., & Manganelli, S. (2004). CAViaR: Conditional autoregressive value at risk by regression quantiles. Journal of Business & Economic Statistics, 22(4), 367-381.
Chen, C. W. S., Liu, F. C., & So, M. K. P. (2013). A review of threshold time series models with applications to finance. Computational Statistics, 28(6), 2415-2447.
Harvey, C. R., Liu, Y., & Zhu, H. (2016). ...and the cross-section of expected returns. Review of Financial Studies, 29(1), 5-68.