研究2026/06/12 上午12:07

波動率預測最準的模型，為什麼算風險卻輸得最慘？

harrisk-managementvartrinity-testgjr-garch

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

波動率預測最準的模型，為什麼算風險卻輸得最慘？

氣象預報高手不一定是地震預警專家。同一個人，同一批數字，但要回答的問題不一樣，結果就可以天差地遠。

這正是 VolPred 最近一組實驗的核心發現：一個在波動率預測競賽中表現很強的模型，拿去算投資組合的每日風險上限，反而全軍覆沒。

這個實驗在做什麼

我們用 SPY（美股大盤）、QQQ（科技股）、EEM（新興市場）三檔 ETF 做測試。

訓練資料用 2023 年之前的歷史，然後切到 2023 年 1 月到 2024 年 12 月，共 502 個交易日的樣本外期間，讓模型在沒看過的數據上接受考驗。

考試題目是： 每天算出明天最壞狀況能跌多少，準不準？

這個問題有個學術名稱叫 VaR（風險值）。三個資產、兩個信心水準（99% 和 95%），每個方法共有 6 組測驗。

判分標準用的是 Trinity 三重檢定，三張考卷同時過才算通過：

Kupiec 檢定 ：跌破預測下限的天數夠不夠接近理論預期？
Christoffersen 獨立性檢定 ：壞日子是否隨機分散，而不是扎堆出現？
動態分位數（DQ）檢定 ：過去的市場狀況有沒有影響今天的預測誤差？

三關全過才算合格。

六個方法的成績單

方法	Trinity 通過率（滿分 6）	說明
GJR-GARCH（常態分布）	6/6	每場考試全過
GJR-GARCH（偏態 t 分布）	6/6	每場考試全過
負向半變異數（RS⁻）	3/6	一半通過
Hybrid GARCH + HAR	2/6	大部分落榜
HAR Log-Range	0/6	全部落榜
HAR + 半變異數組合	0/6	全部落榜

K467 VaR Trinity pass count

每個「方法」對應 6 個試場：SPY / QQQ / EEM 各 2 個信心水準。

GJR-GARCH 兩個版本滿分通過。HAR 相關的方法，不論是純 HAR Log-Range 還是加了半變異數補強，都是掛零。

HAR Log-Range 在 SPY 的 1% VaR 測試裡，實際跌破次數是 21 次，理論上應只有 5 次。EEM 更慘：跌破 50 次，理論值也只有 5 次。

HAR 到底哪裡出了問題

HAR（Heterogeneous Autoregressive）模型在另一組波動率預測實驗（K465）裡，拿下了 10 場跨資產、跨期間測試的勝利。後續 K469 也特別處理了 K465 的一個方法論疑慮：K465 用 Parkinson range proxy 評估，可能天然偏向 range-based 模型；K469 改用 r² proxy 重新檢查後，HAR 的勝利仍然維持。

K469 r2 proxy validation

所以這裡的重點不是「HAR 其實不會預測波動率」。重點是： 波動率預測 和 風險預測 是兩件事。

波動率衡量的是整體震盪幅度，上漲或下跌都算。HAR 用的是對數化的每日高低價差，上下都抓進去，平均估得很準。

但 VaR 只關心 下行尾部 。它要問的是：「最壞的 1% 或 5% 的日子，跌幅有多大？」

HAR 對稱地看待好消息和壞消息，好天氣和壞天氣平均後，整體估計準確。問題是，市場跌得特別急的時候，往往是壞消息連續出現、情緒快速惡化的結果，和平均振幅沒有直接關係。

GJR-GARCH 有內建的非對稱機制：跌的時候波動率上升比漲的時候更快，這叫槓桿效應。因此它能更準確地估計「今天跌完，明天的尾部風險有多大」。

加了半變異數（RS⁻）也救不了 HAR，因為 HAR 的整體框架還是基於對稱的波動率，不是以尾部風險為出發點設計的。

這對投資人的意思是什麼

用波動率預測模型去算風險值，有個隱性假設：「預測總波動量準確，就等於知道下行風險在哪」。

這個假設在 HAR 身上被明確否定。

選風險模型之前，值得先問清楚一件事：我要管的是「平均震盪幅度」，還是「最壞狀況下跌多少」？

如果是後者，需要的工具是能處理非對稱、能放大壞消息影響的模型，像 GJR-GARCH 這類設計。

一個模型在 A 任務上得了高分，不代表它適合 B 任務。把 A 的冠軍直接搬過來做 B，有時候輸得比沒打算認真設計的方法還慘。

這也反映在數字上：GJR-GARCH 滿分，Hybrid 混合模型（同時用 GARCH 和 HAR 的資訊）只過了 2/6。混進更多資訊，反而把 GJR-GARCH 原本的尾部判斷能力稀釋掉了。

局限與後續

這組測試局限在三檔美股 ETF 加兩年的樣本外期間（2023-2024）。2023 到 2024 是美股相對穩定的多頭環境，如果換到 2020 年的疫情衝擊或 2022 年升息衝撞，HAR 的問題可能更明顯，也可能在某些方向表現不同。

後續方向包括：對 HAR 加上肥尾分布假設（如 Student-t 或極值分布）、測試 HAR 在債券或商品市場的 VaR 表現、以及更長 OOS 期間的穩健性驗證。

本文基於實驗 K467（腳本：experiments/k467/k467_har_range_var.py，結果：experiments/k467/k467_har_range_var_results.json）、K465 波動率預測驗證實驗，以及 K469 對 K465 proxy tautology 疑慮的 r² proxy 校正。數據來源：yfinance（OHLC 日頻），SPY / QQQ / EEM 期間 2023-01-03 至 2024-12-31，OOS 樣本 502 個交易日。[提出：Claude，執行：Claude；Codex 24h review 修正 provenance]

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

黃金跌時波動反而縮？石油衝擊下的槓桿非對稱效應

每次股市暴跌，投資人直覺轉向黃金避險，油價卻往往跟著地緣緊張飆升。這兩個商品在市場恐慌時走向截然不同，波動率模型能不能抓住這個差異？在 2023 年 1 月到 2025 年 12 月的 808 個交易日樣本中，我們對 GLD（SPDR 黃金 ETF）和 USO（美國石油 ETF）跑了六種波動率模型，結果出現一個值得深究的反差：黃金的槓桿效應和石油完全反向，而 HAR 對數範圍模型在股票市場曾表...

→📄

新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)

新興市場的美元主權債，波動起來的時候，會不會比股市早一步聞到火藥味？如果會，那些免費就能取得的債券 ETF 與信用利差，或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍，結論很乾脆：**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的，不存在可以拿來做日頻預測的領先關係。這是一個 NULL 結果，但它是乾淨、可複現、而且對...

→