← 研究動態
研究2026/06/12 上午12:07

波動率預測最準的模型,為什麼算風險卻輸得最慘?

harrisk-managementvartrinity-testgjr-garch

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

波動率預測最準的模型,為什麼算風險卻輸得最慘?

氣象預報高手不一定是地震預警專家。同一個人,同一批數字,但要回答的問題不一樣,結果就可以天差地遠。

這正是 VolPred 最近一組實驗的核心發現:一個在波動率預測競賽中表現很強的模型,拿去算投資組合的每日風險上限,反而全軍覆沒。


這個實驗在做什麼

我們用 SPY(美股大盤)、QQQ(科技股)、EEM(新興市場)三檔 ETF 做測試。

訓練資料用 2023 年之前的歷史,然後切到 2023 年 1 月到 2024 年 12 月,共 502 個交易日的樣本外期間,讓模型在沒看過的數據上接受考驗。

考試題目是: 每天算出明天最壞狀況能跌多少,準不準? 

這個問題有個學術名稱叫 VaR(風險值)。三個資產、兩個信心水準(99% 和 95%),每個方法共有 6 組測驗。

判分標準用的是 Trinity 三重檢定,三張考卷同時過才算通過:

  1.  Kupiec 檢定 :跌破預測下限的天數夠不夠接近理論預期?
  2.  Christoffersen 獨立性檢定 :壞日子是否隨機分散,而不是扎堆出現?
  3.  動態分位數(DQ)檢定 :過去的市場狀況有沒有影響今天的預測誤差?

三關全過才算合格。


六個方法的成績單

方法Trinity 通過率(滿分 6)說明
GJR-GARCH(常態分布) 6/6 每場考試全過
GJR-GARCH(偏態 t 分布) 6/6 每場考試全過
負向半變異數(RS⁻)3/6一半通過
Hybrid GARCH + HAR2/6大部分落榜
HAR Log-Range 0/6 全部落榜
HAR + 半變異數組合 0/6 全部落榜

K467 VaR Trinity pass count

每個「方法」對應 6 個試場:SPY / QQQ / EEM 各 2 個信心水準。

GJR-GARCH 兩個版本滿分通過。HAR 相關的方法,不論是純 HAR Log-Range 還是加了半變異數補強,都是掛零。

HAR Log-Range 在 SPY 的 1% VaR 測試裡,實際跌破次數是 21 次,理論上應只有 5 次。EEM 更慘:跌破 50 次,理論值也只有 5 次。


HAR 到底哪裡出了問題

HAR(Heterogeneous Autoregressive)模型在另一組波動率預測實驗(K465)裡,拿下了 10 場跨資產、跨期間測試的勝利。後續 K469 也特別處理了 K465 的一個方法論疑慮:K465 用 Parkinson range proxy 評估,可能天然偏向 range-based 模型;K469 改用 r² proxy 重新檢查後,HAR 的勝利仍然維持。

K469 r2 proxy validation

所以這裡的重點不是「HAR 其實不會預測波動率」。重點是: 波動率預測  和  風險預測  是兩件事。

波動率衡量的是整體震盪幅度,上漲或下跌都算。HAR 用的是對數化的每日高低價差,上下都抓進去,平均估得很準。

但 VaR 只關心 下行尾部 。它要問的是:「最壞的 1% 或 5% 的日子,跌幅有多大?」

HAR 對稱地看待好消息和壞消息,好天氣和壞天氣平均後,整體估計準確。問題是,市場跌得特別急的時候,往往是壞消息連續出現、情緒快速惡化的結果,和平均振幅沒有直接關係。

GJR-GARCH 有內建的非對稱機制:跌的時候波動率上升比漲的時候更快,這叫槓桿效應。因此它能更準確地估計「今天跌完,明天的尾部風險有多大」。

加了半變異數(RS⁻)也救不了 HAR,因為 HAR 的整體框架還是基於對稱的波動率,不是以尾部風險為出發點設計的。


這對投資人的意思是什麼

用波動率預測模型去算風險值,有個隱性假設:「預測總波動量準確,就等於知道下行風險在哪」。

這個假設在 HAR 身上被明確否定。

選風險模型之前,值得先問清楚一件事:我要管的是「平均震盪幅度」,還是「最壞狀況下跌多少」?

如果是後者,需要的工具是能處理非對稱、能放大壞消息影響的模型,像 GJR-GARCH 這類設計。

一個模型在 A 任務上得了高分,不代表它適合 B 任務。把 A 的冠軍直接搬過來做 B,有時候輸得比沒打算認真設計的方法還慘。

這也反映在數字上:GJR-GARCH 滿分,Hybrid 混合模型(同時用 GARCH 和 HAR 的資訊)只過了 2/6。混進更多資訊,反而把 GJR-GARCH 原本的尾部判斷能力稀釋掉了。


局限與後續

這組測試局限在三檔美股 ETF 加兩年的樣本外期間(2023-2024)。2023 到 2024 是美股相對穩定的多頭環境,如果換到 2020 年的疫情衝擊或 2022 年升息衝撞,HAR 的問題可能更明顯,也可能在某些方向表現不同。

後續方向包括:對 HAR 加上肥尾分布假設(如 Student-t 或極值分布)、測試 HAR 在債券或商品市場的 VaR 表現、以及更長 OOS 期間的穩健性驗證。


本文基於實驗 K467(腳本:experiments/k467/k467_har_range_var.py,結果:experiments/k467/k467_har_range_var_results.json)、K465 波動率預測驗證實驗,以及 K469 對 K465 proxy tautology 疑慮的 r² proxy 校正。數據來源:yfinance(OHLC 日頻),SPY / QQQ / EEM 期間 2023-01-03 至 2024-12-31,OOS 樣本 502 個交易日。[提出:Claude,執行:Claude;Codex 24h review 修正 provenance]

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...
📄
黃金跌時波動反而縮?石油衝擊下的槓桿非對稱效應
每次股市暴跌,投資人直覺轉向黃金避險,油價卻往往跟著地緣緊張飆升。這兩個商品在市場恐慌時走向截然不同,波動率模型能不能抓住這個差異? 在 2023 年 1 月到 2025 年 12 月的 808 個交易日樣本中,我們對 GLD(SPDR 黃金 ETF)和 USO(美國石油 ETF)跑了六種波動率模型,結果出現一個值得深究的反差:黃金的槓桿效應和石油完全反向,而 HAR 對數範圍模型在股票市場曾表...
📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...