← 研究動態
研究2026/04/06 上午03:03

K885 實證:極值理論的理想與現實——EVT-VaR 跨資產比較分析

EVTVaRHistSimnull result極值理論

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

摘要

本文報告實驗 K885 的實證結果:在 5 個資產、6 種 VaR 方法、2 個信賴水準(1% 和 5%)的系統性比較中,我們發現 純 EVT(Peaks-over-Threshold)在 Trinity 測試的通過率僅 20%,為所有方法中最差 ;而「GARCH + EVT」混合法的表現則與傳統 HistSim 相當(均為 60% @ 1%)。0050.TW 在 1% VaR 水準下,無論任何方法均全數失敗。這個 null result 具有重要的實踐意涵: 理論的優雅不等於實際的優越 。


1. 研究背景

極值理論(Extreme Value Theory, EVT)在學術界被廣泛推崇為處理尾端風險的理論最優方法。McNeil & Frey(2000)提出的「先用 GARCH 過濾條件異質變異,再對標準化殘差的尾端用 Generalized Pareto Distribution(GPD)擬合」的兩步驟法,理論上比正態分配假設或歷史模擬法(HistSim)更能捕捉極端損失的統計特性。

但 理論上的優越,是否在實際的 VaR 回測中也能體現? 

本實驗基於 K824v2(HistSim vs Student-t 比較)和 K829(跨資產驗證)的成果,進一步納入 EVT 相關方法,在 後 COVID 期間(2019–2024) 的市場環境中進行嚴格的 Trinity 檢定 + ES 回測。


2. 研究設計

  •  資產 :SPY(標普 500)、QQQ(那斯達克 100)、GLD(黃金)、EEM(新興市場)、0050.TW(台灣 50)
  •  方法 :Normal、Student-t、HistSim(500 天窗口)、Skewed-t、EVT-PoT、GARCH+EVT
  •  OOS 期間 :2019-01-01 至 2024-12-31(SPY/QQQ/GLD/EEM 各 1,510 個交易日;0050.TW 1,456 個交易日)
  •  模型 :GJR-GARCH(1,1),每 63 個交易日重新估計(共 24 次)
  •  評估架構 :Trinity 檢定(Kupiec + Christoffersen + Basel 紅綠燈)+ ES 回測(Acerbi-Szekely Z2 統計量)+ Fissler-Ziegel 聯合評分
  •  EVT 閾值 :損失的第 90 百分位(即最差 10% 損失用 GPD 擬合),依 McNeil & Frey(2000)設定

防錯控制(依 CLAUDE.md Error Log):

  • 0050.TW 使用 clean_tw50_data() 處理 2014 年前的分割未調整問題
  • Student-t 使用正確的 scale 項 sqrt((df-2)/df)
  • GARCH OOS 使用遞迴更新 h[t]=f(h[t-1], r2[t-1]),無 stale variance

3. 主要結果:Trinity 通過率總覽

以下是 6 種方法在 5 個資產、1% 和 5% VaR 水準的 Trinity 通過情況(通過數/5,括號為通過率):

方法1% VaR 通過率5% VaR 通過率備注
Normal2/5(40%)5/5(100%)1% 偏低:過度估計 violation
Student-t3/5(60%)5/5(100%)K824v2 確認
HistSim3/5(60%)5/5(100%)K824v2 確認,1% SPY 最佳
Skewed-t4/5(80%)4/5(80%)5% 下 EEM 失敗
 EVT-PoT  1/5(20%)  1/5(20%)  最差:VaR 過寬,Basel 黃燈 
GARCH+EVT3/5(60%)5/5(100%)與 HistSim 相當

 EVT-PoT 在 5% VaR 也同樣只通過 1 個資產 ,顯示問題不只存在於極端 1% 水準。


4. Fissler-Ziegel 聯合評分(越高越好,負值為正常)

FZ score 同時評估 VaR 與 ES 的聯合準確性(Fissler & Ziegel, 2016),是最嚴格的整體評估指標:

方法FZ @ 1%(跨資產平均)FZ @ 5%(跨資產平均)排名
EVT-PoT-4.793-5.286第 1(最佳)
Skewed-t-5.329-5.697第 2
GARCH+EVT-5.349-5.707第 3
HistSim-5.369-5.717第 4
Student-t-5.472-5.809第 5
Normal-5.910-5.936第 6

FZ score 的結果呈現出一個 矛盾 :EVT-PoT 在聯合評分上最佳,但在 Trinity 通過率上最差。這表明 EVT-PoT 的 VaR 在數量上更準確(尾端損失估計符合 ES 的聯合分布),但因為產生了 過寬的 VaR 區間 (avg width 0.041 vs HistSim 0.030),在 Basel 的黃燈/紅燈計數規則下反而被懲罰。


5. 0050.TW:全面失敗案例

台灣 50 ETF 在  1% VaR 水準下,6 種方法全數 Trinity 失敗 :

方法Kupiec p 值Basel 燈號(250 天)Trinity
Normal0.023 FAIL黃燈(8 次)失敗
Student-t0.882 PASS黃燈(5 次)失敗
HistSim0.882 PASS黃燈(5 次)失敗
Skewed-t0.487 PASS黃燈(5 次)失敗
EVT-PoT0.676 PASS黃燈(5 次)失敗
GARCH+EVT0.676 PASS黃燈(5 次)失敗

注意:Student-t、HistSim 等方法的 Kupiec 和 Christoffersen 均通過,但  Basel 250 天窗口內有 5 次違反(黃燈門檻為 ≤4) ,導致 Trinity 失敗。這顯示 Basel 標準對亞洲新興市場 ETF 特別嚴格——0050.TW 的 violation clustering 在市場壓力時期(如 2020 COVID、2022 升息)特別集中。

在  5% VaR 水準 ,0050.TW 的多數方法可以通過 Trinity,與歐美市場表現一致。


6. 關鍵發現:為什麼純 EVT 表現最差?

EVT-PoT 的問題根源在於  GPD 閾值過寬導致的 VaR 過度保守化 :

  1.  窗口限制 :擬合 GPD 只用損失前 10%,實際樣本量約 150 筆(500天 × 0.1 × 3 年窗口),估計不穩定
  2.  過寬 VaR :EVT-PoT 的 1% VaR 平均寬度 0.041,比 HistSim 的 0.030 寬 37%。Basel 的黃燈不只看 violation rate,也隱性地偏好「預測寬度合理的模型」
  3.  FZ 悖論 :EVT-PoT 的 FZ score 最佳,顯示其 尾端 ES 預測準確 ,但 VaR 本身因過寬而被 Basel 規則懲罰

反之,「GARCH+EVT」混合法因為先用 GARCH 過濾時變波動率,殘差的 GPD 擬合更穩定,VaR 寬度(0.031)接近 HistSim(0.030),從而達到相當的 Trinity 通過率(1% 為 3/5,5% 為 5/5)。


7. 與 K824v2 的連結

K824v2 已確立「HistSim 在 1% VaR 上優於 Student-t,兩者均優於 Normal」。本實驗在此基礎上增加 EVT 方法後,結論延伸為:

  • HistSim 在 Trinity 通過率上 與 GARCH+EVT 並列 (1% 均為 3/5)
  • 若要追求 FZ score(聯合 VaR+ES 準確性),EVT-PoT 最優
  • 若追求 Basel 合規(Trinity 通過),HistSim 或 GARCH+EVT 最佳
  • 純 EVT-PoT  不應直接用於 Basel 合規的風險管理 

8. 結論:理論優雅 ≠ 實務優越

本實驗的結論是一個典型的  null result ——EVT 方法在理論上最能捕捉極端尾端風險,但在 Basel III Trinity 框架下, 純 EVT-PoT 是所有 6 種方法中最差的 (1% Trinity 通過率僅 20%)。

實踐建議:

  1.  一般機構風控(Basel 合規優先) :HistSim 或 GARCH+EVT,兩者 Trinity 通過率相當(60% @ 1%)
  2.  尾端 ES 管理(IFRS 9 / Basel III.5 ES 框架) :考慮 EVT-PoT 或 Skewed-t,因其 FZ score 較佳
  3.  台灣市場(0050.TW) :1% VaR 無法通過任何方法的 Trinity,建議使用 5% VaR 或提高資本緩衝倍數
  4.  混合策略 :GARCH+EVT 是最平衡的選擇,保留 EVT 的尾端優勢,同時透過 GARCH 過濾提升穩定性

 局限性 :樣本期間 2019–2024 包含 COVID 極端事件(2020)和升息衝擊(2022),可能對需要更多尾端觀測值的 EVT 方法特別不利。較長期的樣本(如 2005–2024)可能給出 EVT 更公平的評估機會。


參考文獻

  • McNeil & Frey (2000): Estimation of tail-related risk measures for heteroscedastic financial time series. Journal of Empirical Finance.
  • Embrechts, Kluppelberg & Mikosch (1997): Modelling Extremal Events. Springer.
  • Acerbi & Szekely (2014): Back-testing Expected Shortfall. Risk.
  • Fissler & Ziegel (2016): Higher order elicitability. Annals of Statistics.
  • Hansen (1994): Autoregressive conditional density estimation. International Economic Review.
  • K824v2: HistSim vs Student-t Trinity 比較(SPY 確認)
  • K829: 跨資產 VaR 方法驗證

本文基於實驗 K885 的實證結果(數據來源:yfinance,期間:2019-2024)

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...
📄
K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關
# K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題:市場價格相對帳面淨值的折價,能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料,包含 27 家仍上市美國區域銀行,以及 KRE、KBE 兩個銀行 ETF;主...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...