一般讀者2026/06/13 下午10:00

同樣都在尾巴加保險，為什麼只有這個模型真的補對？

SPY風險管理模型比較美股極端行情

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

很多風險模型失準，不是因為它看不到平常的波動，而是因為它在大跌那幾天太樂觀。

這次我們拿 6 種 SPY 風險模型去看 2023 到 2024 年的真實市場，想回答一個很實際的問題：

如果你替模型多裝一層「專門處理極端行情」的保險，真的會變準嗎？

答案是：要看你原本的底子是誰。

K536 的結果很整齊。真正有明顯改善的，不是大家熟悉的 GJR 家族，而是 HAR。

K536 violation rates

先看第一張圖。藍色是理論上最差 1% 的日子，橘色是 2.5%。虛線是模型應該要對準的位置。

最刺眼的是 HAR-Normal 。它在 1% 水準的真實踩線率衝到 4.58%，等於模型以為百日一見，市場卻差不多二十多天就來一次。到了 2.5% 水準，它也高到 6.97%。

但 HAR 一旦接上 EVT，數字立刻收斂：

1% 水準從 4.58% 降到 0.60%
2.5% 水準從 6.97% 降到 1.79%

這不是小修，是直接從明顯失真變成接近目標值。

反過來看 GJR，故事就不一樣。

GJR-Normal 在 1% 水準本來就只有 0.40%，已經偏保守但不算壞。加上 EVT 之後，還是 0.40%。也就是說， EVT 對 GJR 幾乎沒多做什麼。

K536 trinity scores

第二張圖把整體分數拉在一起看，差異更清楚。

六個模型裡， HAR-EVT 在 VaR 校準排名拿到 10（Kupiec + Christoffersen + DQ + Trinity 加分 + ES 點，VaR 校準面滿格）。其他三個 GJR 變體都卡在 6，HistSim 是 4，HAR-Normal 只有 2。

⚠️ 要交代清楚的限制 ：HAR-EVT 在 VaR 踩線率上對得很整齊，但在 Expected Shortfall (ES) 回測上 1% 與 2.5% 兩個水準都沒通過 （t=3.34, p≈0.0008；t=7.12, p≈0）。意思是：模型告訴你「踩線那天平均會虧多少」這件事，仍然偏樂觀。所以「VaR 校準滿分」≠「整套尾端風險都對」。

這個結果背後的白話版機制其實不複雜。

GJR 本來就比較會處理市場在壞消息來時的劇烈放大，所以尾巴沒有那麼歪。
HAR 比較像是先把整體波動趨勢抓出來，但尾端形狀還很粗糙。
EVT 最擅長修的，就是那個粗糙的尾巴。

所以 EVT 不是萬靈丹。它不是加在誰身上都會變神兵。

這次真正有用的組合是： HAR 負責看波動節奏，EVT 負責補極端尾端。

這也順手提醒一件很重要的事：不要只看模型名字愈來愈長，就以為保護一定更完整。很多時候，新零件有沒有價值，取決於它補的到底是不是原本最弱的那一塊。

對這組 SPY 資料來說，答案很明白：

HAR 本來缺尾巴，所以 EVT 很有用；GJR 本來尾巴就沒那麼破，所以再加一層幫助有限。

如果你做的是風險管理，不是追求漂亮故事，這種「只在需要的地方加東西」的結果，比全面升級更值錢。

本文基於實驗 k536（腳本：experiments/k536/k536_evt_var.py，結果：experiments/k536/k536_evt_var_results.json）。資料來源：yfinance 的 SPY 與 ^VIX，估計期間 2005-01-01 至 2025，外樣本評估期間 2023-01-01 至 2024-12-31，樣本 502 個交易日。比較模型包含 GJR-Normal、GJR-Student-t、GJR-EVT、HAR-Normal、HAR-EVT 與 HistSim。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

VIX 跌破 16 之後：三個波動率裂縫，比恐慌指數本身更值得留意

# VIX 跌破 16 之後：三個波動率裂縫，比恐慌指數本身更值得留意 VIX 這五個交易日一路探底：6/29 收 17.65，6/30 收 16.45，7/1 收 16.59，7/2 收 16.15，7/3 美股開盤前來到 15.84。連 16 這個心理關卡都守不住，是今年少見的低檔區。 FRED 資料顯示，7/1 當天 VIX3M 收在 19.16，比現貨 VIX 的 16.59 高出 2...

→📄

波動率「測不準」能不能當減碼訊號？六檔 ETF、六十天的老實答案

打開任何一套波動率監控面板，你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個，用當天的開盤、最高、最低、收盤算出另一個，把隔夜跳空也加進去又是一個。多數時候它們差不多，偶爾會明顯對不上。這篇想回答一個很實際的問題：當這些數字彼此吵起來的時候，是不是代表隔天更難預測、應該先把部位縮小一點？ ## 先講清楚「分歧」是什麼把量測市場波動的方法想像成幾支溫度計。它們原理不同、...

→📄

把五分鐘資料切得更細，預測真的會更準嗎？台指期給了一個保守答案

做波動率預測時，很容易想把資料切得更細。一天一筆收盤價太粗，那就看每五分鐘一筆；只看總波動太粗，那就再拆成上漲、下跌、跳動、估計噪音。直覺上，資料越細，模型應該越聰明。這次台指期日盤實測給的答案比較冷靜：細資料有幫助，但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動，期間從 2017-05-16 到 2026-06-29，共 2219 個原始交易日。正式可判斷的樣本外...

→

讀者互動

相關文章