研究2026/06/02 上午01:1513 次瀏覽

換了更好的模型，風險計算卻沒變好多少：36 場測試告訴你，關鍵在哪裡

GJR-GARCHGLDQQQSPYVaR波動率風險管理

讀者互動

13 次瀏覽，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

換了更好的模型，風險計算卻沒變好多少：36 場測試告訴你，關鍵在哪裡

[提出: 用戶, 執行: Claude]

有個問題值得想一想：如果你現在用的波動率模型不夠準，你應該換一個更好的模型，還是換一個更好的計算方式？

大多數人的直覺是「換模型」。模型更複雜、更聰明，風險估計自然更準。但 36 場跨資產測試的結果，給出了不一樣的答案。

實驗怎麼設計的

我們跑了一個 2×3 的組合設計：2 種波動率模型乘上 3 種 VaR 計算方式，再對 SPY（美股大盤）、QQQ（科技股 ETF）、GLD（黃金 ETF）三個資產，各用 2.5% 和 1% 兩個風險水準測試，總共 36 場獨立比較。

模型側：GJR-GARCH 是業界標準，捕捉下跌時波動放大的不對稱效應；A4f-VIX 是它的升級版，多引入 VIX²（恐慌指數平方）作為外部資訊，對高波動期估計更準。

方法側：Normal 假設報酬是鐘形曲線；Student-t（df=8）承認尾巴比常態厚；CF-Rolling 用 Cornish-Fisher 展開式，每次取最近 252 個交易日的偏度和峰度動態修正分位數，不假設固定分配形狀。

評分標準用 Trinity Test，要同時通過 Kupiec 違約率檢定、Christoffersen 獨立性檢定、Basel 交通燈三關，全 PASS 才算合格。OOS 期間從 2019 年起約 1,827 個交易日，包含 COVID 崩盤。

結果一張表看完

模型\方法	Normal	Student-t	CF-Rolling
GJR	0/6	1/6	6/6
A4f	1/6	5/6	6/6

6 表示在 3 個資產 × 2 個風險水準上全部通過 Trinity Test。

K1036 Trinity PASS rate 熱力圖

圖一：2×3 設計下各組合的 Trinity PASS 率。CF-Rolling 欄無論搭哪個模型都是全綠（100%）；Normal 欄幾乎全紅。

把兩個效應分開來看

換模型（GJR → A4f）的平均效果：Trinity 通過率從 38.9% 升到 66.7%，差了 +28 個百分點 。

換計算方式（Normal → CF-Rolling）的平均效果：從 8.3% 升到 100%，差了 +91 個百分點 。

方法的效應，比模型的效應大三倍多。

這不是說 A4f 沒用。A4f 的強項在 Student-t 那一列：GJR+Student-t 只有 1/6，A4f+Student-t 跳到 5/6。這說明 A4f 的確把條件方差估得更準，讓 Student-t 的分配假設站得住腳。但問題是，一旦換到 CF-Rolling，兩個模型都直接 6/6，A4f 的優勢在這裡看不見了。

K1036 各資產違約率比較

圖二：各方法在三個資產的實際違約率對照目標值。Normal 和 Student-t 多數超標；CF-Rolling 無論哪個模型都緊貼目標線。

違約率差在哪

拿 SPY 的數字來對照。設定的風險水準是 2.5%，意思是每 100 個交易日裡，允許最多 2.5 天損失超過 VaR。

GJR+Normal 的實際違約率：3.72%，每 100 天多出 1.2 次非預期損失。Kupiec p 值 0.0018，硬性被判不合格。GJR+Student-t 好一點，3.50%，仍然超標。換到 GJR+CF-Rolling：2.19%，p 值 0.385，完全在容忍範圍內。

A4f+CF-Rolling 的 SPY 違約率也是 2.19%，和 GJR+CF-Rolling 幾乎一樣。模型換了，違約率幾乎沒動，這就是 CF-Rolling 主導結果的直接證據。

GLD 的 1% 水準，CF-Rolling 不管哪個模型，違約率都落在 1.04%~1.09%，幾乎完美。同樣條件下，Normal 的違約率是 1.75%~1.81%，等於每年多出兩次被 Basel 紅燈的機會。

為什麼方法效應這麼大

Normal VaR 假設報酬是鐘形曲線，左右對稱、尾巴輕薄。SPY、QQQ、GLD 都有明顯的左偏態和厚尾，大跌比大漲常見，極端跌幅比常態模型預期的更深。分配假設整個就錯了，模型算得再準也補不回來。

CF-Rolling 繞過分配假設。每 63 天重估一次 GARCH 參數，從最近 252 天的標準化殘差算出當下的偏度和峰度，代入 Cornish-Fisher 展開式調整分位數。市場平靜時偏度小，VaR 不會算太保守；波動劇烈時峰度飆高，VaR 自動外推。

打個比喻：GJR 和 A4f 都是溫度計，A4f 的精度稍高。CF-Rolling 做的事情更像是先把量測環境校正到位，讓哪把溫度計讀出來都對。

Student-t 也在修正尾巴，但用固定的自由度 df=8，不管市場狀態怎麼變，永遠是同一個形狀。2019 年的平靜期和 2020 年的崩盤，同一個 df=8 應付，顯然不夠靈活。CF-Rolling 每年都重新估計，跟著市場走。

對投資人的含義

如果你在用某個風險管理工具，背後用的是常態分配的 VaR（很多券商的保證金計算工具都是），這組實驗告訴你：在三個主流資產上，這類工具的違約率比設計值高 40%~60%。你以為 VaR 設定在 2.5%，實際上 3.7% 的天數你都可能超過這個損失。

更重要的發現：風控品質的差距，主要來自「換對分配假設的計算方式」，模型升不升級是次要的。A4f 比 GJR 貴，需要外部數據（VIX），計算也複雜。但如果目的是讓 VaR 合格，CF-Rolling + GJR 就夠了，完全不需要升級到 A4f。

如果你要的是波動率預測本身的精度（QLIKE 指標），A4f 的優勢仍然成立，過去的實驗也有記錄。但在風控合規這個維度，方法的選擇比模型的選擇更關鍵。

K1036 各資產詳細比較

圖三：各資產在不同模型與方法組合下的詳細通過率，可以看到 CF-Rolling 的效應跨資產一致。

局限

這次測試的 OOS 期間是 2019-2026，包含 COVID 崩盤，但也只是 7 年的一個區間。測試的資產是美股 SPY、QQQ 和黃金 GLD，沒有台股或新興市場。CF-Rolling 的窗口固定在 252 天，不同長度是否一樣有效，這裡沒有測試。

還有一個設計上的侷限：Student-t 的自由度固定為 8，沒有跟 GARCH 一起做最大概似估計，這可能讓 Student-t 的效果偏保守。真正聯合估計的 df，可能讓 Student-t 的表現比這裡看到的好一些。

本文基於實驗 K1036（腳本：experiments/K1036/k1036.py，結果：experiments/K1036/k1036_results.json）。資料來源：yfinance，期間 2005-01-01 至 2026-04-10，OOS 期間 2019-01-01 起共約 1,827 個交易日，涵蓋 SPY、QQQ、GLD 三個資產。相關實驗：K1034（CF-Rolling 6/6 Trinity PASS）、K1035（A4f Student-t 4/4 PASS）。

附注：文中 +28pp / +91pp 為 factorial main effect：A4f 平均 PASS rate（12/18=66.7%）減 GJR 平均（7/18=38.9%）= +27.8pp；CF-Rolling 平均（12/12=100%）減 Normal 平均（1/12=8.3%）= +91.7pp。兩者均基於 experiments/K1036/k1036_results.json 的 interaction_analysis.combinations 欄位計算。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

科技股財報日的波動放大 3.8 倍，然後兩天就沒了

台積電 7 月 16 日開出第二季財報，接下來三週輪到那幾家美國巨頭。行事曆上，很多人把財報週整週圈起來，減碼、買保護、或者乾脆空手等它過去。圈一整週這個動作，隱含了一個假設：財報會讓股票進入一段比較亂的日子。我把這個假設拿去量。8 檔大型科技股，NVDA、AAPL、MSFT、AMZN、GOOGL、META、TSM、AMD，每檔取最近 12 季，共 96 次財報，樣本從 2023 年 7 ...

→📄

SPY 吃掉九成交易量，這個熱門度卻猜不到下週風險

→📄

🌡️ 事件溫度計｜7/17 大跌前，預警燈亮了嗎？把自家論文拿去對答案

7 月 17 日星期五，台股加權指數收 42,671 點，單日跌 6.47%。一週合計跌了 5.9%，是 2025 年 4 月關稅衝擊以來最重的一週。跌完之後，最自然的問題是：有沒有什麼東西，其實早就在示警？這一題我們有私房工具。VolPred 的研究團隊今年有一篇論文獲期刊接受，主題就是「大跌之前，風險的組成會先變形」。與其空談，我們直接把論文的方法丟進這次的台股，對答案。順便做了一件更...

→