← 研究動態
研究2026/05/19 上午02:00

蒙地卡羅 VaR 真的比較準嗎?一場關於風險估計的反直覺實驗

VaR風險管理尾部風險波動率模型蒙地卡羅

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

蒙地卡羅 VaR 真的比較準嗎?一場關於風險估計的反直覺實驗

一個常見的誤解

當投資人或風控人員第一次接觸「風險值」(Value-at-Risk, VaR)這個概念時,最常聽到的進階方法之一就是「蒙地卡羅模擬」。它聽起來既高科技又嚴謹:用電腦跑上萬次模擬,把所有可能的未來情境都跑過一遍,再從模擬出來的報酬分佈裡讀出風險值。

直覺上,這應該是最準的方法。畢竟「模擬越多次,誤差越小」是統計學的基本道理。但在我們最近的一場系統化實驗中,結果狠狠打臉了這個直覺:在預測「明天的下跌風險」這件事上,蒙地卡羅 VaR 不但沒比較準,反而是表現最差的一群。真正穩居冠軍的,是兩個概念上更老派、實作上也更簡單的方法。

這篇文章要分享的,就是這個反直覺結果背後的故事,以及它對實務風控的啟示。

實驗背景:為什麼要比較這四種 VaR 方法?

在我們先前的研究(K1036 與 K1043)中,已經確認兩件事:

  1.  CF-Rolling (基於歷史殘差的偏態與峰態做修正的方法)在所有測試組合中都能達到嚴格的 6/6 通過。
  2.  FHS (過濾歷史模擬,Filtered Historical Simulation)的表現與 CF-Rolling 完全打平,12/12 全數通過。

剩下還沒系統化測試的就是「蒙地卡羅模擬 VaR」。這個方法在教科書、業界訓練、甚至監理文件裡,地位不亞於前兩者。我們的任務是:把它放進同一個嚴格的測試框架,看它能不能撐住場面。

實驗設計很乾淨:

  •  資產 :SPY(標普 500 ETF)與 QQQ(那斯達克 100 ETF)
  •  資料區間 :2005 年 1 月至 2026 年 4 月(yfinance 取得)
  •  樣本外測試 :2019 年 1 月起的 1827 個交易日
  •  波動率模型 :兩種,傳統的 GJR-GARCH 與我們先前研究表現亮眼的 A4f-VIX 模型
  •  VaR 方法 :四種——MC-Normal、MC-t、CF-Rolling、FHS
  •  顯著水準 :1% 與 2.5%
  •  每日模擬次數 :10,000 次
  •  隨機種子 :42(確保可復現)

每個組合都跑完整的「三位一體」(Trinity)測試:Kupiec 的次數覆蓋率測試、Christoffersen 的條件覆蓋率測試、巴塞爾顏色區(Basel traffic light),再加上 Acerbi-Szekely 的 Expected Shortfall 測試。要全部通過,才算這個 VaR 方法在那個場景下「夠格」。

蒙地卡羅 VaR 怎麼算?

為了避免讓非技術讀者卡關,先用最白話的方式解釋一下蒙地卡羅 VaR 的步驟:

  1. 用 GARCH 模型估出明天的波動率 σ_{t+1}(這一步是確定的,給定今天為止的資訊就能算出來)。
  2. 用電腦產生 10,000 個服從某個分佈的隨機數字 ε(常態分佈或 t 分佈)。
  3. 把每個 ε 乘上 σ_{t+1},得到 10,000 個「模擬的明日報酬」。
  4. 從這 10,000 個模擬報酬中找最差的 1%(或 2.5%)分位數,那就是 VaR。

CF-Rolling 與 FHS 則跳過模擬這一步:CF-Rolling 直接用歷史殘差的偏態與峰態解析地調整 VaR;FHS 把過去 252 天的標準化殘差「重抽樣」乘上今天的波動率。兩者都不用跑萬次模擬。

結果一:MC-Normal 全軍覆沒

先看 GJR-GARCH 搭配各種 VaR 方法(Trinity 通過率,每個組合 4 個測試格子):

方法Trinity 通過觀察
MC-Normal0/4(0%)全部 FAIL
MC-t0/4(0%)全部 FAIL
 CF-Rolling  4/4(100%) 全綠
 FHS  4/4(100%) 全綠

這結果非常極端。MC-Normal 不是輸一點點,而是徹底崩盤。具體看 SPY 在 1% 顯著水準下:

  •  目標違約率 :1.0%
  •  MC-Normal 實際違約率 :2.08%(超標一倍)
  •  MC-t 實際違約率 :1.64%
  •  CF-Rolling 實際違約率 :0.88%
  •  FHS 實際違約率 :1.31%

QQQ 的數字更誇張,MC-Normal 違約率衝到 2.41%,等於說告訴你「百年一遇」的事情,實際上每兩個月就發生一次。難怪巴塞爾顏色區直接判紅燈。

問題出在哪?常態分佈的尾部太薄,根本捕捉不到金融市場那種「黑天鵝其實常常飛」的真實樣貌。這個道理大家都知道,但這次實驗用結結實實的數字告訴我們:哪怕你跑了 10,000 次模擬,如果分佈假設錯了,跑再多次也救不回來。

結果二:MC-t 需要「外援」才能及格

把分佈換成 t 分佈(厚尾),是不是就解決問題了?答案是:要看你用什麼波動率模型。

  •  GJR + MC-t :仍然 0/4 全部 FAIL
  •  A4f + MC-t :4/4 全部 PASS

差別在哪?A4f 模型把 VIX 恐慌指數作為外生資訊納入波動率方程,σ 估得比 GJR 更準。一旦 σ 準了,厚尾分佈才能正確發揮,t 分佈的尾部才能真的對應到尾部風險。

這帶出一個重要訊息: 蒙地卡羅 VaR 的瓶頸不在「模擬次數不夠多」,而在「波動率估得不夠準」加上「分佈假設不夠真實」 。模擬只是把這兩個前提的誤差放大,不是解藥。

結果三:CF-Rolling 與 FHS 才是真正的勝者

把所有 16 個組合(2 資產 × 2 模型 × 4 顯著水準)攤開:

  •  CF-Rolling :8/8 全部通過
  •  FHS :8/8 全部通過
  •  MC-t :4/8 通過(只有 A4f 配合時才行)
  •  MC-Normal :2/8 通過(連 A4f 也只能救一半)

把 GJR 與 A4f 的整體表現再彙總一次:

  •  A4f (VIX 外生):14/16 通過(87.5%)
  •  GJR (純歷史):8/16 通過(50.0%)

A4f 的 VIX 外生資訊讓波動率估計更貼近現實,這個結果與我們先前 K1036、K1043 的發現一致,把市場恐慌指數正確納入模型,比換更花俏的 VaR 計算法效益更大。

反直覺的關鍵洞見

為什麼蒙地卡羅模擬 10,000 次,反而輸給「直接套公式」的 CF-Rolling?

關鍵在於這個實驗的特定情境: 1 天期 VaR 。

  • 在 1 天的尺度上,σ_{t+1} 已經被 GARCH 模型「確定」下來了。蒙地卡羅模擬只是在這個固定的 σ 上面,從某個分佈裡抽 10,000 次樣, 多出來的這層抽樣動作只引入「取樣誤差」,沒有額外資訊 。
  • CF-Rolling 用解析公式,直接根據歷史殘差的偏態、峰態調整分位數,它把高階動差訊息「無損」地用上。
  • FHS 直接重抽歷史標準化殘差,等於用真實市場的尾部形狀當作分佈,連分佈假設都不用做。

換句話說,蒙地卡羅模擬的真正優勢—— 多步預測、多資產組合、跳躍/制度切換、選擇權定價 ——在 1 天期單一資產 VaR 這個場景,根本沒有舞台可以發揮。它變成了「用大砲打蚊子,還沒打中」。

附帶一提,計算成本也很有趣:

方法平均每日耗時
FHS0.1 秒
MC-Normal0.3 秒
MC-t0.6 秒
CF-Rolling11.3 秒

CF-Rolling 雖然準,但因為要逐日計算偏態與峰態,反而最慢。FHS 是準度與速度兼顧的最佳實務選擇,這也是為什麼現在不少銀行內部 VaR 引擎走的是 FHS 路線。

給實務工作者的三點啟示

  1.  方法新穎不等於估得準 。蒙地卡羅模擬聽起來高階,但在 1 天 VaR 上反而是表現最差的一群。決策時要問的是「這個方法的優勢能不能在我的問題上發揮」,不是「這個方法名氣大不大」。

  2.  波動率模型的選擇比 VaR 計算法更關鍵 。把 VIX 外生資訊納入 A4f,比換成蒙地卡羅模擬有效得多。這也呼應一個老話: 估好均值與變異數,是大部分財務應用的基本功 。

  3.  如果你做的是 1 天期 VaR,FHS 是好用的預設選項 。又快又準,不用做分佈假設,是這次實驗最務實的結論。如果你需要做選擇權定價、多步預測、或情境壓力測試,那才是蒙地卡羅模擬真正該登場的舞台。

局限性與下一步

這次實驗只測了 1 天期、兩個美股 ETF(SPY、QQQ),結論不能無限外推:

  •  多步預測(h > 1)  才是蒙地卡羅模擬該大放異彩的場景,這是後續研究計畫的重點。
  • 個股、加密貨幣、期貨等不同資產類別的厚尾結構不同,需要重複驗證。
  • 蒙地卡羅在這次實驗用固定 t 分佈自由度(df=8),沒做最佳化;自由度若隨時間調整可能改善 MC 表現,但不會翻盤。

研究的常態之一就是「打破直覺」。CF-Rolling 與 FHS 不是新方法,文獻可以追到 1938 年的 Cornish-Fisher 與 1999 年的 Barone-Adesi 與 Giannopoulos。但在嚴格的測試框架下,它們繼續打敗看起來更新潮的對手,這就是為什麼我們堅持用同一套標準把所有方法跑過一遍,而不是看誰名字響亮。

資料來源

  •  報酬資料 :yfinance(SPY、QQQ 日線,2005-01-01 至 2026-04-10)
  •  VIX 資料 :Yahoo Finance(同步取自 yfinance)
  •  樣本外期間 :2019-01-02 起,共 1827 個交易日
  •  實驗腳本 :experiments/k1046/k1046.py
  •  完整結果 :experiments/k1046/k1046_results.json
  •  總計算時間 :約 498 秒(多數時間花在 CF-Rolling 的逐日高階動差計算)
  •  隨機種子 :42(蒙地卡羅模擬可復現)

實驗編號與相關研究

本文基於 K1046 實驗。相關前序研究:

  • K1036:A4f + CF-Rolling 達到 6/6 全綠的最早記錄。
  • K1043:FHS 與 CF-Rolling 在 12/12 組合下打平的交叉驗證。

主要參考文獻

  • Pritsker, M. (2006). The Hidden Dangers of Historical Simulation. Journal of Banking and Finance.
  • Glasserman, P. (2003). Monte Carlo Methods in Financial Engineering. Springer.
  • Barone-Adesi, G., Engle, R., & Mancini, L. (2008). A GARCH Option Pricing Model with Filtered Historical Simulation. Review of Financial Studies 21(3), 1223-1258.
  • Barone-Adesi, G., & Giannopoulos, K. (1999). VaR without Correlations for Portfolios of Derivative Securities. Journal of Futures Markets 19(5), 583-602.
  • Engle, R., Ghysels, E., & Sohn, B. (2013). Stock Market Volatility and Macroeconomic Fundamentals. Review of Economics and Statistics 95(3), 776-797.
  • Kupiec, P. (1995). Techniques for Verifying the Accuracy of Risk Measurement Models. Journal of Derivatives 3, 73-84.
  • Christoffersen, P. (1998). Evaluating Interval Forecasts. International Economic Review 39(4), 841-862.
  • Acerbi, C., & Szekely, B. (2014). Back-testing Expected Shortfall. Risk.

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
下半年調倉前,先過三道風險安檢
七月剛開始,很多人會做同一件事:打開帳戶,看上半年哪一塊漲最多,然後問下半年要不要換股、換 ETF、換策略。 我建議先慢一拍。下半年調倉最常犯的錯,常常不在方向判斷,而在把一個很窄的訊號當成整個市場。看到 VIX 低,就以為風險都睡著;看到大盤不太動,就以為成分股也不太動;看到模型回測漂亮,就以為它能幫你穿過下一次亂流。 今天這期精選導讀,把過去幾個月的 8 篇 archive 串成一個簡單工...
📄
同一個波動率模型,換個計算方式還能贏嗎?五個市場階段的穩定性測試
# 同一個波動率模型,換個計算方式還能贏嗎?五個市場階段的穩定性測試 學術研究中的波動率模型,常被質疑一件事:「這個模型是不是只在特定設定下才贏?稍微換個條件就垮了?」 這篇文章要說的,是我們對一個已有正面結論的模型(A4f)做的一次壓力測試。 --- ## 背景:A4f 模型是什麼 A4f 是我們在進行中的論文研究中提出的波動率預測框架。核心想法很直接:預測明天股市的波動率時,把當前的...
📄
尾部風控聽起來更聰明,實測卻只贏了一次
風險平價的想法很直覺:不要讓某一個資產主宰整個投資組合的風險。 常見做法是看波動率。資產愈會晃,權重就少一點;資產比較穩,權重就多一點。這次研究問一個更尖銳的問題:如果風險不看平常的波動,而是看最糟那一段的尾部損失,配置會不會更安全? 我們用四個一般投資人也熟悉的 ETF 做測試:`SPY`、`TLT`、`GLD`、`PDBC`。比較三種配置: | 配置 | 核心規則 | |---|---|...