← 研究動態
一般讀者2026/06/23 上午10:19

風險模型最怕的不是猜不準平均,而是你以為安全、其實根本沒罩住

SPY波動率預測風險管理分位數預測預測區間

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

風險模型最怕的不是猜不準平均,而是你以為安全、其實根本沒罩住

很多人看風險模型,第一眼只看「平均有多準」。

但真正會害人虧大錢的,通常不是平均值,而是另一件事:

 模型說它已經把最壞情況包進去了,結果真正出事時,根本沒包住。 

這份 SPY 實驗測的,就是這個問題。

它不是單純比誰的平均預測比較漂亮,而是直接比較五種模型誰更能回答一句投資人真正會在意的話:

 「如果接下來真的很糟,我的風險大概會糟到哪裡?」 

模型整體排名比較

先講最重要的結論

這次測試的五種方法裡,表現最穩的是 CAViaR-SAV

它不靠先假設市場報酬長什麼分配,而是直接去追「風險區間本身」怎麼動。

如果只看整體排名,大致是這樣:

排名模型表現
1CAViaR-SAV最佳
2傳統參數法幾乎追平
3Quantile Random Forest再差一點
4另一種進階參數法再後面
5線性分位數版本最差

真正有意思的不是第一名是誰,而是第二個發現:

 傳統參數法居然跟第一名咬得非常近。 

這代表對 SPY 這種成熟市場來說,老方法並沒有很多人想像中那麼落後。

什麼叫「有沒有包住」

你可以把它想成颱風警報。

如果氣象局說:

「明天 90% 的可能情況都在這個範圍裡。」

那真正重要的不是這句話聽起來多專業,而是隔天發生的結果,到底是不是大部分真的落在這個範圍裡。

這份實驗就拿這個角度去看五種模型。

目標很簡單:

 如果模型說自己能包住 90% 的情況,那實際上就應該接近 90%。 

90% 區間覆蓋率比較

結果最關鍵的幾個數字是:

模型實際包住比例
CAViaR-SAV 91.2% 
Quantile RF90.0%
進階參數法89.3%
傳統參數法88.7%
線性分位數版本 84.6% 

這裡最值得注意的,不是第一名,而是最後一名。

那個最線性的分位數版本,名義上也在做風險區間,但它實際只包住 84.6%,離應有的 90% 差了一大截。

白話講就是:

 它說你大部分時候會安全,結果真正不安全的次數,比它承諾的還多。 

這對風險管理是很糟的錯誤。因為這種錯不是「有點不準」,而是會直接讓你低估自己暴露在外面的尾部風險。

這篇實驗最反直覺的地方

很多人會以為,越新的方法應該越厲害。

機器學習、更多特徵、更多結構,看起來都像升級。

但這份實驗最反直覺的地方剛好是:

 最花俏的方法沒有贏很大,最老派的方法反而守得很好。 

傳統參數法雖然不是第一名,但幾乎追平最佳模型。這說明一件事:

對 SPY 這種資料很長、結構相對穩定的市場,很多尾部風險其實還是能被老派方法抓到大半。

真正拉開差距的,不是誰的數學寫得更複雜,而是誰對「最壞情況」的校準比較誠實。

投資人最該帶走的觀念

這份結果很適合提醒一件常被忽略的事:

 風險模型不只要看預測漂不漂亮,還要看它有沒有把危險真的罩住。 

平均值預測得再準,如果最糟情況一直漏接,你在壓力大時還是會受傷。

所以看風險模型時,至少要分開想兩件事:

  1. 它平常預測準不準
  2. 它在你最需要它的時候,有沒有真的守住

這份實驗的答案很清楚:

  • CAViaR-SAV 在這兩件事上最平衡
  • 傳統參數法沒有輸很多,甚至意外地接近
  • 那個最線性的分位數版本,最大問題不是表面排名,而是它把你以為安全的區間畫得太樂觀

對實務上有什麼用

如果你真的要拿模型來做風險控制,而不是拿來寫報告,這篇的提醒很直接:

  1. 不要只看平均誤差,還要看區間到底有沒有包住。
  2. 老方法不一定落伍,尤其在成熟市場裡,穩定和誠實常常比花俏更重要。
  3. 如果某個模型把風險區間畫得太漂亮,反而要更小心,因為它可能只是把真正的尾巴藏起來。

對一般投資人來說,這其實也是一個很實用的判斷原則:

 真正好的風險模型,不是讓你看起來比較安心,而是讓你在真的有事時沒那麼容易被打到措手不及。 

資料來源

本文基於本平台一份 SPY 條件分位數風險預測實驗。資料來源:yfinance,期間 2006-01-042025-12-30,樣本外驗證期間 2016-01-042025-12-30,共 2,513 個交易日。比較方法涵蓋直接追蹤風險區間的模型、傳統參數法、隨機森林分位數法與其他參數式變體;評估重點為整體預測表現與 90% 風險區間是否真的包住實際結果。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
波動率「測不準」能不能當減碼訊號?六檔 ETF、六十天的老實答案
打開任何一套波動率監控面板,你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個,用當天的開盤、最高、最低、收盤算出另一個,把隔夜跳空也加進去又是一個。多數時候它們差不多,偶爾會明顯對不上。這篇想回答一個很實際的問題:當這些數字彼此吵起來的時候,是不是代表隔天更難預測、應該先把部位縮小一點? ## 先講清楚「分歧」是什麼 把量測市場波動的方法想像成幾支溫度計。它們原理不同、...
📄
台股波動有辦法「預測尾巴」嗎?一個對退休族有用的風險量化方法
# 台股波動有辦法「預測尾巴」嗎?一個對退休族有用的風險量化方法 台股最難搞的,向來是那幾天突然殺出來的大波動。 加權指數跌 3% 的日子,很多人的持股直接跌 5-8%。如果是退休族靠息收生活,遇到這種天,帳面縮水只是前菜,更難受的是完全不知道這樣的天多久會出現一次。 本系統最近把一個在美股驗證過的波動率預測框架,套到台灣加權指數上跑了一遍。樣本外測試期間從 2021 年 1 月一路跑到今年...
📄
把五分鐘資料切得更細,預測真的會更準嗎?台指期給了一個保守答案
做波動率預測時,很容易想把資料切得更細。一天一筆收盤價太粗,那就看每五分鐘一筆;只看總波動太粗,那就再拆成上漲、下跌、跳動、估計噪音。直覺上,資料越細,模型應該越聰明。 這次台指期日盤實測給的答案比較冷靜:細資料有幫助,但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動,期間從 2017-05-16 到 2026-06-29,共 2219 個原始交易日。正式可判斷的樣本外...