← 研究動態
一般讀者2026/06/17 上午03:00

一個波動率模型如果連 2008 金融海嘯都撐得住,才比較像真的有用

SPYVIX波動率預測金融海嘯風險模型

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

一個波動率模型如果連 2008 金融海嘯都撐得住,才比較像真的有用

很多波動率模型都有同一個問題:平常年份看起來不錯,一拉到真正的大風暴就露餡。

這次實驗做的事很直接。把先前在 SPY 上表現不錯的 A4f 模型,從原本較短的樣本,往前一路拉到 2007-2026,硬把 2008-09 金融海嘯、2011-12 歐債危機、2020 疫情崩盤、2022 升息熊市全部塞進樣本外測試。問題只有一個:

 這個模型在最難的年份,還有沒有用? 

答案是: 有,而且不是只在單一時段碰巧贏。 

三段長樣本比較

先講結論

這次比較的對手很簡單:

  • 基準組:傳統波動率基準模型
  • 挑戰者:A4f

A4f 的差別在於,它不只看歷史報酬,還把前一天的 VIX² 放進長期波動組件。白話講,就是承認市場的恐慌環境不是每天都一樣,模型不該只靠價格自己的記憶。

整段 2007-2026 的樣本外結果是:

  • OOS 天數:4,848
  • 基準模型誤差分數:-8.336
  • A4f 誤差分數:-8.410
  • 改善幅度:0.89%
  • 比較統計量:7.915

這不是「有點比較好」而已。以這份研究一貫採用的嚴格門檻來看,7.915 已經高出很多。

更重要的是,它不是靠某一小段行情硬撐出來的。

三段樣本外,全都過

這份實驗把整段 OOS 切成三塊:

  • 2007-2012:含金融海嘯與歐債危機
  • 2013-2018:相對平穩的修復期
  • 2019-2026:含疫情、升息與近期高波動

三段結果全部是 A4f 較好:

OOS 視窗天數A4f 相對基準改善比較統計量
2007-201215100.46%4.47
2013-201815101.16%6.08
2019-202618280.99%4.24

這張表最有價值的地方,不是哪一段數字最大,而是 三段方向完全一致 。

如果一個模型只在 2019-2026 有效,你可以懷疑那是疫情後市場結構剛好偏向它;如果它在 2007-20122013-20182019-2026 都贏,這個質疑就弱很多。

真正難的考題,是 2008 金融海嘯

危機子期間比較

很多模型在一般年份還能交作業,碰到 2008 這種等級的危機就完全失真。

所以這份實驗最關鍵的一格,不是全樣本,而是 GFC 子期間:

  • 期間:2008-01-012009-12-31
  • 天數:505
  • 平均 VIX:32.1
  • VIX 峰值:80.86
  • A4f 相對基準改善:0.61%
  • 比較統計量:3.14

也就是說, 連金融海嘯這段單獨抽出來,A4f 還是過門檻。 

這件事的意義很大。它代表 VIX² 這個設計不是只在近年資料上剛好搭得上,而是在歷史上最有名的一次波動爆炸裡,也還保有方向正確、而且有正式檢定支持的優勢。

但不是每個危機都能講得一樣滿

這篇最值得保留的地方,是它沒有把所有危機都講成同等強度。

例如 2011-12 的歐債危機:

  • 天數:274
  • 改善幅度:0.10%
  • 比較統計量:0.456

方向還是 A4f 較好,但統計上完全不夠強,所以不能講成「歐債危機也確認有效」。

2020 疫情崩盤也有類似情況:

  • 天數:104
  • 改善幅度:5.11%
  • 比較統計量:1.95

幅度看起來很大,但樣本太短,所以最多只能說「方向和幅度都很亮眼」,還不能當成正式通過。

這種寫法反而讓整篇結果更可信。因為它不是看到正號就全算贏,而是有分清楚:

  • 哪些是正式過門檻
  • 哪些只是方向一致
  • 哪些是樣本太少,先保留

極端 VIX 沒有壞掉,但證據還不夠硬

這份實驗也把 VIX 依高低切桶。

最值得注意的是:VIX 越高,A4f 的 raw 改善幅度其實越大。

  • Low:改善 0.99%
  • Normal:改善 0.65%
  • High:改善 1.33%
  • Extreme:改善 2.09%
  • Crisis:改善 2.55%

這表示模型沒有在高恐慌區間崩掉,反而看起來更有幫助。

但這裡一樣不能講太滿。因為最高那個 Crisis 桶只有 38 天,Extreme 桶也只有 141 天,所以雖然方向漂亮,統計力還是不夠。最誠實的說法是:

 目前沒看到 breakdown,甚至 raw 表現更好,但高 VIX 區樣本太少,先不要把它講成鐵律。 

這篇實驗真正補上的,是「跨 regime 可靠性」

很多投資研究最怕的不是模型今天輸,是模型只在某一段歷史有效。

這份實驗的價值就在這裡。它把 A4f 從原本比較近的樣本,往前擴成 19 年的 OOS,然後確認了三件事:

  1. 全樣本 2007-2026 仍明顯優於基準模型
  2. 三個大視窗全部同方向,而且都過嚴格門檻
  3. 2008-09 金融海嘯單獨拿出來也過關

這不代表 A4f 已經完美,也不代表它在所有市場都一定成立。它只是把最常見的一個質疑先擋掉了:

 「你這模型是不是只在近年才有效?」 

至少在 SPY + VIX 這條線上,這份續跑實驗給出的答案是: 不是。 

資料來源

本文基於本平台一份 SPY 波動率續跑實驗。資料來源:yfinance,資產 SPY^VIX,期間 2000-01-042026-04-11,全樣本 6,606 日,樣本外 4,848 日。比較方法:A4f 對照傳統基準模型,rolling 2000-day、每 63 日重估,以預測誤差分數和兩模型比較檢定評估。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
VIX 跌破 16 之後:三個波動率裂縫,比恐慌指數本身更值得留意
# VIX 跌破 16 之後:三個波動率裂縫,比恐慌指數本身更值得留意 VIX 這五個交易日一路探底:6/29 收 17.65,6/30 收 16.45,7/1 收 16.59,7/2 收 16.15,7/3 美股開盤前來到 15.84。連 16 這個心理關卡都守不住,是今年少見的低檔區。 FRED 資料顯示,7/1 當天 VIX3M 收在 19.16,比現貨 VIX 的 16.59 高出 2...
📄
波動率「測不準」能不能當減碼訊號?六檔 ETF、六十天的老實答案
打開任何一套波動率監控面板,你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個,用當天的開盤、最高、最低、收盤算出另一個,把隔夜跳空也加進去又是一個。多數時候它們差不多,偶爾會明顯對不上。這篇想回答一個很實際的問題:當這些數字彼此吵起來的時候,是不是代表隔天更難預測、應該先把部位縮小一點? ## 先講清楚「分歧」是什麼 把量測市場波動的方法想像成幾支溫度計。它們原理不同、...
📄
把五分鐘資料切得更細,預測真的會更準嗎?台指期給了一個保守答案
做波動率預測時,很容易想把資料切得更細。一天一筆收盤價太粗,那就看每五分鐘一筆;只看總波動太粗,那就再拆成上漲、下跌、跳動、估計噪音。直覺上,資料越細,模型應該越聰明。 這次台指期日盤實測給的答案比較冷靜:細資料有幫助,但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動,期間從 2017-05-16 到 2026-06-29,共 2219 個原始交易日。正式可判斷的樣本外...