一般讀者2026/06/17 上午03:00

一個波動率模型如果連 2008 金融海嘯都撐得住，才比較像真的有用

SPYVIX波動率預測金融海嘯風險模型

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

一個波動率模型如果連 2008 金融海嘯都撐得住，才比較像真的有用

很多波動率模型都有同一個問題：平常年份看起來不錯，一拉到真正的大風暴就露餡。

這次實驗做的事很直接。把先前在 SPY 上表現不錯的 A4f 模型，從原本較短的樣本，往前一路拉到 2007-2026，硬把 2008-09 金融海嘯、2011-12 歐債危機、2020 疫情崩盤、2022 升息熊市全部塞進樣本外測試。問題只有一個：

這個模型在最難的年份，還有沒有用？

答案是： 有，而且不是只在單一時段碰巧贏。

三段長樣本比較

先講結論

這次比較的對手很簡單：

基準組：傳統波動率基準模型
挑戰者：A4f

A4f 的差別在於，它不只看歷史報酬，還把前一天的 VIX² 放進長期波動組件。白話講，就是承認市場的恐慌環境不是每天都一樣，模型不該只靠價格自己的記憶。

整段 2007-2026 的樣本外結果是：

OOS 天數：4,848
基準模型誤差分數：-8.336
A4f 誤差分數：-8.410
改善幅度：0.89%
比較統計量：7.915

這不是「有點比較好」而已。以這份研究一貫採用的嚴格門檻來看，7.915 已經高出很多。

更重要的是，它不是靠某一小段行情硬撐出來的。

三段樣本外，全都過

這份實驗把整段 OOS 切成三塊：

2007-2012：含金融海嘯與歐債危機
2013-2018：相對平穩的修復期
2019-2026：含疫情、升息與近期高波動

三段結果全部是 A4f 較好：

OOS 視窗	天數	A4f 相對基準改善	比較統計量
2007-2012	1510	0.46%	4.47
2013-2018	1510	1.16%	6.08
2019-2026	1828	0.99%	4.24

這張表最有價值的地方，不是哪一段數字最大，而是 三段方向完全一致 。

如果一個模型只在 2019-2026 有效，你可以懷疑那是疫情後市場結構剛好偏向它；如果它在 2007-2012、2013-2018、2019-2026 都贏，這個質疑就弱很多。

真正難的考題，是 2008 金融海嘯

危機子期間比較

很多模型在一般年份還能交作業，碰到 2008 這種等級的危機就完全失真。

所以這份實驗最關鍵的一格，不是全樣本，而是 GFC 子期間：

期間：2008-01-01 到 2009-12-31
天數：505
平均 VIX：32.1
VIX 峰值：80.86
A4f 相對基準改善：0.61%
比較統計量：3.14

也就是說， 連金融海嘯這段單獨抽出來，A4f 還是過門檻。

這件事的意義很大。它代表 VIX² 這個設計不是只在近年資料上剛好搭得上，而是在歷史上最有名的一次波動爆炸裡，也還保有方向正確、而且有正式檢定支持的優勢。

但不是每個危機都能講得一樣滿

這篇最值得保留的地方，是它沒有把所有危機都講成同等強度。

例如 2011-12 的歐債危機：

天數：274
改善幅度：0.10%
比較統計量：0.456

方向還是 A4f 較好，但統計上完全不夠強，所以不能講成「歐債危機也確認有效」。

2020 疫情崩盤也有類似情況：

天數：104
改善幅度：5.11%
比較統計量：1.95

幅度看起來很大，但樣本太短，所以最多只能說「方向和幅度都很亮眼」，還不能當成正式通過。

這種寫法反而讓整篇結果更可信。因為它不是看到正號就全算贏，而是有分清楚：

哪些是正式過門檻
哪些只是方向一致
哪些是樣本太少，先保留

極端 VIX 沒有壞掉，但證據還不夠硬

這份實驗也把 VIX 依高低切桶。

最值得注意的是：VIX 越高，A4f 的 raw 改善幅度其實越大。

Low：改善 0.99%
Normal：改善 0.65%
High：改善 1.33%
Extreme：改善 2.09%
Crisis：改善 2.55%

這表示模型沒有在高恐慌區間崩掉，反而看起來更有幫助。

但這裡一樣不能講太滿。因為最高那個 Crisis 桶只有 38 天，Extreme 桶也只有 141 天，所以雖然方向漂亮，統計力還是不夠。最誠實的說法是：

目前沒看到 breakdown，甚至 raw 表現更好，但高 VIX 區樣本太少，先不要把它講成鐵律。

這篇實驗真正補上的，是「跨 regime 可靠性」

很多投資研究最怕的不是模型今天輸，是模型只在某一段歷史有效。

這份實驗的價值就在這裡。它把 A4f 從原本比較近的樣本，往前擴成 19 年的 OOS，然後確認了三件事：

全樣本 2007-2026 仍明顯優於基準模型
三個大視窗全部同方向，而且都過嚴格門檻
連 2008-09 金融海嘯單獨拿出來也過關

這不代表 A4f 已經完美，也不代表它在所有市場都一定成立。它只是把最常見的一個質疑先擋掉了：

「你這模型是不是只在近年才有效？」

至少在 SPY + VIX 這條線上，這份續跑實驗給出的答案是： 不是。

資料來源

本文基於本平台一份 SPY 波動率續跑實驗。資料來源：yfinance，資產 SPY 與 ^VIX，期間 2000-01-04 至 2026-04-11，全樣本 6,606 日，樣本外 4,848 日。比較方法：A4f 對照傳統基準模型，rolling 2000-day、每 63 日重估，以預測誤差分數和兩模型比較檢定評估。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

VIX 跌破 16 之後：三個波動率裂縫，比恐慌指數本身更值得留意

# VIX 跌破 16 之後：三個波動率裂縫，比恐慌指數本身更值得留意 VIX 這五個交易日一路探底：6/29 收 17.65，6/30 收 16.45，7/1 收 16.59，7/2 收 16.15，7/3 美股開盤前來到 15.84。連 16 這個心理關卡都守不住，是今年少見的低檔區。 FRED 資料顯示，7/1 當天 VIX3M 收在 19.16，比現貨 VIX 的 16.59 高出 2...

→📄

波動率「測不準」能不能當減碼訊號？六檔 ETF、六十天的老實答案

打開任何一套波動率監控面板，你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個，用當天的開盤、最高、最低、收盤算出另一個，把隔夜跳空也加進去又是一個。多數時候它們差不多，偶爾會明顯對不上。這篇想回答一個很實際的問題：當這些數字彼此吵起來的時候，是不是代表隔天更難預測、應該先把部位縮小一點？ ## 先講清楚「分歧」是什麼把量測市場波動的方法想像成幾支溫度計。它們原理不同、...

→📄

把五分鐘資料切得更細，預測真的會更準嗎？台指期給了一個保守答案

做波動率預測時，很容易想把資料切得更細。一天一筆收盤價太粗，那就看每五分鐘一筆；只看總波動太粗，那就再拆成上漲、下跌、跳動、估計噪音。直覺上，資料越細，模型應該越聰明。這次台指期日盤實測給的答案比較冷靜：細資料有幫助，但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動，期間從 2017-05-16 到 2026-06-29，共 2219 個原始交易日。正式可判斷的樣本外...

→