一般讀者2026/05/15 下午10:00

加上長記憶就能贏過 VIX？我們把兩個強模型合在一起，結果反而爆炸

VIX波動率預測風險管理模型穩健性失敗實驗長記憶

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

加上長記憶就能贏過 VIX？我們把兩個強模型合在一起，結果反而爆炸

一個直覺得不能再直覺的研究問題

做波動率預測的人，幾乎人人都同意兩件事：

第一， VIX 指數很有用 。它是市場用選擇權報價反推出來的「未來 30 天預期波動率」，它把整個 SPX 選擇權市場的集體共識壓縮成一個數字。先前的實驗 K889 已經確認，把 VIX 當作外部驅動因子放進 GJR-GARCH 模型（這個結合稱為 MF-GJR(VIX)），可以顯著贏過純粹的 GARCH 基準。

第二， 波動率有「長記憶」特性 。也就是說，今天的波動率震盪，會以非常緩慢的速度衰減，可能影響到好幾個月後的波動率。這個現象在學術上有專屬模型來捕捉，叫做 FIGARCH（分數整合 GARCH），它用一個分數參數 d 來描述這種衰減。先前的實驗 K442 確認 SPY 的長記憶確實存在（d 約等於 0.6）。

把這兩件事合在一起，就會出現一個非常自然、非常有吸引力的研究假設：

如果 VIX 抓的是「市場共識的方向」，FIGARCH 抓的是「歷史記憶的綿延」，那把兩個放進同一個模型，是不是會互補、會更強？

這個問題我們在 K933 這個實驗裡，老老實實做了出來。結論很意外，但也非常有教育意義。

模型怎麼組？把短期記憶換成長記憶

先解釋一下我們在做什麼。MF-GJR(VIX) 這類「乘法因子」（Multiplicative Factor, MF）模型，把每一天的條件變異數拆成兩塊相乘：

τ_t（tau） ：慢速元件，由 VIX 驅動，抓的是波動率的「水位」
g_t ：快速元件，原本是 GJR-GARCH，抓的是短期動態與槓桿效應

然後 σ²_t = τ_t × g_t。

K933 的核心做法很單純： 把快速元件 g_t 從 GJR 換成 FIGARCH 。也就是不再用「上一期的衝擊 + 上一期的條件變異數」這種短記憶結構，而改用 FIGARCH 那種「上百期歷史以分數權重慢慢衰減」的長記憶結構。我們稱這個新模型為 FIGARCH-MF(VIX) 。

如果假設 H1 成立——也就是說 FIGARCH 抓到了 VIX 抓不到的某種長期持續性——那 FIGARCH-MF(VIX) 應該明顯贏過 MF-GJR(VIX)。

實驗設計怎麼跑？

資產：SPY（S&P 500 ETF），2004 到 2025 共 21 年
VIX 資料 ：^VIX 收盤價，取對數後 滯後一日 才能進模型，避免任何前視偏誤
訓練視窗 ：滾動 2000 個交易日
樣本外期間（OOS） ：2016-01-04 到 2025-12-31，共 2514 個交易日
再估頻率 ：每 21 個交易日重新估計一次參數，中間以遞迴方式產生每日預測
比較模型 ：GARCH(1,1)、GJR(1,1,1)、FIGARCH(1,d,1)、MF-GJR(VIX)、FIGARCH-MF(VIX)
評估指標 ：QLIKE（Patton 2011 的代理變數穩健損失函數）、MSE、Spearman 等級相關係數
判定門檻 ：採嚴格統計 (2016) 的嚴格統計檢驗門檻，比較檢定要超過統計強度 3.0 才算顯著
資料來源 ：yfinance 下載 SPY 與 ^VIX

值得強調的是，FIGARCH 估計用了我們自己寫的 numba 加速 MLE，以避免外部套件在某些 spec 上的收斂限制（套件不收斂不代表模型本身無效，這是研究室裡多次踩過的教訓）。

結果一：MF-GJR(VIX) 仍然是最強的

先看單純比 QLIKE 的排名（數字越低越好）：

排名	模型	QLIKE	相對 GARCH 改善	統計強度（vs GARCH）
1	MF-GJR(VIX)	1.5024	+5.37%	t = +4.20，達顯著水準
2	GJR(1,1,1)	1.5644	+1.46%	t = +1.14
3	GARCH(1,1)	1.5876	基準	—
4	FIGARCH(1,d,1)	1.5928	-0.32%	統計強度 -0.55
5	FIGARCH-MF(VIX)	數值爆炸	不適用	不適用

第一名跟第三名的對照是這個實驗的主結論：MF-GJR(VIX) 的 QLIKE = 1.5024，比 GARCH 基準的 1.5876 改善了 5.37%，比較檢定統計強度 4.20，超過嚴格統計門檻 3.0， 達顯著水準 。VIX 的訊息含量真的很實在。

但是這不是新發現，K889 已經告訴我們這件事。K933 真正想問的是： 第五名的 FIGARCH-MF(VIX) 能不能贏過第一名？

結果二：FIGARCH-MF(VIX) 在樣本外整個炸開

我們先用書面語形容：FIGARCH-MF(VIX) 在訓練期內的對數似然估計沒問題，但一進入樣本外滾動預測， 預測值在某些再估邊界附近開始發散 。最後算出來的 QLIKE 是 2601.74 ，相較於其他模型都在 1.5 上下，這個數字代表預測完全失準。

我們不是不知道有這個風險，所以實作裡早就放了兩道安全閥：

把短期元件 g_t 限制在「無條件期望值的 20 倍」以內
把整體 σ²_t 限制在「歷史 r² 平均的 50 倍」以內

即使如此，QLIKE 仍然爆到 2601.74。換句話說，這不是單一極端日的離群值問題，而是模型結構性的不穩定。

為什麼會這樣？拆解一下根本原因

要理解這個失敗，要回到 FIGARCH 跟 MF 結構各自的特性：

MF 結構的工作方式

MF 結構會把每日的平方報酬除以 τ_t（VIX 驅動的水位），得到一個「標準化平方衝擊」eps²_norm = r²/τ。短期元件 g_t 是吃這個標準化序列在跑的。

FIGARCH 的工作方式

FIGARCH 用一組「分數階差分」係數 λ_k，把過去上百期的衝擊用緩慢衰減的權重加總起來。當 d 大約等於 0.5 到 0.6 時，這些 λ_k 衰減得非常慢——也就是說， 100 期前的衝擊還是有相當的影響力 。

兩者結合就出事

當再估後 τ_t 的參數變了（例如 θ₁ 從 1.0 跳到 0.7），新的 τ_t 會讓「同一筆 r²」算出 完全不同的 eps²_norm 值 。但是 FIGARCH 的 lambda 緩衝區裡仍然存著舊參數下的 eps²_norm 歷史。

新舊不匹配造成的小誤差，被 FIGARCH 慢衰減的長記憶結構 放大、累積、緩慢擴散 ，最終讓 g_t 飆升到不合理的水準，再乘上 τ_t 就更離譜。我們設的安全閥延緩了爆炸，但無法根除——因為長記憶的本質就是「錯誤也會記得很久」。

更直白一點說： FIGARCH 的優點是「不忘」，但在跨參數邊界的滾動預測下，「不忘」就變成「不忘記過時的訊息」 。

結果三：關鍵假設檢定的判決

我們最關心的比較是「MF-GJR(VIX) vs FIGARCH-MF(VIX)」。比較檢定統計強度 -2.55， 沒有達到嚴格統計顯著門檻 3.0 ，且符號為負（代表 FIGARCH-MF 比較差）。

正式判決： 無法拒絕虛無假設 H0 。

換成大白話： 長記憶在 VIX 之上，沒有額外的預測價值 。

經濟學上的故事：為什麼 VIX 已經包了長記憶？

VIX 是用 SPX 選擇權市場上未來 30 天的隱含波動率算出來的。當市場預期未來波動率會持續高（例如剛經歷過金融危機、戰爭升溫、流動性危機），選擇權的隱含波動率就會持續抬高， VIX 也就持續抬高 。

換句話說，VIX 本身就是一個 前瞻型的長期持續訊號 ——市場用真金白銀（選擇權部位）告訴你它認為波動率會持續多久。FIGARCH 試圖用「歷史的分數整合」去推測這個持續性，本質上是落後的、用過去推未來的；而 VIX 是同時的，反映當下市場對「會持續多久」的共識。

兩者 訊息上是替代品而不是互補品 。當你已經有了 VIX 這個更直接、更前瞻的指標，再疊一層往後看 100 期的 FIGARCH，不會給你新東西，反而會把 VIX 的乾淨訊號污染。

實務啟示：這對交易與避險意味什麼？

這個實驗對量化從業者有幾個值得帶走的訊息：

第一，模型不是越複雜越好 。把兩個各自表現好的模型疊加， 不保證 會得到更好的模型。這個道理我們在學術上都知道，但實作上還是常常被「直覺合理」推著做加法。

第二，VIX 不是輔助訊號，是主訊號 。如果你的波動率預測模型沒用 VIX（或對應市場的隱含波動率指標），先想辦法加進去，再去調整其他結構。MF-GJR(VIX) 這個架構在 SPY 上仍是目前已知最強的標準波動率模型之一。

第三，數值穩定性是上線前的硬門檻 。實驗階段用安全閥撐住的模型， 絕對不要直接拿去上線 。FIGARCH-MF(VIX) 在我們的安全閥下都還會炸到 QLIKE = 2601，沒有安全閥的版本實作上會直接 NaN 全部交易日。在樣本外測試的「QLIKE 飆高」訊號，往往背後是結構性失穩，不是調參能解決的。

第四，長記憶模型不是萬靈丹 。FIGARCH 在描述性研究（in-sample 估計、長期相關係數分析）上有它的學術價值，但 在滾動預測的樣本外場景裡 ，它在 SPY 上既無法贏過 GARCH，加進 MF 結構還會崩潰。在你決定用長記憶模型做實盤之前，先做完整的樣本外滾動回測。

限制與後續可能的方向

這個實驗的結論不是普遍真理，有幾個邊界：

僅測 SPY 。對於選擇權市場較不流動、VIX 替代指標較弱的資產（例如某些新興市場個股），FIGARCH 的長記憶可能仍有邊際價值
MF-FIGARCH 有其他 spec 。我們用的是「FIGARCH 套在 eps²_norm 上」這個直接組合，文獻裡也有 GARCH-MIDAS 帶分數階整合的變體可能比較穩定
再估頻率 21 日 。如果改成每日重估，新舊參數的不匹配會減小，但計算成本會劇增，且根本問題（長記憶累積錯誤）仍在

這些都是後續可以追的方向，但對「在 SPY 上把 FIGARCH 加進 VIX 模型有沒有用」這個問題，K933 已經給了清楚的答案： 沒有用，而且會壞事 。

一句話結論

在 SPY 上，VIX 已經把波動率的長期持續性都吃乾淨了，再用 FIGARCH 疊加長記憶不只沒有貢獻，還會把模型推進數值不穩定的深淵。MF-GJR(VIX) 仍是 SPY 波動率預測的單一最強標準模型。

圖表

K933 QLIKE 與 Spearman 等級相關比較

資料來源

報酬資料 ：yfinance 下載的 SPY（2004-01-05 至 2025-12-31，每日收盤價計算對數報酬）
波動率代理 ：^VIX（CBOE 波動率指數），yfinance 下載，取對數後滯後一日進入模型
觀測樣本數 ：總計 5534 個交易日，樣本外驗證期 2514 個交易日
實驗代號 ：K933（FIGARCH-MF(VIX) — Does Long Memory Add Value Beyond VIX?）
相關前置實驗 ：K442（FIGARCH 長記憶確認）、K889（MF-GJR(VIX) 顯著性確認）
方法論參考 ：Baillie, Bollerslev, Mikkelsen (1996)、Engle, Ghysels, Sohn (2013)、Patton (2011)、Hansen & Lunde (2005)、嚴格統計 (2016)