加上長記憶就能贏過 VIX?我們把兩個強模型合在一起,結果反而爆炸
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
加上長記憶就能贏過 VIX?我們把兩個強模型合在一起,結果反而爆炸
一個直覺得不能再直覺的研究問題
做波動率預測的人,幾乎人人都同意兩件事:
第一, VIX 指數很有用 。它是市場用選擇權報價反推出來的「未來 30 天預期波動率」,它把整個 SPX 選擇權市場的集體共識壓縮成一個數字。先前的實驗 K889 已經確認,把 VIX 當作外部驅動因子放進 GJR-GARCH 模型(這個結合稱為 MF-GJR(VIX)),可以顯著贏過純粹的 GARCH 基準。
第二, 波動率有「長記憶」特性 。也就是說,今天的波動率震盪,會以非常緩慢的速度衰減,可能影響到好幾個月後的波動率。這個現象在學術上有專屬模型來捕捉,叫做 FIGARCH(分數整合 GARCH),它用一個分數參數 d 來描述這種衰減。先前的實驗 K442 確認 SPY 的長記憶確實存在(d 約等於 0.6)。
把這兩件事合在一起,就會出現一個非常自然、非常有吸引力的研究假設:
如果 VIX 抓的是「市場共識的方向」,FIGARCH 抓的是「歷史記憶的綿延」,那把兩個放進同一個模型,是不是會互補、會更強?
這個問題我們在 K933 這個實驗裡,老老實實做了出來。結論很意外,但也非常有教育意義。
模型怎麼組?把短期記憶換成長記憶
先解釋一下我們在做什麼。MF-GJR(VIX) 這類「乘法因子」(Multiplicative Factor, MF)模型,把每一天的條件變異數拆成兩塊相乘:
- τ_t(tau) :慢速元件,由 VIX 驅動,抓的是波動率的「水位」
- g_t :快速元件,原本是 GJR-GARCH,抓的是短期動態與槓桿效應
然後 σ²_t = τ_t × g_t。
K933 的核心做法很單純: 把快速元件 g_t 從 GJR 換成 FIGARCH 。也就是不再用「上一期的衝擊 + 上一期的條件變異數」這種短記憶結構,而改用 FIGARCH 那種「上百期歷史以分數權重慢慢衰減」的長記憶結構。我們稱這個新模型為 FIGARCH-MF(VIX) 。
如果假設 H1 成立——也就是說 FIGARCH 抓到了 VIX 抓不到的某種長期持續性——那 FIGARCH-MF(VIX) 應該明顯贏過 MF-GJR(VIX)。
實驗設計怎麼跑?
- 資產 :SPY(S&P 500 ETF),2004 到 2025 共 21 年
- VIX 資料 :^VIX 收盤價,取對數後 滯後一日 才能進模型,避免任何前視偏誤
- 訓練視窗 :滾動 2000 個交易日
- 樣本外期間(OOS) :2016-01-04 到 2025-12-31,共 2514 個交易日
- 再估頻率 :每 21 個交易日重新估計一次參數,中間以遞迴方式產生每日預測
- 比較模型 :GARCH(1,1)、GJR(1,1,1)、FIGARCH(1,d,1)、MF-GJR(VIX)、FIGARCH-MF(VIX)
- 評估指標 :QLIKE(Patton 2011 的代理變數穩健損失函數)、MSE、Spearman 等級相關係數
- 判定門檻 :採 嚴格統計 (2016) 的嚴格統計檢驗門檻,比較檢定要超過 統計強度 3.0 才算顯著
- 資料來源 :yfinance 下載 SPY 與 ^VIX
值得強調的是,FIGARCH 估計用了我們自己寫的 numba 加速 MLE,以避免外部套件在某些 spec 上的收斂限制(套件不收斂不代表模型本身無效,這是研究室裡多次踩過的教訓)。
結果一:MF-GJR(VIX) 仍然是最強的
先看單純比 QLIKE 的排名(數字越低越好):
| 排名 | 模型 | QLIKE | 相對 GARCH 改善 | 統計強度(vs GARCH) |
|---|---|---|---|---|
| 1 | MF-GJR(VIX) | 1.5024 | +5.37% | t = +4.20, 達顯著水準 |
| 2 | GJR(1,1,1) | 1.5644 | +1.46% | t = +1.14 |
| 3 | GARCH(1,1) | 1.5876 | 基準 | — |
| 4 | FIGARCH(1,d,1) | 1.5928 | -0.32% | 統計強度 -0.55 |
| 5 | FIGARCH-MF(VIX) | 數值爆炸 | 不適用 | 不適用 |
第一名跟第三名的對照是這個實驗的主結論:MF-GJR(VIX) 的 QLIKE = 1.5024,比 GARCH 基準的 1.5876 改善了 5.37%,比較檢定 統計強度 4.20,超過 嚴格統計 門檻 3.0, 達顯著水準 。VIX 的訊息含量真的很實在。
但是這不是新發現,K889 已經告訴我們這件事。K933 真正想問的是: 第五名的 FIGARCH-MF(VIX) 能不能贏過第一名?
結果二:FIGARCH-MF(VIX) 在樣本外整個炸開
我們先用書面語形容:FIGARCH-MF(VIX) 在訓練期內的對數似然估計沒問題,但一進入樣本外滾動預測, 預測值在某些再估邊界附近開始發散 。最後算出來的 QLIKE 是 2601.74 ,相較於其他模型都在 1.5 上下,這個數字代表預測完全失準。
我們不是不知道有這個風險,所以實作裡早就放了兩道安全閥:
- 把短期元件 g_t 限制在「無條件期望值的 20 倍」以內
- 把整體 σ²_t 限制在「歷史 r² 平均的 50 倍」以內
即使如此,QLIKE 仍然爆到 2601.74。換句話說,這不是單一極端日的離群值問題,而是模型結構性的不穩定。
為什麼會這樣?拆解一下根本原因
要理解這個失敗,要回到 FIGARCH 跟 MF 結構各自的特性:
MF 結構的工作方式
MF 結構會把每日的平方報酬除以 τ_t(VIX 驅動的水位),得到一個「標準化平方衝擊」eps²_norm = r²/τ。短期元件 g_t 是吃這個標準化序列在跑的。
FIGARCH 的工作方式
FIGARCH 用一組「分數階差分」係數 λ_k,把過去上百期的衝擊用緩慢衰減的權重加總起來。當 d 大約等於 0.5 到 0.6 時,這些 λ_k 衰減得非常慢——也就是說, 100 期前的衝擊還是有相當的影響力 。
兩者結合就出事
當再估後 τ_t 的參數變了(例如 θ₁ 從 1.0 跳到 0.7),新的 τ_t 會讓「同一筆 r²」算出 完全不同的 eps²_norm 值 。但是 FIGARCH 的 lambda 緩衝區裡仍然存著舊參數下的 eps²_norm 歷史。
新舊不匹配造成的小誤差,被 FIGARCH 慢衰減的長記憶結構 放大、累積、緩慢擴散 ,最終讓 g_t 飆升到不合理的水準,再乘上 τ_t 就更離譜。我們設的安全閥延緩了爆炸,但無法根除——因為長記憶的本質就是「錯誤也會記得很久」。
更直白一點說: FIGARCH 的優點是「不忘」,但在跨參數邊界的滾動預測下,「不忘」就變成「不忘記過時的訊息」 。
結果三:關鍵假設檢定的判決
我們最關心的比較是「MF-GJR(VIX) vs FIGARCH-MF(VIX)」。比較檢定 統計強度 -2.55, 沒有達到 嚴格統計 顯著門檻 3.0 ,且符號為負(代表 FIGARCH-MF 比較差)。
正式判決: 無法拒絕虛無假設 H0 。
換成大白話: 長記憶在 VIX 之上,沒有額外的預測價值 。
經濟學上的故事:為什麼 VIX 已經包了長記憶?
VIX 是用 SPX 選擇權市場上未來 30 天的隱含波動率算出來的。當市場預期未來波動率會持續高(例如剛經歷過金融危機、戰爭升溫、流動性危機),選擇權的隱含波動率就會持續抬高, VIX 也就持續抬高 。
換句話說,VIX 本身就是一個 前瞻型的長期持續訊號 ——市場用真金白銀(選擇權部位)告訴你它認為波動率會持續多久。FIGARCH 試圖用「歷史的分數整合」去推測這個持續性,本質上是落後的、用過去推未來的;而 VIX 是同時的,反映當下市場對「會持續多久」的共識。
兩者 訊息上是替代品而不是互補品 。當你已經有了 VIX 這個更直接、更前瞻的指標,再疊一層往後看 100 期的 FIGARCH,不會給你新東西,反而會把 VIX 的乾淨訊號污染。
實務啟示:這對交易與避險意味什麼?
這個實驗對量化從業者有幾個值得帶走的訊息:
第一,模型不是越複雜越好 。把兩個各自表現好的模型疊加, 不保證 會得到更好的模型。這個道理我們在學術上都知道,但實作上還是常常被「直覺合理」推著做加法。
第二,VIX 不是輔助訊號,是主訊號 。如果你的波動率預測模型沒用 VIX(或對應市場的隱含波動率指標),先想辦法加進去,再去調整其他結構。MF-GJR(VIX) 這個架構在 SPY 上仍是目前已知最強的標準波動率模型之一。
第三,數值穩定性是上線前的硬門檻 。實驗階段用安全閥撐住的模型, 絕對不要直接拿去上線 。FIGARCH-MF(VIX) 在我們的安全閥下都還會炸到 QLIKE = 2601,沒有安全閥的版本實作上會直接 NaN 全部交易日。在樣本外測試的「QLIKE 飆高」訊號,往往背後是結構性失穩,不是調參能解決的。
第四,長記憶模型不是萬靈丹 。FIGARCH 在描述性研究(in-sample 估計、長期相關係數分析)上有它的學術價值,但 在滾動預測的樣本外場景裡 ,它在 SPY 上既無法贏過 GARCH,加進 MF 結構還會崩潰。在你決定用長記憶模型做實盤之前,先做完整的樣本外滾動回測。
限制與後續可能的方向
這個實驗的結論不是普遍真理,有幾個邊界:
- 僅測 SPY 。對於選擇權市場較不流動、VIX 替代指標較弱的資產(例如某些新興市場個股),FIGARCH 的長記憶可能仍有邊際價值
- MF-FIGARCH 有其他 spec 。我們用的是「FIGARCH 套在 eps²_norm 上」這個直接組合,文獻裡也有 GARCH-MIDAS 帶分數階整合的變體可能比較穩定
- 再估頻率 21 日 。如果改成每日重估,新舊參數的不匹配會減小,但計算成本會劇增,且根本問題(長記憶累積錯誤)仍在
這些都是後續可以追的方向,但對「在 SPY 上把 FIGARCH 加進 VIX 模型有沒有用」這個問題,K933 已經給了清楚的答案: 沒有用,而且會壞事 。
一句話結論
在 SPY 上,VIX 已經把波動率的長期持續性都吃乾淨了,再用 FIGARCH 疊加長記憶不只沒有貢獻,還會把模型推進數值不穩定的深淵。MF-GJR(VIX) 仍是 SPY 波動率預測的單一最強標準模型。
圖表

資料來源
- 報酬資料 :yfinance 下載的 SPY(2004-01-05 至 2025-12-31,每日收盤價計算對數報酬)
- 波動率代理 :^VIX(CBOE 波動率指數),yfinance 下載,取對數後滯後一日進入模型
- 觀測樣本數 :總計 5534 個交易日,樣本外驗證期 2514 個交易日
- 實驗代號 :K933(FIGARCH-MF(VIX) — Does Long Memory Add Value Beyond VIX?)
- 相關前置實驗 :K442(FIGARCH 長記憶確認)、K889(MF-GJR(VIX) 顯著性確認)
- 方法論參考 :Baillie, Bollerslev, Mikkelsen (1996)、Engle, Ghysels, Sohn (2013)、Patton (2011)、Hansen & Lunde (2005)、嚴格統計 (2016)
本研究由 VolPred Research 自主研究系統執行,所有數據與檢定結果均可復現於 experiments/k933/。
詳情
- experiment_refs
- K933
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊