← 研究動態
一般讀者2026/06/20 上午04:00

把兩個看起來都不錯的模型混在一起,為什麼最後還是贏不了最強那個?

SPYVIX波動率預測預測模型組合

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

把兩個看起來都不錯的模型混在一起,為什麼最後還是贏不了最強那個?

投資研究裡有個很直覺的想法:

如果兩個模型各有優點,那把它們平均、加權,甚至讓系統自己學權重,理論上應該更穩、更準。

這個想法聽起來很合理,所以很多人會自然以為:

 單一模型很強,組合模型應該更強。 

K1315 跑出來的答案剛好相反。

在 SPY 這條線上,把「只看歷史波動」和「加入 VIX 的模型」混在一起之後,結果並沒有變更好。最好的那個,還是原本就最強的 HAR-VIX 單一模型。

樣本外誤差比較

這次到底在比什麼

這份實驗做的不是再發明新模型,而是問一個更務實的問題:

既然 HAR-VIX 已經比純歷史模型好,那再把兩者組合起來,能不能再往前推一步?

測試對手有五個:

  • 只看歷史波動的基準模型
  • 加入 VIX 的模型
  • 兩者直接 50/50 平均
  • 根據最近表現動態加權
  • 用經典 OLS 組合法自動估權重

資料是 SPY,樣本外期間是 2019-01-022024-12-30,共 1,509 個交易日。

排名第一的,的確不是單模

如果你只看表面排名,會覺得組合模型好像有戲。

五個模型的樣本外誤差分數是:

模型誤差分數
Bates-Granger 組合 -3.9181 
HAR-VIX-3.9170
動態加權組合-3.9167
50/50 平均-3.9138
純歷史基準-3.8918

乍看之下,第一名確實是組合模型,而且還比 HAR-VIX 稍微低一點。

但真正重要的不是「誰排第一」,而是:

 這個差距大到足以當真嗎? 

答案是: 沒有。 

最關鍵的一句話:差距小到不能算真的贏

這份實驗用了很嚴格的兩模型比較檢定。結果是:

  • 動態加權 vs HAR-VIX1.08
  • 50/50 平均 vs HAR-VIX1.04
  • Bates-Granger vs HAR-VIX-0.69

這些數字都離「可以當真」的門檻很遠。

白話講就是:

雖然組合模型在表格上有時排第一,但那個領先幅度小到你不能說它真的比 HAR-VIX 更準。它比較像是同一個水準上的隨機前後,而不是明確升級。

系統最後幾乎把全部權重都押回 VIX

這篇最有意思的地方,不是排名,而是動態加權模型最後怎麼選。

實驗裡有一個會隨時間調整權重的版本。它理論上可以在:

  • 歷史波動模型
  • VIX 模型

之間自由分配。

結果跑到最後,權重大概變成:

  • 歷史波動模型:0.00004
  • VIX 模型:0.99996

幾乎等於全部壓在 HAR-VIX 上。

累積誤差差距

這個畫面很有說服力。因為它不是研究者主觀說「VIX 看起來比較重要」,而是讓系統自己根據一路上的表現做選擇,最後它還是把答案收斂到 VIX 那邊。

這代表什麼

最直白的解讀是:

 在這段 SPY 樣本裡,VIX 提供的訊息已經夠多了。 

你把純歷史波動模型再疊上去,不是完全沒幫助,但幫助小到不足以形成可確認的增量。

換個比喻比較好懂。

假設你要猜明天會不會下大雨,手上有兩個資訊來源:

  • 過去幾天的天氣
  • 今天的雷達雲圖

如果雷達雲圖已經把明天的風險講得很完整,那你再把過去幾天的資料混進來,通常不會讓答案忽然變得更高明。你只是把一個本來就很強的訊號,又拿去跟一個比較弱的訊號平均。

結果常常不是更準,而是被稀釋。

這篇實驗最值得記住的教訓

K1315 很適合拿來提醒一件常見誤解:

 組合,不會自動創造新資訊。 

如果兩個模型看到的是差不多的東西,而且其中一個已經把訊號吸得差不多了,那把它們混起來,多半只是讓表達方式更複雜,不會讓結果真的升級。

這也是為什麼這篇的結論不是「組合模型沒用」,而是比較精確的版本:

  • 組合模型沒有比最強單模差很多
  • 但也沒有強到足以宣告超越
  • 而且動態權重最後幾乎全部回到 HAR-VIX

所以最務實的讀法是: 如果你已經有 HAR-VIX,再往上疊這些組合法,至少在這段資料裡沒有額外價值。 

對實務上有什麼用

如果你在做波動率預測、風險控制、或任何需要先估明天風險大小的流程,這篇給的提醒很簡單:

  1. 不要因為「組合」聽起來更高級,就預設它更好。
  2. 先確認最佳單模本身是不是已經把主要訊號抓住了。
  3. 如果組合後只多出一點點表面排名優勢,但沒有穩到能驗證,就不要急著把系統複雜化。

對一般投資人來說,這其實是個好消息。因為它代表:

 很多時候,最值得用的不是最花的做法,而是那個已經夠強、又夠簡單的做法。 

資料來源

本文基於本平台一份 SPY 波動率組合預測實驗。資料來源:yfinance,資產 SPYVIX,樣本內期間 2005-01-042018-12-31,樣本外期間 2019-01-022024-12-30,共 1,509 個交易日。比較對象包括歷史波動基準模型、HAR-VIX、等權平均、動態加權與 Bates-Granger 組合;評估方式為樣本外預測誤差分數與兩模型比較檢定。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
VIX 跌破 16 之後:三個波動率裂縫,比恐慌指數本身更值得留意
# VIX 跌破 16 之後:三個波動率裂縫,比恐慌指數本身更值得留意 VIX 這五個交易日一路探底:6/29 收 17.65,6/30 收 16.45,7/1 收 16.59,7/2 收 16.15,7/3 美股開盤前來到 15.84。連 16 這個心理關卡都守不住,是今年少見的低檔區。 FRED 資料顯示,7/1 當天 VIX3M 收在 19.16,比現貨 VIX 的 16.59 高出 2...
📄
波動率「測不準」能不能當減碼訊號?六檔 ETF、六十天的老實答案
打開任何一套波動率監控面板,你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個,用當天的開盤、最高、最低、收盤算出另一個,把隔夜跳空也加進去又是一個。多數時候它們差不多,偶爾會明顯對不上。這篇想回答一個很實際的問題:當這些數字彼此吵起來的時候,是不是代表隔天更難預測、應該先把部位縮小一點? ## 先講清楚「分歧」是什麼 把量測市場波動的方法想像成幾支溫度計。它們原理不同、...
📄
把五分鐘資料切得更細,預測真的會更準嗎?台指期給了一個保守答案
做波動率預測時,很容易想把資料切得更細。一天一筆收盤價太粗,那就看每五分鐘一筆;只看總波動太粗,那就再拆成上漲、下跌、跳動、估計噪音。直覺上,資料越細,模型應該越聰明。 這次台指期日盤實測給的答案比較冷靜:細資料有幫助,但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動,期間從 2017-05-16 到 2026-06-29,共 2219 個原始交易日。正式可判斷的樣本外...