一般讀者2026/06/20 上午04:00

把兩個看起來都不錯的模型混在一起，為什麼最後還是贏不了最強那個？

SPYVIX波動率預測預測模型組合

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

把兩個看起來都不錯的模型混在一起，為什麼最後還是贏不了最強那個？

投資研究裡有個很直覺的想法：

如果兩個模型各有優點，那把它們平均、加權，甚至讓系統自己學權重，理論上應該更穩、更準。

這個想法聽起來很合理，所以很多人會自然以為：

單一模型很強，組合模型應該更強。

但 K1315 跑出來的答案剛好相反。

在 SPY 這條線上，把「只看歷史波動」和「加入 VIX 的模型」混在一起之後，結果並沒有變更好。最好的那個，還是原本就最強的 HAR-VIX 單一模型。

樣本外誤差比較

這次到底在比什麼

這份實驗做的不是再發明新模型，而是問一個更務實的問題：

既然 HAR-VIX 已經比純歷史模型好，那再把兩者組合起來，能不能再往前推一步？

測試對手有五個：

只看歷史波動的基準模型
加入 VIX 的模型
兩者直接 50/50 平均
根據最近表現動態加權
用經典 OLS 組合法自動估權重

資料是 SPY，樣本外期間是 2019-01-02 到 2024-12-30，共 1,509 個交易日。

排名第一的，的確不是單模

如果你只看表面排名，會覺得組合模型好像有戲。

五個模型的樣本外誤差分數是：

模型	誤差分數
Bates-Granger 組合	-3.9181
HAR-VIX	-3.9170
動態加權組合	-3.9167
50/50 平均	-3.9138
純歷史基準	-3.8918

乍看之下，第一名確實是組合模型，而且還比 HAR-VIX 稍微低一點。

但真正重要的不是「誰排第一」，而是：

這個差距大到足以當真嗎？

答案是： 沒有。

最關鍵的一句話：差距小到不能算真的贏

這份實驗用了很嚴格的兩模型比較檢定。結果是：

動態加權 vs HAR-VIX：1.08
50/50 平均 vs HAR-VIX：1.04
Bates-Granger vs HAR-VIX：-0.69

這些數字都離「可以當真」的門檻很遠。

白話講就是：

雖然組合模型在表格上有時排第一，但那個領先幅度小到你不能說它真的比 HAR-VIX 更準。它比較像是同一個水準上的隨機前後，而不是明確升級。

系統最後幾乎把全部權重都押回 VIX

這篇最有意思的地方，不是排名，而是動態加權模型最後怎麼選。

實驗裡有一個會隨時間調整權重的版本。它理論上可以在：

歷史波動模型
VIX 模型

之間自由分配。

結果跑到最後，權重大概變成：

歷史波動模型：0.00004
VIX 模型：0.99996

幾乎等於全部壓在 HAR-VIX 上。

累積誤差差距

這個畫面很有說服力。因為它不是研究者主觀說「VIX 看起來比較重要」，而是讓系統自己根據一路上的表現做選擇，最後它還是把答案收斂到 VIX 那邊。

這代表什麼

最直白的解讀是：

在這段 SPY 樣本裡，VIX 提供的訊息已經夠多了。

你把純歷史波動模型再疊上去，不是完全沒幫助，但幫助小到不足以形成可確認的增量。

換個比喻比較好懂。

假設你要猜明天會不會下大雨，手上有兩個資訊來源：

過去幾天的天氣
今天的雷達雲圖

如果雷達雲圖已經把明天的風險講得很完整，那你再把過去幾天的資料混進來，通常不會讓答案忽然變得更高明。你只是把一個本來就很強的訊號，又拿去跟一個比較弱的訊號平均。

結果常常不是更準，而是被稀釋。

這篇實驗最值得記住的教訓

K1315 很適合拿來提醒一件常見誤解：

組合，不會自動創造新資訊。

如果兩個模型看到的是差不多的東西，而且其中一個已經把訊號吸得差不多了，那把它們混起來，多半只是讓表達方式更複雜，不會讓結果真的升級。

這也是為什麼這篇的結論不是「組合模型沒用」，而是比較精確的版本：

組合模型沒有比最強單模差很多
但也沒有強到足以宣告超越
而且動態權重最後幾乎全部回到 HAR-VIX

所以最務實的讀法是： 如果你已經有 HAR-VIX，再往上疊這些組合法，至少在這段資料裡沒有額外價值。

對實務上有什麼用

如果你在做波動率預測、風險控制、或任何需要先估明天風險大小的流程，這篇給的提醒很簡單：

不要因為「組合」聽起來更高級，就預設它更好。
先確認最佳單模本身是不是已經把主要訊號抓住了。
如果組合後只多出一點點表面排名優勢，但沒有穩到能驗證，就不要急著把系統複雜化。

對一般投資人來說，這其實是個好消息。因為它代表：

很多時候，最值得用的不是最花的做法，而是那個已經夠強、又夠簡單的做法。

資料來源

本文基於本平台一份 SPY 波動率組合預測實驗。資料來源：yfinance，資產 SPY 與 VIX，樣本內期間 2005-01-04 至 2018-12-31，樣本外期間 2019-01-02 至 2024-12-30，共 1,509 個交易日。比較對象包括歷史波動基準模型、HAR-VIX、等權平均、動態加權與 Bates-Granger 組合；評估方式為樣本外預測誤差分數與兩模型比較檢定。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

VIX 跌破 16 之後：三個波動率裂縫，比恐慌指數本身更值得留意

# VIX 跌破 16 之後：三個波動率裂縫，比恐慌指數本身更值得留意 VIX 這五個交易日一路探底：6/29 收 17.65，6/30 收 16.45，7/1 收 16.59，7/2 收 16.15，7/3 美股開盤前來到 15.84。連 16 這個心理關卡都守不住，是今年少見的低檔區。 FRED 資料顯示，7/1 當天 VIX3M 收在 19.16，比現貨 VIX 的 16.59 高出 2...

→📄

波動率「測不準」能不能當減碼訊號？六檔 ETF、六十天的老實答案

打開任何一套波動率監控面板，你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個，用當天的開盤、最高、最低、收盤算出另一個，把隔夜跳空也加進去又是一個。多數時候它們差不多，偶爾會明顯對不上。這篇想回答一個很實際的問題：當這些數字彼此吵起來的時候，是不是代表隔天更難預測、應該先把部位縮小一點？ ## 先講清楚「分歧」是什麼把量測市場波動的方法想像成幾支溫度計。它們原理不同、...

→📄

把五分鐘資料切得更細，預測真的會更準嗎？台指期給了一個保守答案

做波動率預測時，很容易想把資料切得更細。一天一筆收盤價太粗，那就看每五分鐘一筆；只看總波動太粗，那就再拆成上漲、下跌、跳動、估計噪音。直覺上，資料越細，模型應該越聰明。這次台指期日盤實測給的答案比較冷靜：細資料有幫助，但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動，期間從 2017-05-16 到 2026-06-29，共 2219 個原始交易日。正式可判斷的樣本外...

→