← Research Feed
研究2026/06/03 上午03:07

模型只贏 1%,很多時候還不能算真的贏

VIX波動率預測模型比較負面結果投資研究

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

模型只贏 1%,很多時候還不能算真的贏

做投資研究很容易被一種差距誘惑。

你跑完三個模型,發現其中一個的分數比較低,剛好多贏了 1% 到 2%。這時很自然會想把它翻譯成一句漂亮的話:新版模型比較強。

問題是, 看起來有領先,不代表已經贏到足以當成結論。 

這次我們把三種波動率預測做法放在同一條跑道上比較。一個是經典的 HAR-RV,一個是較新的 A4f,另一個是把 HAR-RV 再加上 VIX 訊號的版本。

結果表面上很有故事。

small gap versus real edge

先看左圖。三個模型的平均誤差分別是:

  • HAR-RV:1.561
  • A4f:1.539
  • HAR-RV-VIX:1.523

如果你只看這張排名,很容易得出兩句很像樣的話。

第一句:A4f 比 HAR-RV 好,因為它的誤差少了大約 1.4%。

第二句:HAR-RV-VIX 更厲害,因為它三者裡最低。

這兩句話都不是完全錯,但都還少了最重要的一步: 這個差距有沒有大到足以排除只是剛好? 

右圖就是在回答這件事。

三組直接對打的分數分別是:

  • HAR-RV vs A4f:0.87
  • HAR-RV-VIX vs A4f:-0.88
  • HAR-RV-VIX vs HAR-RV:-2.60

這些分數看起來有方向,但都沒有跨過我們事先設好的嚴格門檻。白話一點講,就是:

 你可以說它們看起來有差,但還不能安心說那個差距已經大到值得你下重話。 

這件事聽起來很學術,其實跟日常判斷很像。

假設兩個基金經理人,一個年化多賺 1%,另一個少 1%。如果你只看一年,很可能只是市場剛好站在其中一邊。但如果你真的要說「這個人比較厲害」,你通常會希望那個差距更穩、更持久、更不容易被運氣解釋掉。

模型比較也是一樣。

研究裡最容易犯的錯誤,不是完全沒差的東西被吹成神話,而是 只有一點點優勢的東西,被過早包裝成新標準答案。 

K1396 這個實驗最有價值的地方,就是它逼你把這一步補上。

它沒有告訴你「三個模型都一樣」。它告訴你的是更細的一句話:

 目前看到的排名差距,還不足以讓你很有把握地說誰真的拉開了。 

這個提醒很重要,因為投資世界特別喜歡小幅領先的故事。多一點點 alpha、多一點點準度、多一點點風控分數,聽起來都很迷人。可是一旦你把時間拉長、把比較做嚴格,很多小優勢都會變得沒那麼篤定。

對一般投資人來說,這篇最實用的地方不是記住 HAR-RV 或 A4f 這些名字,而是記住這個判斷原則:

  1. 排名比較好看,不等於真的比較強
  2. 小幅領先,要先懷疑是不是運氣
  3. 真正能站得住腳的優勢,通常不會只靠 1% 的差距撐場

所以,下次你看到一個新模型、新策略、新指標,只比舊方法多贏一點點,先別急著把它當成升級版。比較穩妥的態度是:

 先問它是真的贏,還是只是暫時排在前面。 

這往往比看排行榜本身更重要。


本文基於 VolPred 內部對照實驗。資料期間:2005-01-01 至 2026-05-22;樣本外起點:2019-01-01;樣本外觀測值:1,866。比較對象為 HAR-RV、A4f、HAR-RV-VIX 三種日頻波動率預測方法。

詳情

n_obs
1866
charts
/Users/yhlai0911/Desktop/volpred-research/experiments/k1396/k1396_general_article_chart.png
period
2019-01-01 to 2026-05-22
verdict
ACKNOWLEDGED
data_source
internal HAR-RV vs A4f comparison
topic_cluster
vix
cluster_waiver
pending daily_article task K1396; angle focuses on small-gap interpretation rather than repeating prior A4f or HAR-RV coverage
experiment_refs
K1396
topic_cluster_30d
{"cap":15,"count":131,"ratio":0.5058,"exempt":false}

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
只贏一點點,很多時候還不能算模型真的比較強
# 只贏一點點的模型,很多時候還不能算真的贏 做投資研究很容易被一種差距誘惑。 你跑完三個模型,發現其中一個的分數比較低,剛好多贏了 1% 到 2%。這時很自然會想把它翻譯成一句漂亮的話:新版模型比較強。 問題是,**看起來有領先,不代表已經贏到足以當成結論。** 這次我們把三種日頻波動率預測做法放在同一條跑道上比較:一個是經典老方法,一個是較新的版本,另一個則是在老方法上再加進市場恐慌指...
📄
波動率預測不是把指標愈疊愈多就會愈準
# 波動率預測不是把指標愈疊愈多就會愈準 做投資研究的人很容易有一個衝動:再加一個指標、再多一層結構、再換一個比較新的做法,預測應該就會更準。 這次我們把四種波動率預測方法放到同一條跑道上,直接看 2019 年到 2026 年、共 1,852 個交易日的往前預測表現。裡面有老方法、有較新的版本,也有把恐慌指標一起塞進去的組合。 結果很不戲劇化。**比較新的做法表面上有小幅領先,但差距小到不足...
📄
讓模型更常改變心意,不代表它就更會預測
# 讓模型更常改變心意,不代表它就更會預測 很多人直覺上會覺得,投資模型如果太早「認定單一答案」,就容易僵化。那最自然的改法是什麼?讓它不要記得那麼久,定期把舊證據忘掉一點,這樣它就能更靈活地重新分配權重。 這個想法很合理。我們也真的拿它去測了。 結果很有教育意義:**模型確實變得比較不固執了,但預測沒有因此變得更準。** ![forgetting factor entropy evolu...
模型只贏 1%,很多時候還不能算真的贏 | VolPred