模型只贏 1%,很多時候還不能算真的贏
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
模型只贏 1%,很多時候還不能算真的贏
做投資研究很容易被一種差距誘惑。
你跑完三個模型,發現其中一個的分數比較低,剛好多贏了 1% 到 2%。這時很自然會想把它翻譯成一句漂亮的話:新版模型比較強。
問題是, 看起來有領先,不代表已經贏到足以當成結論。
這次我們把三種波動率預測做法放在同一條跑道上比較。一個是經典的 HAR-RV,一個是較新的 A4f,另一個是把 HAR-RV 再加上 VIX 訊號的版本。
結果表面上很有故事。
先看左圖。三個模型的平均誤差分別是:
- HAR-RV:1.561
- A4f:1.539
- HAR-RV-VIX:1.523
如果你只看這張排名,很容易得出兩句很像樣的話。
第一句:A4f 比 HAR-RV 好,因為它的誤差少了大約 1.4%。
第二句:HAR-RV-VIX 更厲害,因為它三者裡最低。
這兩句話都不是完全錯,但都還少了最重要的一步: 這個差距有沒有大到足以排除只是剛好?
右圖就是在回答這件事。
三組直接對打的分數分別是:
- HAR-RV vs A4f:0.87
- HAR-RV-VIX vs A4f:-0.88
- HAR-RV-VIX vs HAR-RV:-2.60
這些分數看起來有方向,但都沒有跨過我們事先設好的嚴格門檻。白話一點講,就是:
你可以說它們看起來有差,但還不能安心說那個差距已經大到值得你下重話。
這件事聽起來很學術,其實跟日常判斷很像。
假設兩個基金經理人,一個年化多賺 1%,另一個少 1%。如果你只看一年,很可能只是市場剛好站在其中一邊。但如果你真的要說「這個人比較厲害」,你通常會希望那個差距更穩、更持久、更不容易被運氣解釋掉。
模型比較也是一樣。
研究裡最容易犯的錯誤,不是完全沒差的東西被吹成神話,而是 只有一點點優勢的東西,被過早包裝成新標準答案。
K1396 這個實驗最有價值的地方,就是它逼你把這一步補上。
它沒有告訴你「三個模型都一樣」。它告訴你的是更細的一句話:
目前看到的排名差距,還不足以讓你很有把握地說誰真的拉開了。
這個提醒很重要,因為投資世界特別喜歡小幅領先的故事。多一點點 alpha、多一點點準度、多一點點風控分數,聽起來都很迷人。可是一旦你把時間拉長、把比較做嚴格,很多小優勢都會變得沒那麼篤定。
對一般投資人來說,這篇最實用的地方不是記住 HAR-RV 或 A4f 這些名字,而是記住這個判斷原則:
- 排名比較好看,不等於真的比較強
- 小幅領先,要先懷疑是不是運氣
- 真正能站得住腳的優勢,通常不會只靠 1% 的差距撐場
所以,下次你看到一個新模型、新策略、新指標,只比舊方法多贏一點點,先別急著把它當成升級版。比較穩妥的態度是:
先問它是真的贏,還是只是暫時排在前面。
這往往比看排行榜本身更重要。
本文基於 VolPred 內部對照實驗。資料期間:2005-01-01 至 2026-05-22;樣本外起點:2019-01-01;樣本外觀測值:1,866。比較對象為 HAR-RV、A4f、HAR-RV-VIX 三種日頻波動率預測方法。
詳情
- n_obs
- 1866
- charts
- /Users/yhlai0911/Desktop/volpred-research/experiments/k1396/k1396_general_article_chart.png
- period
- 2019-01-01 to 2026-05-22
- verdict
- ACKNOWLEDGED
- data_source
- internal HAR-RV vs A4f comparison
- topic_cluster
- vix
- cluster_waiver
- pending daily_article task K1396; angle focuses on small-gap interpretation rather than repeating prior A4f or HAR-RV coverage
- experiment_refs
- K1396
- topic_cluster_30d
- {"cap":15,"count":131,"ratio":0.5058,"exempt":false}
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊