一般讀者2026/06/26 上午05:00

2025 的波動率文獻，其實沒有叫你先追 AI 模型

風險管理模型比較機器學習波動率研究文獻回顧

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

2025 的波動率文獻，其實沒有叫你先追 AI 模型

只要看到「AI」「deep learning」「transformer」這幾個字，很多人會自然以為波動率預測這條線也差不多定案了：老模型快退場，接下來就是新模型接管。

這次整理做的事很簡單：不先站隊，先把 2025 前後最關鍵的 6 篇 primary sources 拉出來看。裡面有 3 篇 review，也有 3 篇直接做 benchmark 的實證研究。

看完之後，結論和常見想像差很多。

文獻真正支持的，不是「先追最新 AI 模型」，而是「先把比較規則訂乾淨」。

先講結論：這批文獻沒有給出「AI 已全面打贏」的授權

納入的主來源裡，最新的那篇 Financial Innovation review 掃了 2000 年到 2024 上半年的公開研究，整理了 32 類 方法。另一篇 2024 review 專門看 AI / ML 在 realized volatility 與 implied volatility 的應用。

如果今天文獻已經非常一致，這兩篇 review 應該會很乾脆地告訴你：傳統線性 baseline 已經過時了。

但它們沒有。

更關鍵的是，2024 那篇 benchmark paper 直接拿 10 個全球股票指數 做比較，給出的結論也不是「非線性模型普遍統治」，而是更保守的版本：

某些資料集、某些預測 horizon，複雜模型可以贏
但沒有一般性的統計證據證明它們穩定壓過強線性 baseline
看到小幅 accuracy 改善，不代表可以直接把老模型判死刑

這件事很重要，因為它把研究問題從「哪個模型名字最潮」改成「你到底是不是拿同一把尺在比」。

文獻訊號強度

這批文獻反而在提醒：真正常出問題的是 benchmark discipline

如果把這次整理的 5 條主發現排一下，支持最強的不是某個模型家族，而是另一句比較無聊、但更值錢的提醒：

benchmark discipline 才是主問題。

什麼意思？

做 realized volatility forecasting 時，研究很容易在幾個地方偷偷失去公平：

你預測的 target 根本不一樣
loss function 換一下，排名就變了
只報平均誤差，不報正式檢定
baseline 選太弱，新的模型當然容易看起來很漂亮

這跟 VolPred 最近幾個實驗自己踩到的坑非常像。也就是說，這不是我們團隊的偶發失誤，而是整條文獻帶本來就常見的弱點。

換句話說， 如果比較規則沒先鎖好，後面任何「新模型贏了」都可能只是表面結果。

文獻還提醒另一件事：realized measure 本身就會改變排名

這是這次整理裡另一個很值得一般讀者記住的點。

很多人會把 realized measure 當成前處理細節，覺得重點在模型本身。可 2025 那篇比較研究給出的訊號是：你拿什麼 measure 當 target，本身就可能改變結果。

同一篇研究裡，對某些傳統波動率模型比較友善的設定，未必也對 deep-learning 類模型最有利。5-minute RV、MedRV、range-based proxy 不是只是資料整理方式不同，它們可能直接影響誰排第一。

這件事的白話版就是：

有時候不是模型真的比較強，而是它剛好在自己比較吃香的 target 上比賽。

所以這次整理對下一步的建議不是「直接上 transformer」，而是先做一次更扎實的 shared-target 比賽。

如果只做一條 follow-up，文獻最支持哪一條？

這次整理最實用的部分，其實不是 review 本身，而是把下一步排序排出來。

根據 6 篇 primary sources 整理後，VolPred 下一步最合理的順序是：

先做 三種老牌高頻基準模型 的共享 target battle
再做 realized-measure ablation，測 5-minute RV、MedRV、range proxy 會不會翻排名
再往 economic value 走，看小幅預測改善有沒有真的變成風管或配置效益
最後才做 restrained ML extension，而不是一開始就進模型動物園

這個順序不是保守，而是比較不浪費時間。

因為如果 baseline 還沒鎖、target 還沒對齊、measure 還會翻盤，那你先把最重的 AI 模型搬上桌，多半只是在更貴的舞台上重演同一個比較錯誤。

VolPred 下一步路線圖

為什麼 economic value 反而比再跑一輪 accuracy ranking 更值得追

納入的一篇 2025 paper 還給了另一個方向：如果你真的要往前推，不如少看一點「誰的平均誤差再低一點」，多看一點「這個改善有沒有變成實際效益」。

那篇研究的訊號是， 按 economic performance 加權的 forecast combination ，有時比只看統計誤差的組合更值得關注，特別是在高波動或危機時段。

這對一般讀者的意思其實很直白：

如果一個模型只是在 paper 裡多贏了幾個小數點，但沒有真的改善風險管理、部位配置或決策品質，那個勝利的含金量就有限。

一句話總結

看完 6 篇 primary sources 後，沒有得到「AI 模型已經把老方法掃掉」這種爽快結論。

更誠實的讀法是：

2025 的文獻真正支持的下一步，不是先追最炫模型，而是先把 baseline、target、measure 跟評估方式全部鎖公平。

對 VolPred 來說，這不是退一步，反而是少走冤枉路。

資料來源

本文基於 VolPred 的一份 structured literature review，不是市場回測。樣本為 6 篇 primary sources：3 篇 review、3 篇 benchmark / empirical studies，年份涵蓋 2018、2024、2025。核心來源包括 Financial Innovation 2025 review、Journal of Empirical Finance 2024 benchmark、以及 Journal of Asset Management 2025 的 economic-performance combination study。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

AI 波動率模型真的比較聰明嗎？RECH-X 的答案很克制

一個波動率模型加上 AI 後，真的會比較會預測嗎？這個問題最近又被 RECH-X 拉回桌上。RECH-X 的想法很直覺：保留老派波動率模型的骨架，再塞進一個很小的神經網路，讓模型能讀昨天的市場震動、昨天估出的風險、以及已實現波動率。2024 年一篇 Finance Research Letters 論文給出漂亮結果，主張 RECH-X 在 S&P 500 上勝過 RealGARCH。我們把...

→📄

同一個波動率模型，換個計算方式還能贏嗎？五個市場階段的穩定性測試

# 同一個波動率模型，換個計算方式還能贏嗎？五個市場階段的穩定性測試學術研究中的波動率模型，常被質疑一件事：「這個模型是不是只在特定設定下才贏？稍微換個條件就垮了？」這篇文章要說的，是我們對一個已有正面結論的模型（A4f）做的一次壓力測試。 --- ## 背景：A4f 模型是什麼 A4f 是我們在進行中的論文研究中提出的波動率預測框架。核心想法很直接：預測明天股市的波動率時，把當前的...

→📄

預測輸了，守底線卻贏了：一個模型的分裂成績單

# 預測輸了，守底線卻贏了：一個模型的分裂成績單 2022 年，美股科技股崩跌超過 30%，黃金在通膨衝擊裡逆勢震盪，長期公債跌幅創下四十年紀錄。那一整年市場劇烈抖動，每天早上你不知道波動率會是 1% 還是 3%。如果有一套模型聲稱能預測「明天大概會動多少」，你會怎麼評分它？多數人的第一反應是：預測值跟實際值差多遠。差越少，模型越好。 VolPred 的一組實驗給出了一個更分裂的答案：...

→