← 研究動態
一般讀者2026/07/01 上午06:01

同一個波動率模型,換個計算方式還能贏嗎?五個市場階段的穩定性測試

風險管理波動率模型穩健性測試學術研究A4f框架

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

同一個波動率模型,換個計算方式還能贏嗎?五個市場階段的穩定性測試

學術研究中的波動率模型,常被質疑一件事:「這個模型是不是只在特定設定下才贏?稍微換個條件就垮了?」

這篇文章要說的,是我們對一個已有正面結論的模型(A4f)做的一次壓力測試。


背景:A4f 模型是什麼

A4f 是我們在進行中的論文研究中提出的波動率預測框架。核心想法很直接:預測明天股市的波動率時,把當前的市場恐慌程度(用 VIX² 代表)乘進模型,作為時變的「背景波動水位」。

先前的研究已經驗證:A4f 比標準的基準波動率模型更準,差距顯著。用兩模型比較的統計檢定(DM 檢定)來看,t 值達 4.48,大幅超過學術界的顯著門檻(|t| > 3.0)。

這個結果是在「收盤到隔天收盤」的日報酬設定下得到的。


新問題:改用「開盤到收盤」的報酬,模型還贏嗎?

相比完整的一天(收盤到收盤),「開盤到收盤」只涵蓋交易時段這一段。理論上,白天的股價波動和 VIX 的關係可能和整日不同。

這次測試就是要問:把 A4f 的訓練和預測目標都換成「開盤到收盤報酬」(A4f_oc),跟同樣設定下的基準模型(GJR_oc)比,還能顯著贏嗎?

這不是小改動。換掉 return 定義,意味著模型接收到的訓練訊號完全不同,參數需要重新估計,原先在「全日報酬」上學到的規律,不一定能平移過來。


怎麼測的

使用 SPY 從 2005 年到 2026 年 4 月的資料(n=5,350 個交易日),OOS(樣本外測試)從 2019 年起,共 1,828 個交易日。

模型每隔 63 個交易日(約一季)重新估計一次,共估了 30 次。這比「一次性估計完」更貼近真實,因為它不會把未來資料泄漏進去。

測試問了三個問題(H1/H2/H3):

  1.  H1 :A4f_oc 有沒有顯著勝過 GJR_oc?
  2.  H2 :A4f_oc 勝 GJR_oc 的幅度,有沒有超過原始 A4f_close 勝 GJR_close 的幅度(4.48)?
  3.  H3 :把 OOS 拆成 5 個子期間,A4f_oc 每段都贏嗎?

結果:兩個通過,一個沒有

 H1:通過 。DM t 值 = 4.04,超過 3.0 的門檻。A4f_oc 在開盤到收盤的設定下,仍然顯著勝過基準模型。這表示「把 VIX 乘進模型」這個核心機制,換了 return 定義還是有效。

 H3:通過 。五個子期間全部 A4f_oc 勝出(5/5)。如果只看勝負方向,五段全勝在簡單二項檢定下的機率是 3.1%;但五段裡只有一段達到嚴格的單段顯著門檻,所以這裡應解讀成「方向一致」,不是「每一段都強顯著」。這五段涵蓋了很不一樣的市場狀態:

子期間市場特徵A4f_oc 結果
COVID 前 (2019)相對平靜
COVID (2020-2021 上)極端波動
COVID 後 (2021 下-2022)通膨升溫勝(最顯著)
升息期 (2023-2024 上)利率高點
近期 (2024 下-2026)科技強勢

五段全勝支持這個框架不是只在某個特殊市場環境下才有效,但證據重點在方向穩定,不是每個子期間都單獨過關。

 H2:沒通過 。DM t 值 = 4.04,沒有超過原始全日設定的 4.48。比較嚴格的說法是:A4f_oc 雖然顯著勝過自己的基準模型,但沒有超過事先設定的 4.48 高標;這裡沒有另外檢定「4.04 和 4.48 兩個統計量的差」。

四個模型的 DM 比較矩陣


H2 沒通過,代表什麼?

並不代表 A4f_oc 不好。比較穩健的解讀是:在這組相對基準下,完整的 close-to-close 設定仍略強,open-to-close 版本則提供了一個通過壓力測試的補充視角。

這有直覺意義。VIX 本身衡量的是未來 30 天的整體波動風險(含夜盤、隔夜風險、全日資訊),它對完整的 close-to-close 報酬的解釋力,自然可能比只看開盤到收盤那一段更強。

A4f_oc 的 DM t 值 = 4.04 已是「顯著」,只是沒超過全日設定下的 4.48 這個高標。

五個子期間的穩定性測試


對一般投資人的意義

這個研究直接意義不大,絕大多數散戶不需要選「用哪種 return 算波動率」。

但有一件事是具體的: 同一個框架在五個相差很大的市場階段都贏 ,包括 COVID 的極端波動期、升息後的高利率期、近期的科技股強勢期。這種跨 regime 的一致性,比單一市場環境下的勝出更有說服力;但五段裡只有一段過嚴格單段顯著門檻,所以證據強度應該放在「方向一致」而不是「每段都強顯著」。

對波動率模型或量化策略有興趣的人,這種「換個計算方式還能贏」的壓力測試,是一個評估模型是否真的有效的標準做法,而不只是在某一組設定下硬調出最好結果。

A4f 框架通過了這個測試的兩個方向(H1 + H3),只在「勝幅要超過原始結果」這個額外挑戰上沒過(H2)。這個結果讓 A4f 論文的結論更可信,而不是更弱。


 資料來源 :SPY OHLC 日線資料(yfinance)、CBOE VIX,資料期間 2005-01-04 至 2026-04-10(n=5,350 日);樣本外測試期間 2019-01 起,n=1,828 日。A4f 模型 rolling refit 視窗 2000 日、重估頻率每 63 日(共 30 次),seed=42。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
波動率「測不準」能不能當減碼訊號?六檔 ETF、六十天的老實答案
打開任何一套波動率監控面板,你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個,用當天的開盤、最高、最低、收盤算出另一個,把隔夜跳空也加進去又是一個。多數時候它們差不多,偶爾會明顯對不上。這篇想回答一個很實際的問題:當這些數字彼此吵起來的時候,是不是代表隔天更難預測、應該先把部位縮小一點? ## 先講清楚「分歧」是什麼 把量測市場波動的方法想像成幾支溫度計。它們原理不同、...
📄
年度等權再平衡,真的比抱著不動強嗎?台美 30 年實測拆給你看
每年第一個交易日,把手上每檔股票的金額重新拉回一樣多:賣掉漲多的、補上漲少的,回到等權。這套「年度等權再平衡」聽起來很有紀律。問題只有一個,它真的比什麼都不做、抱著不動更賺嗎? 我把它放到 30 年、跨三個市場的資料裡硬測了一遍,六組籃子、含交易成本、用區塊自助法檢定。結論可能跟直覺不一樣。 ## 怎麼測的 六組籃子,台股、美股、再到全球:台灣十大權值股、美國十大權值股、美國九檔產業 ETF...
📄
交易量歸零那天,薄市場 ETF 後面 22 天更容易出事
# 交易量歸零那天,薄市場 ETF 後面 22 天更容易出事 薄市場 ETF 的資料偶爾會出現零成交、價格不動、甚至少一天報價。直覺會把它們丟進資料清理清單;這次檢查給出比較窄的結論:在部分流動性很薄的國家 ETF 裡,這些痕跡常常也是下一段風險升高的提醒。 這次樣本使用 Yahoo Finance 日資料,涵蓋 28 檔 ETF,期間從 2014-01-01 到 2026-06-29 的可得...
同一個波動率模型,換個計算方式還能贏嗎?五個市場階段的穩定性測試 | VolPred