一般讀者2026/07/01 上午06:01

同一個波動率模型，換個計算方式還能贏嗎？五個市場階段的穩定性測試

風險管理波動率模型穩健性測試學術研究A4f框架

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

同一個波動率模型，換個計算方式還能贏嗎？五個市場階段的穩定性測試

學術研究中的波動率模型，常被質疑一件事：「這個模型是不是只在特定設定下才贏？稍微換個條件就垮了？」

這篇文章要說的，是我們對一個已有正面結論的模型（A4f）做的一次壓力測試。

背景：A4f 模型是什麼

A4f 是我們在進行中的論文研究中提出的波動率預測框架。核心想法很直接：預測明天股市的波動率時，把當前的市場恐慌程度（用 VIX² 代表）乘進模型，作為時變的「背景波動水位」。

先前的研究已經驗證：A4f 比標準的基準波動率模型更準，差距顯著。用兩模型比較的統計檢定（DM 檢定）來看，t 值達 4.48，大幅超過學術界的顯著門檻（|t| > 3.0）。

這個結果是在「收盤到隔天收盤」的日報酬設定下得到的。

新問題：改用「開盤到收盤」的報酬，模型還贏嗎？

相比完整的一天（收盤到收盤），「開盤到收盤」只涵蓋交易時段這一段。理論上，白天的股價波動和 VIX 的關係可能和整日不同。

這次測試就是要問：把 A4f 的訓練和預測目標都換成「開盤到收盤報酬」（A4f_oc），跟同樣設定下的基準模型（GJR_oc）比，還能顯著贏嗎？

這不是小改動。換掉 return 定義，意味著模型接收到的訓練訊號完全不同，參數需要重新估計，原先在「全日報酬」上學到的規律，不一定能平移過來。

怎麼測的

使用 SPY 從 2005 年到 2026 年 4 月的資料（n=5,350 個交易日），OOS（樣本外測試）從 2019 年起，共 1,828 個交易日。

模型每隔 63 個交易日（約一季）重新估計一次，共估了 30 次。這比「一次性估計完」更貼近真實，因為它不會把未來資料泄漏進去。

測試問了三個問題（H1/H2/H3）：

H1 ：A4f_oc 有沒有顯著勝過 GJR_oc？
H2 ：A4f_oc 勝 GJR_oc 的幅度，有沒有超過原始 A4f_close 勝 GJR_close 的幅度（4.48）？
H3 ：把 OOS 拆成 5 個子期間，A4f_oc 每段都贏嗎？

結果：兩個通過，一個沒有

H1：通過 。DM t 值 = 4.04，超過 3.0 的門檻。A4f_oc 在開盤到收盤的設定下，仍然顯著勝過基準模型。這表示「把 VIX 乘進模型」這個核心機制，換了 return 定義還是有效。

H3：通過 。五個子期間全部 A4f_oc 勝出（5/5）。如果只看勝負方向，五段全勝在簡單二項檢定下的機率是 3.1%；但五段裡只有一段達到嚴格的單段顯著門檻，所以這裡應解讀成「方向一致」，不是「每一段都強顯著」。這五段涵蓋了很不一樣的市場狀態：

子期間	市場特徵	A4f_oc 結果
COVID 前 (2019)	相對平靜	勝
COVID (2020-2021 上)	極端波動	勝
COVID 後 (2021 下-2022)	通膨升溫	勝（最顯著）
升息期 (2023-2024 上)	利率高點	勝
近期 (2024 下-2026)	科技強勢	勝

五段全勝支持這個框架不是只在某個特殊市場環境下才有效，但證據重點在方向穩定，不是每個子期間都單獨過關。

H2：沒通過 。DM t 值 = 4.04，沒有超過原始全日設定的 4.48。比較嚴格的說法是：A4f_oc 雖然顯著勝過自己的基準模型，但沒有超過事先設定的 4.48 高標；這裡沒有另外檢定「4.04 和 4.48 兩個統計量的差」。

四個模型的 DM 比較矩陣

H2 沒通過，代表什麼？

並不代表 A4f_oc 不好。比較穩健的解讀是：在這組相對基準下，完整的 close-to-close 設定仍略強，open-to-close 版本則提供了一個通過壓力測試的補充視角。

這有直覺意義。VIX 本身衡量的是未來 30 天的整體波動風險（含夜盤、隔夜風險、全日資訊），它對完整的 close-to-close 報酬的解釋力，自然可能比只看開盤到收盤那一段更強。

A4f_oc 的 DM t 值 = 4.04 已是「顯著」，只是沒超過全日設定下的 4.48 這個高標。

五個子期間的穩定性測試

對一般投資人的意義

這個研究直接意義不大，絕大多數散戶不需要選「用哪種 return 算波動率」。

但有一件事是具體的： 同一個框架在五個相差很大的市場階段都贏 ，包括 COVID 的極端波動期、升息後的高利率期、近期的科技股強勢期。這種跨 regime 的一致性，比單一市場環境下的勝出更有說服力；但五段裡只有一段過嚴格單段顯著門檻，所以證據強度應該放在「方向一致」而不是「每段都強顯著」。

對波動率模型或量化策略有興趣的人，這種「換個計算方式還能贏」的壓力測試，是一個評估模型是否真的有效的標準做法，而不只是在某一組設定下硬調出最好結果。

A4f 框架通過了這個測試的兩個方向（H1 + H3），只在「勝幅要超過原始結果」這個額外挑戰上沒過（H2）。這個結果讓 A4f 論文的結論更可信，而不是更弱。

資料來源 ：SPY OHLC 日線資料（yfinance）、CBOE VIX，資料期間 2005-01-04 至 2026-04-10（n=5,350 日）；樣本外測試期間 2019-01 起，n=1,828 日。A4f 模型 rolling refit 視窗 2000 日、重估頻率每 63 日（共 30 次），seed=42。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

波動率「測不準」能不能當減碼訊號？六檔 ETF、六十天的老實答案

打開任何一套波動率監控面板，你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個，用當天的開盤、最高、最低、收盤算出另一個，把隔夜跳空也加進去又是一個。多數時候它們差不多，偶爾會明顯對不上。這篇想回答一個很實際的問題：當這些數字彼此吵起來的時候，是不是代表隔天更難預測、應該先把部位縮小一點？ ## 先講清楚「分歧」是什麼把量測市場波動的方法想像成幾支溫度計。它們原理不同、...

→📄

年度等權再平衡，真的比抱著不動強嗎？台美 30 年實測拆給你看

每年第一個交易日，把手上每檔股票的金額重新拉回一樣多：賣掉漲多的、補上漲少的，回到等權。這套「年度等權再平衡」聽起來很有紀律。問題只有一個，它真的比什麼都不做、抱著不動更賺嗎？我把它放到 30 年、跨三個市場的資料裡硬測了一遍，六組籃子、含交易成本、用區塊自助法檢定。結論可能跟直覺不一樣。 ## 怎麼測的六組籃子，台股、美股、再到全球：台灣十大權值股、美國十大權值股、美國九檔產業 ETF...

→📄

交易量歸零那天，薄市場 ETF 後面 22 天更容易出事

# 交易量歸零那天，薄市場 ETF 後面 22 天更容易出事薄市場 ETF 的資料偶爾會出現零成交、價格不動、甚至少一天報價。直覺會把它們丟進資料清理清單；這次檢查給出比較窄的結論：在部分流動性很薄的國家 ETF 裡，這些痕跡常常也是下一段風險升高的提醒。這次樣本使用 Yahoo Finance 日資料，涵蓋 28 檔 ETF，期間從 2014-01-01 到 2026-06-29 的可得...

→