讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

美股收盤後的 16 小時：SPY 隔夜波動貢獻了全天波動的 36.8%

SPY 波動率分解：隔夜 vs 盤中年化波動率對比

美股在台灣時間凌晨四點收盤，然後就「關燈了」。

多數散戶看盤的習慣是等開盤，開盤後才決定今天的操作方向。但實際上，美股從收盤到隔天開盤這 16 個小時，一點都沒有停下來，期貨繼續跑，ADR 繼續動，亞洲與歐洲市場持續傳遞消息。這段時間積累的報酬，統稱「隔夜報酬」，等開盤鈴響才瞬間反映。

我們用 SPY（標普 500 ETF）從 2007 年 1 月到 2026 年 3 月共 4840 個交易日的 OHLC 資料，把每天的波動分拆成兩部分：隔夜段（收盤價到隔天開盤價）和盤中段（當天開盤到收盤），然後算這兩段各貢獻多少。結果很清楚： 隔夜波動佔了全天總變異數的 36.8% ，盤中佔 59.4%，剩下 3.7% 是兩段的共變數（covariance）。

這個比例不算小。換算成年化波動率，全天是 19.7%，盤中是 15.2%，隔夜獨立算出來有 12.0%。三個數字加起來比全天高，原因是變異數的加法必須計算共變數，不是直接相加。

隔夜跟盤中，幾乎是兩個平行世界

真正讓人意外的是相關係數： 隔夜報酬和盤中報酬的相關係數只有 0.040 。這幾乎等於零。

意思是，昨晚漲了很多，今天盤中不見得會漲。昨晚跌了很多，今天盤中也不一定補跌。兩段波動各走各的路。從數學上來看，這代表如果你建的波動率模型只用盤中資料，預測明天的全天波動，就等於拋棄了快 37% 的資訊。

另一個值得注意的數字是隔夜報酬的分配形狀：偏態 -1.42、峰度 24.8。相比盤中報酬的偏態 -0.23、峰度 12.3，隔夜的尾部風險大上一截。極端的隔夜跌幅（例如疫情初期一夜 -11.0%）遠比同等幅度的盤中跌幅常見。對做 overnight 部位的交易人來說，這個差異比 Sharpe 更重要。

危機時隔夜佔比會飆高，但平靜市場也不低

從 2007 到 2026 年逐年計算，隔夜佔總波動的比例從最低 20.2% 到最高 61.4% 都出現過，長期均值是 36.5%。

不同年份的差異透露出明顯規律。2020 年 COVID 疫情爆發，隔夜佔比衝到 52.8%，是樣本期間最高。這背後是連續數週的亞市深夜利空消息、期貨熔斷，每天開盤前已有大量跳空缺口，盤中反而常見反彈。2021 年的疫苗行情尾聲仍有 44.0%。

但有一個反直覺的現象：2008 年金融海嘯，隔夜佔比只有 32.5%，2009 年更低到 29.0%。那段時間盤中跌幅非常大，雷曼兄弟倒閉後，許多大跌都是發生在盤中交易時段，不是開盤缺口。換句話說，波動的「來源」不是固定的，它會隨著市場機制的不同而切換。

2018 年是另一個低點，只有 25.1%，當年十月的急跌大多在盤中發生。

SPY 隔夜波動率佔比逐年變化（2008-2026）

上圖顯示 2008 年到 2026 年每年的隔夜佔比，灰色虛線是長期均值 36.5%。

六個預測模型，差異在哪裡

知道隔夜波動佔了相當比重之後，自然的問題是： 把隔夜資訊加進預測模型，預測品質真的會提升嗎？

這個問題我們用樣本外測試（2010 年底到 2026 年，共 3828 個預測點）比較六個模型。評估標準是 QLIKE，這是衡量波動率預測品質的標準損失函數，數字越小代表預測越準。

模型	QLIKE	說明
AMEM	1.5074	最佳；乘法結構分開建模隔夜與盤中
GJR-GARCH	1.5380	有處理槓桿效應的 GARCH 模型
HAR-OC	1.6048	用隔夜和盤中分開估計的 HAR 模型
EWMA	1.6238	指數加權移動平均，簡單但無記憶效果
HAR-RV	1.6732	標準 HAR 模型，不分隔夜盤中
HAR-OC-ext	162893	數值爆炸（退化解），實際不可用

六個波動率預測模型 QLIKE 排名（樣本外 2010 年底-2026 年）

AMEM 排第一，QLIKE 1.5074。GJR-GARCH 排第二，1.5380。

這裡要誠實說明：AMEM 和 GJR-GARCH 的差異用 DM 檢定算出 p 值是 0.035（略低於 0.05），但是這個差距沒有通過 Harvey（1997）修正後的更嚴格門檻。 Harvey 修正是針對小樣本特性做的保守調整，通過它才能說結論更穩健。這個修正沒通過，代表 AMEM 和 GJR-GARCH 之間的差距屬於邊際顯著，無法確定地說 AMEM 更好。

簡單說法：前兩名幾乎打平，GJR-GARCH 在實作上有更廣泛的支援，AMEM 的數值略優但差距不到統計顯著水準。

反倒是下方的模型有更清楚的差異。GJR-GARCH 對 EWMA 的優勢是確定的（DM t 統計量 -4.75，p < 0.001，通過 Harvey 修正）；對 HAR-OC 也同樣清楚（t = -6.62，p < 1e-10）。AMEM 對 EWMA、HAR-RV、HAR-OC 的優勢也都通過嚴格檢定。標準 HAR-RV 在這場比賽裡排墊底，說明不分隔夜和盤中直接用總 RV 來建模，會損失一部分預測力。

幾個值得停下來想的點

第一， 「隔夜」和「盤中」的波動結構不同，應該分開對待 。相關係數 0.040 不是雜訊，是一個真實的分離信號。如果你用一個模型同時處理這兩段，等於在用同一把尺量兩條不同性質的繩子。

第二， 極端事件在夜晚更容易形成 。隔夜報酬的峰度 24.8 是盤中的兩倍，尾部風險不能用正常分配假設去衡量。選擇權定價、VaR 計算、以及任何涉及隔夜部位的風管模型，都需要對這個特性做出調整。

第三， 沒有「必然最好」的模型 。AMEM 在 QLIKE 上排第一，但它在實作複雜度上比 GJR-GARCH 高得多，而且兩者的差距在統計上尚不確定。GJR-GARCH 在理論與工具成熟度上的優勢，可能在實際應用中反而更可靠。模型排名是 in-sample 或 out-of-sample 的快照，不是永久的判決。

這篇文章的完整實驗（包含程式碼、原始資料、各模型逐日預測結果）存放在 K772 實驗檔案中，方法論依循 Hansen & Lunde（2005）的報酬分解框架，模型比較參照 Engle & Gallo（2006）的 AMEM 架構以及 Corsi（2009）的 HAR 模型，DM 顯著性檢定使用 Harvey（1997）修正版。

資料來源 ：yfinance SPY OHLC，2007-01-03 至 2026-03-30，N=4840 個交易日。

參考文獻 ：Hansen & Lunde (2005) Journal of Applied Econometrics 20, 873-889；Corsi (2009) Journal of Financial Econometrics 7, 174-196；Engle & Gallo (2006) Journal of Econometrics 131, 3-27。

圖表說明 ：本文三張圖均以 Python matplotlib 生成，數字均來自 K772 實驗結果檔。