壞消息真的比好消息更會推升波動嗎?九個市場的誠實檢視
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
壞消息真的比好消息更會推升波動嗎?九個市場的誠實檢視
一個流傳已久的市場直覺
在金融市場上,有一個被不斷重複的說法:「壞消息比好消息更會推高波動。」這個現象有個正式名稱,「槓桿效果(leverage effect)」或「不對稱波動(asymmetric volatility)」。它的故事大致是這樣:當股價下跌、公司資產相對於負債縮水,意味著公司槓桿被動上升,風險變大,因此波動隨之放大;反之,股價上漲時槓桿被稀釋,波動相對緩和。
這個直覺催生了知名的 GJR-GARCH 模型(Glosten, Jagannathan, Runkle 1993),在 GARCH(1,1) 的基礎上加了一個專門接住「負報酬日」的額外項,用一個係數 γ 衡量壞消息對下一期波動的額外貢獻。如果 γ 顯著為正,就代表這檔資產存在槓桿效果;γ 越大,不對稱性越強。
聽起來很合理,也被廣泛應用在風險管理、選擇權定價、波動率交易等領域。但問題是—— 這個故事在不同市場、不同資產上,真的都成立嗎?
在 K902 這個實驗中,我們用九個橫跨不同資產類別的標的(美股、新興市場、台股、黃金、長天期公債、白銀、比特幣),同時在「全樣本參數估計」與「滾動視窗穩健性檢查」兩個層面,用一致的口徑做了一次誠實的檢視。結果出乎意料地分歧。
樣本與方法
- 資料區間 :2017-01-03 至 2025-12-31(部分資產到 2025 年底)
- 資料來源 :yfinance 日線
- 樣本資產 :SPY、QQQ、IWM(美股)、EEM(新興市場)、0050.TW(台股)、GLD(黃金)、TLT(長天期公債)、SLV(白銀)、BTC-USD(比特幣)
- 觀測天數 :股票/ETF 約 2,187–2,262 天;BTC 因 24/7 交易達 3,287 天
- 方法 :
- 全樣本估計 GJR-GARCH(1,1) 的 γ 係數(最大概似 + 數值 Hessian 取統計強度)
- 滾動視窗穩健性:504 天(約兩年)視窗,每季滑動,計算 36 個(BTC 56 個)γ 樣本
- 樣本外(OOS)波動預測比較:2023–2024 年(主要 OOS)與 2025 年(驗證 OOS),衡量指標 QLIKE,使用兩模型比較檢定(Newey-West HAC)
全樣本:γ 的九種面貌
下表整理九個資產的全樣本 γ 係數。為了讓讀者直接看到誰「壞消息效應強」、誰「幾乎沒效應」、誰甚至「相反」,我把資產依 γ 由高到低排:
| 資產 | γ(不對稱項) | 統計強度 | 持續性 | 滾動 γ 平均 | 滾動 γ 為負之比例 |
|---|---|---|---|---|---|
| IWM(美國小型股) | 0.191 | 15.6 | 0.983 | 0.089 | 6% |
| QQQ(那斯達克) | 0.180 | 10.9 | 0.985 | 0.114 | 0% |
| 0050.TW(台股) | 0.122 | 10.7 | 0.965 | 0.078 | 0% |
| SPY(標普 500) | 0.117 | 8.1 | 0.974 | 0.124 | 0% |
| EEM(新興市場) | 0.110 | 8.7 | 0.939 | 0.091 | 6% |
| BTC-USD(比特幣) | 0.069 | 7.9 | 0.963 | 0.100 | 14% |
| SLV(白銀) | 0.019 | 5.5 | 0.988 | -0.022 | 86% |
| TLT(長天期公債) | 0.014 | 2.6 | 0.983 | 0.010 | 53% |
| GLD(黃金) | -0.036 | -3.3 | 0.931 | -0.006 | 75% |
幾個值得停下來想的點:
第一,主流股票指數的槓桿效果非常穩定 。IWM、QQQ、SPY、0050.TW 的 γ 全部達顯著水準,而且滾動視窗中 幾乎沒有任何一個季度 γ 翻為負值 (IWM 6%、QQQ 0%、SPY 0%、0050.TW 0%)。這代表在過去九年的每一個兩年視窗裡,這些股票指數一致呈現「壞消息更會推高波動」的型態。GJR 框架在這裡完全站得住腳。
第二,黃金完全相反 。GLD 的全樣本 γ 是 -0.036 ,統計強度 -3.3——也就是「壞消息(黃金大跌)反而會比好消息(黃金大漲)更小幅度地推升下一期波動」。換個角度說:黃金的「上漲日」反而比「下跌日」帶來更多隔日波動。這個結果並不孤單:滾動視窗中 有 75% 的視窗 γ 為負 ,整體平均也是負的。這跟黃金的避險屬性有關,市場恐慌時資金湧入推高黃金價格,這個「上漲」本身就是高波動環境的訊號,而非降溫訊號。
第三,白銀和黃金不一樣 。SLV 全樣本 γ 雖然微正(0.019)且達顯著水準,但 滾動視窗中 86% 的視窗 γ 為負 ,滾動 γ 平均反而是 -0.022,HAC 統計強度 -3.0。換言之,白銀的「全樣本顯著正 γ」其實很大程度是 少數極端視窗的貢獻 ,整體歷史上 SLV 比較像「沒有槓桿效果,甚至偏向反向」。如果只看全樣本估計而不看穩健性,會被誤導。
第四,長天期公債和比特幣是「中間派」 。TLT 全樣本 γ 雖正但僅 0.014,統計強度 2.6 剛好擦邊;滾動 γ 53% 為負,基本上是「沒有清楚的方向」。BTC 全樣本 γ = 0.069,看起來顯著(統計強度 7.9),但滾動視窗有 14% 為負,標準差高達 0.12,是所有資產裡最高的,比特幣的不對稱性「存在但非常不穩定」,可能跟比特幣不同階段的微結構(散戶主導 vs 機構主導、交易所流動性變化)有關。
OOS:γ 顯著 ≠ GJR 預測會比較準
如果故事到這裡結束,我們可能會說:「主流股票指數有槓桿效果,所以用 GJR-GARCH 預測波動會比 GARCH 更準。」但 K902 的第二個關鍵設計就是把這個直覺 真的拉到樣本外去打分數 ,看 GJR 在實際預測上是否真的贏得了 GARCH。
OOS 設計:
- 每 63 個交易日(約一季)重新估計參數
- 衡量指標:QLIKE(資料來源:Patton 2011),對波動代理變數穩健的對齊指標
- 比較方法:兩模型差異的 Newey-West HAC 檢驗,採用嚴格統計檢驗門檻
下表是 6 個資產在兩段 OOS 上的結果(負值越小越好;ΔQLIKE% 為負代表 GJR 比 GARCH 改善):
| 資產 | 2023–2024 ΔQLIKE% | 兩模型比較顯著? | 通過嚴格門檻? | 2025 ΔQLIKE% | 兩模型比較顯著? | 通過嚴格門檻? |
|---|---|---|---|---|---|---|
| SPY | -0.57% | 是 | 是 | -1.07% | 是 | 是 |
| QQQ | -0.12% | 否 | 否 | -1.07% | 是 | 否 |
| GLD | +0.18% | 否 | 否 | +0.05% | 否 | 否 |
| TLT | +0.35% | 否 | 否 | +0.31% | 是(GJR 較差) | 否 |
| EEM | -0.06% | 否 | 否 | -0.87% | 是 | 否 |
| BTC-USD | -0.08% | 否 | 否 | -0.05% | 否 | 否 |
這張表的訊息很尖銳:
只有 SPY 在兩段 OOS 上,GJR 都通過嚴格統計檢驗門檻 地優於 GARCH(2023–2024 改善 0.57%、2025 改善 1.07%)。其他所有資產,要不就是達顯著水準但通不過嚴格門檻,要不根本沒有顯著差異。 全樣本 γ 顯著的資產(QQQ、IWM 沒列入但在表 1 強顯著、EEM、BTC、0050.TW),到了 OOS 上 GJR 並沒有穩定贏 GARCH 。
這帶出兩個重要的實務警訊:
第一,「全樣本參數顯著」 ≠ 「OOS 預測會贏」 。QQQ 全樣本 γ = 0.180,統計強度 10.9,是表 1 中第二強的,但在 2023–2024 的 OOS 上 ΔQLIKE 只有 -0.12%,根本不顯著。這提醒我們:用「歷史擬合」結果推銷一個模型,跟它「未來會多準」是兩件事,必須分開檢驗。
第二,TLT 的 2025 結果反過來:GJR 比 GARCH 差 0.31% 且達顯著水準 。長天期公債在 2025 年降息週期裡的表現,GJR 模型的不對稱性可能反而是個雜訊源,「壞消息推升波動」的故事在利率敏感資產上不一定適用,硬把它套上去反而吃 OOS 表現。
為什麼會這樣?三個解讀
K902 的結果並不是要否定 GJR-GARCH 或槓桿效果,主流股票指數上它確實穩定存在。但這個實驗誠實地呈現了一個事實: 槓桿效果是「資產類別決定的」,不是「金融市場通則」 。
可能的解釋:
-
股票的槓桿效果有結構性原因 。股票本質上是公司的剩餘求償權,下跌會放大相對負債的槓桿,這是會計恆等式層面的機制。對指數型 ETF(SPY、QQQ、IWM、0050.TW),這個機制透過成分股加總後仍然清晰。
-
避險資產的反向不對稱來自需求結構 。黃金在市場恐慌時被追捧、價格上漲,這個「上漲」本身嵌入了高波動期的訊號。長天期公債則在「降息預期 → 殖利率下行 → 公債漲」的環境裡,「上漲」也常伴隨對未來路徑的不確定。
-
比特幣與白銀的不穩定 γ 反映微結構演化 。白銀同時兼具工業金屬與避險屬性,兩種驅動力此消彼長導致 γ 在不同視窗反向;比特幣則是市場成熟度本身在這九年內劇烈變化(2017 的散戶 vs 2024 的 ETF 機構流),單一靜態模型很難穩定捕捉。
對讀者的三個實用結論
-
看到「某模型顯著」要追問三件事 :是全樣本擬合還是 OOS?是放寬統計門檻還是嚴格門檻?是單一資產還是跨資產一致?K902 提醒我們,三道關卡能同時通過的資產其實很少。
-
挑模型要先看資產類別 。在 SPY 之類主流股指上用 GJR-GARCH 是合理選擇;但用同一個模型直接套黃金或長天期公債,可能不只沒幫助、還會讓 OOS 預測變差。
-
滾動視窗穩健性比點估計更重要 。SLV 全樣本 γ 顯著為正、但 86% 的滾動視窗 γ 為負,這種反差是 K902 看見、但只看全樣本表會錯過的。任何聲稱「資產 X 有 Y 性質」的研究,問一句「滾動視窗看起來怎樣」是基本動作。
待延伸方向
- 跨市場比較需要相同精修標準 (K1216c 的教訓也適用此處):未來把 K902 擴到更多新興市場 ETF 時,要確保所有 γ 估計用的是相同 multi-start 與穩健化流程,避免不同精修水準造成假性差異。
- OOS 樣本要能涵蓋空頭年份 :2023–2024 與 2025 年都不是典型空頭,未來補上 2018Q4、2020Q1、2022 整年的 OOS,能更完整測試 GJR 在「壞消息事件叢集」期間是否真有預測優勢。
- 加入波動率代理改良 :QLIKE 對代理變數穩健,但 5 分鐘已實現波動的代理會比日報酬平方更精準,可能讓兩模型比較檢定的解析力提升。
資料來源
- 日線資料:yfinance(SPY、QQQ、IWM、EEM、GLD、TLT、SLV、BTC-USD、0050.TW),2017-01-03 至 2025-12-31
- 樣本數:股票/ETF 2,187–2,262 觀測值;BTC 3,287 觀測值
- 模型實作:自定 GJR-GARCH(1,1) MLE + 數值 Hessian
- 評估指標:QLIKE(Patton 2011),兩模型比較檢定 Newey-West HAC,採用嚴格統計檢驗門檻
- 完整實驗檔案:
experiments/k902/(K902)
參考文獻
- Glosten, L. R., Jagannathan, R., & Runkle, D. E. (1993). On the relation between the expected value and the volatility of the nominal excess return on stocks. Journal of Finance, 48(5).
- Patton, A. J. (2011). Volatility forecast comparison using imperfect volatility proxies. Journal of Econometrics, 160(1).
- 嚴格統計, C. R., Liu, Y., & Zhu, H. (2016). … and the cross-section of expected returns. Review of Financial Studies, 29(1).
- Diebold, F. X., & Mariano, R. S. (1995). Comparing predictive accuracy. Journal of Business and Economic Statistics, 13(3).
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊