跌的時候才算數:RS⁻ 跨 8 資產波動率預測力實測
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
跌的時候才算數:RS⁻ 跨 8 資產預測力測試
上漲 1% 和下跌 1%,對隔天波動率的影響一樣嗎?
金融學的標準模型很長一段時間都假設答案是「差不多」。但如果你觀察過股市,你會有直覺:同樣幅度的跌比漲更讓市場敏感。跌完隔天更容易劇烈震盪,漲完隔天通常就靜下來了。這個直覺有數字支撐嗎?
我們用這個問題跑了一個跨 8 個資產、橫跨 3 年樣本外的實驗。結果沒那麼簡單。
什麼是「下行半方差」?
方差是波動率最基本的衡量。把每天的報酬率平方加總,就得到已實現方差(RV)。
下行半方差(RS⁻)只算 負報酬那幾天 的平方和。跌的日子才進計算,漲的日子不算。
這個設計的邏輯很直接:如果市場對下跌和上漲的反應不對稱,那麼負報酬的歷史比總報酬更能預測隔天的劇烈波動。
1976 年,Fischer Black 就記錄過類似的現象,後來被稱為「槓桿效應」。股價跌時,公司的財務槓桿相對上升,股東風險增加,波動率隨之放大。這是 RS⁻ 理論上能有預測力的基礎。
8 個資產,從美股到比特幣
這個實驗涵蓋:
- SPY(美國大型股)
- QQQ(科技股)
- IWM(美國小型股)
- EEM(新興市場)
- XLE(能源類股)
- TLT(長期美債)
- BTC-USD(比特幣)
- 0050.TW(台灣 50)
樣本外評估期間:2023 年 1 月到 2025 年 12 月,股票類資產各 752 個交易日,比特幣因為全年交易包含更多天,共 1096 天,台灣 50 為 724 天。
三個模型互相比較:
- M1 :只用過去 21 天的已實現方差預測
- M2 :只用過去 21 天的 RS⁻(下行半方差)
- M3 (HAR-semi):同時放入短期(5 天)和中期(21 天)的上行/下行半方差,四個變數一起預測
數字說話
| 資產 | 類型 | M3 樣本外 R² | M2 vs M1 DM 檢定 p 值 | 5% 顯著 |
|---|---|---|---|---|
| SPY | 美國大型股 | 0.153 | 0.007 | 是 |
| QQQ | 科技股 | 0.117 | 0.004 | 是 |
| IWM | 美國小型股 | 0.040 | 0.046 | 是 |
| EEM | 新興市場 | -0.058 | <0.001 | 是 |
| XLE | 能源類股 | 0.054 | 0.303 | 否 |
| TLT | 長期美債 | 0.045 | 0.669 | 否 |
| BTC-USD | 比特幣 | -0.011 | <0.001 | 是 |
| 0050.TW | 台灣 50 | -0.001 | 0.007 | 是 |
什麼有用,什麼假有用
SPY 和 QQQ:確實有預測力
SPY 的 M3 在樣本外 R² 達到 15.3%,QQQ 是 11.7%。這是相當實質的數字。對波動率預測來說,樣本外 R² 超過 10% 算是少見的。
DM 檢定 p 值分別是 0.007 和 0.004,這表示用 RS⁻ 取代普通方差,預測誤差的改善有統計意義,不只是湊巧。這個結論用了 10000 次 block bootstrap 驗證,排除了時間序列自相關的干擾。
GJR-GARCH 模型估計出 SPY 的不對稱係數(γ = 0.241),QQQ 是 0.205。兩者都高度顯著,t 統計量超過 8。這個不對稱係數量的是「跌和漲對未來波動率的影響差距」。差距越大,下行半方差理論上越有用。SPY 的 γ 是 8 個資產裡最高的,這和它的預測效果最好是吻合的。
EEM、BTC、0050:DM 顯著,但 R² 是負的
EEM(新興市場)的 DM 檢定 p 值幾乎是 0(< 0.001),統計上非常顯著。但 M3 的樣本外 R² 是 -0.058,負的。
這個組合讓人困惑,但背後有明確的解讀:M3 確實比 M1 預測誤差更小(DM 顯著),但兩者在樣本外都輸給了用樣本平均值直接預測的笨方法。R²OOS 為負,代表任何模型都沒辦法打敗「猜平均值」這個基準。
這是 in-sample 看起來有用、OOS 完全失靈的典型模式,是模型過度配適訓練資料的信號,不是真實預測力。
比特幣的情況類似,R²OOS = -0.011,且 DM 檢定是負方向顯著(M2 比 M1 更差 )。RS⁻ 在比特幣上不但沒幫助,還拖累了預測。比特幣的 γ = -0.012(不顯著),槓桿效應在這裡根本沒有統計上的存在。
台灣 0050 的結果也相似。RS⁻ 在台股指數 ETF 上沒有增量預測力。
XLE 和 TLT:沒有顯著性,也沒有效果
XLE(能源)DM p 值 0.303,TLT(長期美債)是 0.669。兩者都無法拒絕「M2 和 M1 一樣差」的虛無假說。這是真正的零結果,RS⁻ 在這兩類資產上就是沒用。
多重檢定之後剩什麼
8 個資產,表面上有 5 個在某個規格上達到 5% 顯著。但 8 個同時測試,這個數字得打折。
這個實驗採用 Harvey et al.(2016)的多重比較校正,門檻設在 t 統計量 3.0。嚴格標準下,只有 EEM 在 M2 vs M1 的比較中通過(DM 統計量 5.14),但 EEM 的 R²OOS 是負的,代表通過多重比較門檻的那個資產,實際預測效果是壞的。
8 個資產裡,真正同時滿足「預測力顯著」且「樣本外 R² 為正」的,主要是 SPY 和 QQQ。
RS⁻ 的預測力高度集中在大型股指 ETF。對債券、能源、加密、部分新興市場,效果要麼不存在、要麼 OOS 失靈。
為什麼大型股指 ETF 特別有用?
最合理的解釋圍繞槓桿效應的強度。
SPY 和 QQQ 的成份股以高市值公司為主,負債比例和市場流動性都受到密集追蹤。股價下跌時,財務槓桿上升的信號傳導很快,機構投資人立刻調整風險敞口,波動率的放大效應非常清晰。這讓過去負報酬對未來波動有可量化的預測力。
能源類股(XLE)本身波動極大,油價的外生衝擊常蓋過槓桿效應。長期美債(TLT)的波動受利率政策驅動,下行半方差抓的是股票結構,套到債券上信號就失真了。比特幣的波動受市場情緒和流動性驅動,槓桿效應的邏輯在這類資產上幾乎不存在。
台灣 0050 的結果另有一個可能的解釋:台股週期性受到外資進出和匯率的驅動,短中期下行半方差抓不到這些驅動力。
不對稱係數越強,預測力越好
實驗同時估算了所有 8 個資產的 GJR-GARCH 不對稱係數 γ,這個係數衡量的是「跌的衝擊比漲的衝擊對未來波動的放大程度」。
跨 8 個資產來看,Pearson 相關係數達到 0.81(p = 0.014)。γ 越大的資產,用 RS⁻ 換掉普通方差的 R² 改善幅度就越大。
SPY γ = 0.241,預測改善最大;QQQ γ = 0.205,其次。TLT γ = -0.014(不顯著),預測改善幾乎是零。BTC γ = -0.012(不顯著),RS⁻ 甚至讓預測變差。
這個跨資產規律說的是: RS⁻ 的用武之地,就是「跌比漲更傷」的資產 。測不到不對稱性的地方,分開算下行半方差毫無意義。
實務上能用什麼
可以用的地方 :如果你在追蹤 SPY 或 QQQ 的波動率,把過去 21 天的 RS⁻ 納入預測模型有統計意義。15% 的樣本外 R² 不是能讓你算牌的牌面,但對波動率交易策略或動態槓桿調整是有參考價值的。
不能過度延伸的地方 :這個結果對 XLE、TLT、BTC 沒有外推的基礎。新興市場(EEM)表面上顯著,但 OOS 效果為負,不能當成預測工具用。台灣 0050 的結果很清楚,RS⁻ 在台股指數上不比普通方差有用。
更大的警示 :即使 SPY/QQQ 的結果看起來穩健,多重比較校正後,整體結論並不強。如果你要把 RS⁻ 寫進策略,只限定在美國大型股這個條件,不要試圖跨資產推廣。
這個實驗告訴我們什麼
8 個資產裡,RS⁻ 有真實預測力的是美國大型股指 ETF。科技股、能源、債券、加密貨幣、台股指數,要麼完全沒效果,要麼 OOS 失靈。
這不是一個「下行半方差是好工具」的故事,也不是「下行半方差沒用」的結論。它是一個「工具和資產要配對」的提醒。槓桿效應在哪裡最強,RS⁻ 的預測力就在哪裡。
你的資產池裡有多少個 SPY,這個指標就有多少用。
資料來源:yfinance,2023–2025 年樣本外資料。 實驗代號:K453(Daily Semivariance Cross-Asset Validation)
延伸閱讀
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊