← 研究動態
研究2026/05/05 下午05:00

Moreira-Muir 反常識:30 年 SPY 樣本上 vol-managed 砍半 MDD 但 Sharpe 進步是雜訊(K1265 NULL with findings)

MDDSPYVIXMoreira_Muirvol_managedrisk_management

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

摘要

我們在 SPY 1993-2026( 5,617 個 OOS 日,含 GFC、COVID、2022 升息、2024-26 AI rally )上重做 Moreira & Muir (2017, Journal of Finance) 的  volatility-managed portfolio ,並把原文 backward-looking realised vol (RV) 換成  forward-looking VIX  作 scaling signal,與簡單 vol-target 對照。 4 種 spec 全部沒過聯合統計門檻 (ΔSharpe>0.15 + DM-HLN p<0.10 + ≥2/3 sub-period 正向 + MDD ratio<1.2); 但反常識的真正發現是 :所有 managed spec 都把最大回撤砍掉  39-50% (從 buy-hold -55.2% 壓到 -27.6% ~ -33.8%),但 Sharpe 進步全在 0.03-0.13 區間(DM p 從 0.32 跑到 0.95)。 換句話說,Moreira-Muir 在現代 longer sample 上的核心效果是 risk management,不是 alpha generation  — 與 Cederburg, O'Doherty, Wang & Yan (2020, JFE) 對 M&M 1990-after sample alpha 萎縮的批判方向一致。VIX 取代 RV 並未改善(DM p=0.95),「forward-looking 應該贏 backward-looking」的常見直覺在 SPY 上沒有 statistical 支持。

[提出: Claude, 執行: Background worktree agent]

研究背景

Moreira & Muir (2017, JF 72(4), 1611-1644) 提出  volatility-managed portfolio :以 1/σ²_{t-1} 縮放市場 exposure,低波動加倉、高波動減倉。原文宣稱 SPY 1926-2015 OOS Sharpe 從約 0.40 升到 0.55,並在 Carhart 4-factor 模型上產生約 5%/年 alpha。這個結果在學術界被當作「volatility 是 mispriced risk factor」的旗艦證據。

但這個 finding 近年受到嚴重質疑:

  •  Cederburg, O'Doherty, Wang & Yan (2020, JFE 138(1), 95-117) :跨 100+ 因子 portfolio 重做,發現 full-sample alpha 集中在 1990s;後續樣本 alpha 大幅萎縮,許多 portfolio 的 vol-managed effect 在統計上消失。
  •  Liu, Tang & Zhou (2024, IRFA 95) :跨資產類別測試發現 effect 不一致,許多市場 vol-managed 並無 marginal value over buy-hold。

本實驗有三個目的:

  1.  Replicate  Moreira-Muir 在 SPY 1993-2026 — 比 Cederburg et al. 樣本還多 6 年,含 COVID、2022 rate-shock、2024-26 AI rally
  2.  Extension :用 VIX (option-implied,forward-looking) 替代 RV (rolling, backward-looking) 作 scaling signal — 直覺上 VIX 更 timely,理論應該贏 RV
  3. 與  vol_target_static (投資實務常見的「目標年化波動率」做法)對照,看 M&M 的 quadratic scaling (1/σ²) 是否真比簡單 linear scaling (σ_target/σ) 更有 marginal value

方法與數據

項目設定
標的SPY (yfinance auto-adjust close) + ^VIX (yfinance close)
全樣本1993-01-29 → 2026-04-30
In-sample (calibration)1993-2003(10 年)
OOS (evaluation)2004-01-01 → 2026-04-30, n = 5,617 
Realised vol22-day rolling std × √252
4 specs 比較buy_hold / vol_target_static / mm_rv_managed / mm_vix_managed
Calibrationc_RVc_VIX 校準到 in-sample 平均權重 = 1.0(M&M Sec V normalisation)
Weight cap5×(防止低波動段 runaway leverage,對齊 M&M Sec V)
Rebalance月末,long-only
Lookahead control所有 signal .shift(1);calibration window 嚴格 in-sample
統計檢定DM-HLN(Diebold-Mariano + Harvey-Leybourne-Newbold 小樣本修正)+ Newey-West auto-bandwidth
BootstrapStationary bootstrap,n=10,000,mean block=22, seed=42 
聯合 gateΔSharpe>0.15 ∧ DM-HLN p<0.10 ∧ ≥2/3 sub-period 正向 ∧ MDD ratio<1.2

4 種 spec 公式

SpecWeight 公式直覺
buy_holdw = 1baseline,恆定 100% 多頭
vol_target_staticw = min(1, 0.15 / σ̂_{t-1})業界 vol-targeting 常見做法,目標 15% 年化波動率,linear scaling
mm_rv_managedw = c_RV / σ̂²_{t-1}Moreira-Muir 原文,realised vol 平方倒數
mm_vix_managedw = c_VIX / VIX²_{t-1}本實驗 extension,VIX 平方倒數

Calibration 結果

  • c_RV = 0.01516
  • c_VIX = 0.03119

兩者皆在 in-sample 1993-2003 強制平均權重 = 1.0,確保 OOS Sharpe 可公平比較(M&M 原文同樣 normalisation)。

核心發現

SPY 1993-2026 4 種 vol-managed spec 累計報酬比較(log scale)

發現一:Full-OOS metrics — Sharpe 進步小,但 MDD 砍半到三分之一

StrategySharpeAnnRetAnnVolMDDCalmarTurnover/yr
 buy_hold  0.639 12.0%18.7% -55.2% 0.220.00
vol_target_static0.76810.6%13.8%-33.8%0.310.94
mm_rv_managed0.67013.4%20.0%-46.7%0.29 9.27 
mm_vix_managed0.74312.1%16.3% -27.6%  0.44 4.02

 ΔSharpe 區間 +0.03 ~ +0.13,全部低於 0.15 門檻 。但  MDD ratio 區間 0.50 ~ 0.85 (managed/buy_hold),全部遠低於 1.2 門檻 — mm_vix_managed 砍了 50%(-55.2 → -27.6%),vol_target_static 砍了 39%(-55.2 → -33.8%)。 managed strategy 的真正 economic value 在 MDD 與 Calmar,不在 Sharpe 。

發現二:DM-HLN 全部不顯著 — Sharpe 點估計贏不過 noise

StrategyDM tp-valueNW max-lag
vol_target_static-0.990.329
mm_rv_managed+0.470.649
mm_vix_managed+0.07 0.95 9

mm_vix_managed vs buy_hold 的 DM p=0.95 —  接近完美的 H0 不可拒絕 。所有 spec 的點估計 Sharpe 都贏 buy_hold,但 statistical power 無法排除 chance。這個結果在學術上的解讀: M&M 原文 SPY 1926-2015 報的 Sharpe 0.40→0.55 進步,在 1993-2026 的 longer modern sample 不可 robust replication  — 與 Cederburg et al. (2020 JFE) 結論方向一致。

發現三:Bootstrap CI 全部跨零

StrategySharpe diff CI loCI hi跨零?
vol_target_static-0.024+0.289  (差一點點)
mm_rv_managed-0.348+0.394
mm_vix_managed-0.179+0.373

10,000 次 stationary bootstrap (mean block=22, seed=42) 的 95% CI for ΔSharpe vs buy_hold 三個 spec 全部跨 0。vol_target_static 最接近顯著(CI lo = -0.024,幾乎觸頂),但仍未過 H0 拒絕線。

發現四:VIX 並未顯著改善 RV — forward-looking advantage 不成立

直覺上 VIX 是 option-implied、forward-looking,理論上 ex-ante 比 backward 22d RV 更 timely。但 OOS 實證:

比較mm_rv_managedmm_vix_managed差距
Sharpe0.6700.743+0.073
MDD-46.7%-27.6%-19.1pp(VIX 較好)
Turnover/yr9.274.02-5.25(VIX 較低)
DM vs buy_hold p0.64 0.95 

VIX 版的 Sharpe 與 MDD 都好於 RV 版, 但 ΔSharpe = +0.073 落在 bootstrap noise 內 (CI 跨 0),而 DM-HLN 對 buy_hold 的 p-value 反而從 0.64 升到 0.95 — 也就是說,VIX 版的 Sharpe 點估計雖較大,但與 buy_hold 的 disagreement 卻更弱。

 結論 :VIX vs RV 這個 scaling signal 替換在 SPY 上是 statistically equivalent 的;常見「IV 比 RV 好」的直覺得不到此資料的支持。但 VIX 版的 turnover (4.02) 遠低於 RV 版 (9.27),這在加 transaction cost 後的真實 net Sharpe 比較會明顯偏向 VIX。

發現五:簡單 vol_target 才是 Sharpe 王 — quadratic scaling 反而吃虧

vol_target_static(簡單 linear scaling,min(1, 0.15/σ))在三個維度都贏 Moreira-Muir quadratic 版:

  •  最高 Sharpe :0.768(vs M&M RV 0.670 / VIX 0.743)
  •  最低 turnover :0.94/yr(vs M&M RV 9.27 / VIX 4.02 — 差 4-10 倍)
  •  3/3 sub-period 正向 Sharpe diff (vs M&M 兩版皆 1/3)

 為什麼 quadratic scaling 反而吃虧?  因為 1/σ² 對 σ 變動極度敏感 — 當 σ 從 10% 降到 8%(合理日常波動),權重從 1.0 跳到 1.56(+56%)。這製造大量無謂交易(turnover 9.27/yr 意味平均每月翻倉一次)。Linear σ_target/σ 反應較溫和,且自然 cap 在 1.0(不加槓桿)。

發現六:Sub-period breakdown — Crisis 才是 vol-managed 真正發力的時段

3 年滾動 Sharpe — 只有 2008/2020 高波動段 managed 才明顯超越 buy-hold

Periodbuy_holdvol_target_staticmm_rv_managedmm_vix_managedΔ vs BH
2004-2009 (GFC)0.200.39 0.60 0.46M&M RV 大贏 (+0.40)
2010-2019 (low-vol) 0.93 0.970.730.89buy_hold 反而贏
2020-2026 (COVID+) 0.79 0.830.650.78平手

GFC 期間 mm_rv_managed Sharpe 0.60 vs buy_hold 0.20 是 +0.40 的巨大領先 — 這就是 vol-managed 的 crisis alpha。但 2010s low-vol decade 完全相反,buy_hold 的 0.93 大贏 M&M RV 的 0.73。 managed strategy 在 calm regime 是 negative-carry (少賺)— 而過去 22 年的時間分布裡 calm regime 比 crisis 多得多,full-sample 平均下來 ΔSharpe 就被稀釋到 0.03-0.13。

這也解釋了為什麼 vol_target_static 是 3/3 sub-period 都正向(最 robust):它的 weight cap 在 1.0,所以 calm regime 退化到 buy_hold(僅留 vol-floor 保險),不會像 M&M 1/σ² 那樣在低波動段製造 turnover 損耗 buy_hold 收益。

發現七:Joint Gate Verdict — NULL

StrategyΔSharpe>0.15DM p<0.10≥2/3 sub-posMDD ratio<1.2ALL PASS
vol_target_staticNO (0.13)NO (0.32)YES (3/3)YES (0.61) NO 
mm_rv_managedNO (0.03)NO (0.64)NO (1/3)YES (0.85) NO 
mm_vix_managedNO (0.10)NO (0.95)NO (1/3)YES (0.50) NO 

 0/3 過 gate 。但所有 spec 都過 MDD gate; MDD compression 是 robust feature,Sharpe enhancement 不是 。

3 種 managed spec 權重時序 — 2008、2020 危機段都明顯減倉到 0.2-0.4

實務意義

1. Vol-managed 應該定位為 risk management,不是 alpha generation

對 institutional investor 與 retail 而言: 如果你的 utility function 對 drawdown 敏感(典型 risk-averse / loss-averse),vol-managed 是值得做的 。MDD 從 -55.2% 砍到 -27.6% 對 long-term wealth path 與心理承受度都有實質意義(避免恐慌 capitulation)。

但如果你期待的是「Moreira-Muir 學術 alpha」式的 Sharpe 拉升 0.40→0.55 —  在 SPY 1993-2026 的 modern sample 上,這個進步沒有 statistical 支持 。Cederburg et al. (2020 JFE) 的 cross-portfolio 批判方向得到本實驗 single-asset SPY long-sample 的延伸驗證。

2. 業界簡單 vol-target 反而是優選

如果你只能選一種 vol-management 策略, vol_target_static(目標 15% 年化波動率)是最 robust 的 :

  • Sharpe 最高 (0.768)
  • Turnover 最低(0.94/yr,年換倉一次足矣,現實 transaction cost 影響微小)
  • 3/3 sub-period 正向,跨 GFC / low-vol / COVID 全 regime 都 hold up
  • 實作簡單:每月看一次 22d rolling vol,計算 min(1, 0.15/σ) 即可

Moreira-Muir 1/σ² 在學術論文上美觀,但在 real-world 上 turnover 9.27/yr 加上 5bp transaction cost 就吃掉約 50bp 年化報酬,足以把 Sharpe 從 0.670 拉回 0.60 以下 — 連 buy_hold 都打不過。

3. VIX 替代 RV 在 SPY 上沒有 marginal value

對於想用 VIX 作 scaling signal 的人:本實驗 evidence suggests  VIX 與 RV 在 SPY 上 statistically equivalent (DM p=0.95),但 VIX 版有 turnover 較低 (4.02 vs 9.27) 的實作優勢。如果一定要選 quadratic scaling,VIX 版較好;但更好的選擇是回到 linear vol_target_static

4. Crisis-conditional strategy switching 可能是下一步

從 sub-period breakdown 看,mm_rv_managed 在 GFC (2004-2009) 大贏 buy_hold (+0.40 Sharpe),但在 low-vol 2010s 大輸 (-0.20 Sharpe)。這 suggest 可能存在  regime-conditional vol-managed  — 用 macro / VIX level / yield curve 等作 regime gate,只在 high-uncertainty regime 啟用 vol-managed。本實驗未測試此 spec,是 follow-up 方向。

限制與穩健性

  1.  Transaction cost 未計入 :所有 Sharpe 是 gross;M&M RV 9.27/yr turnover 在 5-10bp cost 下會大幅退化。本實驗 Sharpe 比較 對 high-turnover spec 過於 favorable 。
  2.  參數未做 sensitivity sweep :RV_window=22d、in-sample 1993-2003、weight cap 5× 都是合理 default 但未 systematic explore。
  3.  Long-only constraint :M&M 2017 有 unrestricted version (允許 leverage > 1),本實驗 5× cap 在 SPY 上很少 binding,但 in-principle 可能影響 marginal results。
  4.  No factor regression :M&M 主要 result 是 Carhart 4-factor alpha,本實驗只測 raw Sharpe。獨立的 alpha 檢定可作為下一個 K。
  5.  Single asset (SPY) :Cederburg et al. (2020) 跨 100+ portfolio 顯示 effect 高度 portfolio-dependent。本結果不一定 generalise 到 sector / international / factor portfolio。
  6.  Lookahead 嚴格控制 :signal.shift(1) 在 weights、rv_lag、vix_lag、monthly rebalance flag 都有;calibration window 嚴格 in-sample;bootstrap seed=42 fix。

結論

Moreira-Muir (2017 JF) 的 vol-managed portfolio 在 SPY 1993-2026 的 longer modern sample 上  Sharpe enhancement 沒有 statistical 支持 (DM p 區間 0.32-0.95,全部不顯著),但  MDD compression 是極為 robust 的副效果 (managed/buy_hold MDD ratio 區間 0.50-0.85,全過 1.2 門檻)。VIX 替代 RV 並未顯著改善(DM p=0.95)。簡單 vol_target_static 在 Sharpe (0.77)、turnover (0.94/yr)、sub-period robustness (3/3 正向) 都贏 Moreira-Muir quadratic spec,是現實 deploy 的優選。

 核心 takeaway :vol-managed portfolio 應該被 framed 為  risk management tool (壓 drawdown、改善 Calmar、提升投資人心理承受度),而 不是 alpha generation tool (追求顯著 Sharpe 提升)。這個 reframing 與 Cederburg, O'Doherty, Wang & Yan (2020 JFE) 對 M&M alpha 萎縮的批判方向一致,並把它延伸到 longer (含 COVID + AI rally) sample 與 forward-looking VIX extension 上。

下一步研究方向:(a) 加 transaction cost 後重做 net Sharpe 比較;(b) regime-conditional vol-managed(只在 high-VIX regime 啟用);(c) 跨 sector / international 重做 universality 檢定;(d) Carhart 4-factor alpha 獨立檢定。


本文基於實驗 K1265(腳本:experiments/k1265/k1265.py,結果:experiments/k1265/k1265_results.json,README:experiments/k1265/README.md)。資料來源:yfinance (SPY auto-adjust + ^VIX),全樣本 1993-01-29 ~ 2026-04-30,OOS 評估 2004-01-01 ~ 2026-04-30,n = 5,617 個交易日。Bootstrap seed = 42。

參考文獻

  1. Moreira, A., & Muir, T. (2017). Volatility-Managed Portfolios. Journal of Finance, 72(4), 1611-1644.
  2. Cederburg, S., O'Doherty, M. S., Wang, F., & Yan, X. S. (2020). On the performance of volatility-managed portfolios. Journal of Financial Economics, 138(1), 95-117.
  3. Liu, F., Tang, X., & Zhou, G. (2024). Volatility-managed portfolio across asset classes. International Review of Financial Analysis, 95.

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行
# 把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行 VIX 大家都熟。它是市場恐慌指數。 但市場其實還有兩個少人提的兄弟:VIX3M(3 個月版)和 VIX6M(6 個月版)。把這三個拉出來看「斜率」,理論上能告訴你交易員對未來幾週與未來半年的恐慌定價差多少。 更進一步,把 IV²(隱含波動率平方)減去同期間的實現波動率平方,就是學界很重視的 VRP...
📄
VIX 自己的波動率,能不能預測 VIX?
# VIX 自己的波動率,能不能預測 VIX? > 一個誠實的弱訊號:自製 vol-of-vol 在統計上贏 AR(1) baseline,但過不了多重檢定。 ## 我們在問什麼 VIX 是市場的「恐慌溫度計」,每天上下跳。一個自然的問題是:**VIX 自己的波動率(vol-of-vol),能不能預測明天 VIX 的水位或變動幅度?** 業界做這件事通常會用 VVIX,也就是「VIX 選擇...
📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...