← Research Feed
研究2026/05/25 上午09:07

黃金永遠該配 50%?四套動態策略全 null

OOS驗證回測資產配置風險預算黃金配置動態策略統計檢定

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

黃金永遠該配 50%?四套動態策略全 null

故事的起點:50/50 之外,還能更好嗎?

在我們先前的研究系列裡, SPY/GLD 50/50 + 12/VIX 槓桿覆寫 這套組合已經被反覆驗證為強健的長期配置基底(K2、K64、K252、K275 等多個實驗都指向同一結論;K301 也提出過 Claim 3 的進一步穩健性宣稱)。但 50/50 這個比例本身有一個顯而易見的疑問:黃金真的應該永遠維持 50%嗎?

直覺上似乎有很多可以動手腳的空間。黃金有牛熊週期、與股票的相關性會隨體制變動、實質利率與通膨會影響黃金的避險功能、波動率也會隨時間變化。如果我們能根據市場「狀態」動態調整 SPY 與 GLD 的權重,理應能得到比僵硬的 50/50 更好的成績,這幾乎是動態配置文獻的共同假設。

K557 就是要正面測試這個假設。我們設計了 四套截然不同的動態策略 ,跨越 21 年的資料、5 段獨立 OOS 期間、兩模型比較顯著 檢定、bootstrap 信賴區間與交易成本敏感度分析全部都跑過。結論是讀者大概已經猜到的方向: 沒有任何一套動態策略能顯著擊敗 50/50 基準 。

這篇文章要把為什麼會這樣、以及這個 null result 對配置實務的啟示講清楚。

四套動態策略 vs 50/50 + 12/VIX

我們先把參賽者列出來。基準是大家熟悉的  Static 50/50 SPY/GLD 加上 12/VIX 槓桿覆寫 ——一個不擇時、不挑體制、只靠 VIX 自動調整總曝險的簡單規則。

四套對手如下:

  1.  Gold Trend (MA200) :當 GLD 收盤價站上 200 日均線時加碼黃金,跌破時減碼。經典趨勢追蹤邏輯。
  2.  Gold Momentum (12m) :以 GLD 過去 12 個月報酬正負作為進出黃金的訊號。Asness 等人在多資產動量文獻裡反覆驗證過的形式。
  3.  Counter-cyclical :與 Gold Trend 相反邏輯,黃金弱勢時加碼,強勢時減碼。逆勢投資的代表。
  4.  Risk Budget (inv-vol) :依 SPY 與 GLD 各自的近期波動率反向加權,讓兩邊風險貢獻相等。風險平價(risk parity)的精簡版。

另外我們還加入一套  Real Gold Trend (GLD/TIP)  作為 robustness 補強,用 GLD/TIP 比率(剔除通膨後的「實質黃金」訊號)取代名目價格趨勢。

 重要的訊號時序設定 :所有動態策略都嚴格用  t-1 期的體制訊號決定 t 期的權重 。也就是今天的趨勢狀態、動量方向、波動率估計,全部都只能用昨天收盤前的資訊算出來,明天才能據此交易。這個 lag 是動態策略誠實回測的鐵律,沒做就會有 lookahead,數字會虛高。我們的腳本對每一套策略都明確 shift 了訊號,不會用「未來看現在」作弊。

全樣本:六匹馬幾乎跑在同一條線上

先看 2005-11-18 到 2026-03-26、整整 5118 個交易日的全樣本表現。

策略年化報酬年化波動Sharpe最大回撤DM t vs 50/50DM p
Static 50/5011.49%8.63%1.331-17.7%
Gold Trend (MA200)11.60%8.67%1.339-15.8%0.330.74
Gold Momentum (12m)10.55%8.78%1.201-20.6%-0.080.94
Counter-cyclical11.60%8.67%1.339-15.8%0.330.74
Risk Budget (inv-vol)11.54%8.09%1.427-17.8%0.140.89
Real Gold Trend (GLD/TIP)11.62%8.75%1.327-14.5%0.370.71

幾個立即可見的事實:

  •  Sharpe 差距小到肉眼可見 :四套動態策略的 Sharpe 落在 1.20-1.43 之間,50/50 是 1.33,誰都沒贏太多。
  •  DM 檢定 p 值全部 ≥ 0.71 :兩模型比較顯著 配對檢定衡量平均報酬差異的統計顯著性。達顯著水準(顯著性 0.71) 意思是「即便兩個策略真的一樣,也有 71% 機率出現至少這麼大的差距」,換言之, 完全看不出顯著差異 。
  •  Risk Budget Sharpe 看起來最高(1.43) ,但 統計強度 只有 0.14,這個微弱優勢完全在抽樣誤差範圍內。
  •  Counter-cyclical 與 Gold Trend 的數字一字不差 :因為兩套策略的訊號邏輯互為相反,但在我們的 binary 體制定義下,它們在大多數時點上其實切換到同一個權重狀態,導致回測軌跡幾乎重疊。這本身就是個有趣的觀察,如果連「順勢」與「逆勢」兩個邏輯相反的策略都跑出一樣的結果,代表訊號本身根本沒提供太多 actionable 資訊。

Cross-OOS:5 段獨立期間,沒有任何策略一致勝出

全樣本沒差異還不夠,我們還做了  5 段獨立 OOS 驗證 :GFC 復甦(2008-2010)、黃金高峰熊市(2011-2013)、黃金熊市底部(2014-2016)、黃金復甦(2017-2019)、COVID 與通膨(2020-2022)。每段都是 3 年,涵蓋黃金生命週期的所有階段。

每套策略對 50/50 的 Sharpe 差異:

策略平均 Sharpe 差5 段中勝場統計強度p 值嚴格統計 通過
Gold Trend (MA200)+0.0113/50.170.87
Gold Momentum (12m)-0.0272/5-0.080.94
Counter-cyclical+0.0113/50.170.87
Risk Budget (inv-vol)+0.0773/51.300.26
Real Gold Trend (GLD/TIP)-0.0042/5-0.040.97

 沒有一套策略通過 嚴格統計 (2016) 主張的 t > 3.0 嚴格門檻 。Risk Budget 在這裡表現最相對突出(5 段全是正差距比例最高、平均差 +0.077),但 統計強度 1.30、達顯著水準(顯著性 0.26),仍距離常規顯著(達顯著水準(顯著性低於 0.05))有一段距離,更別說 嚴格統計 對 multiple-testing 修正後要求的 t>3.0。

更重要的是看  個別 OOS 期間的差異波動 。Gold Momentum 是個極端例子:在 OOS1(GFC + 復甦)的 Sharpe 差距高達 +0.93,但 OOS3(黃金熊市底部)卻是 -0.72、OOS4(黃金復甦)是 -0.76。也就是說,這套策略在不同體制下的勝負訊號完全相反,它 並不是「平均贏一點」,而是「有時大贏有時大輸」 。對配置者而言,後者反而更危險,因為你永遠不知道下一段時間會落在哪一邊。

Bootstrap 信賴區間:0 永遠在裡面

Cross-OOS 的「總平均 統計強度」可能被某一段極端值帶偏,所以我們再跑了 10,000 次 block bootstrap,產生每套動態策略對 50/50 的 Sharpe 差異信賴區間:

策略平均 Sharpe 差95% CI 下界95% CI 上界0 在 CI 內?
Gold Trend (MA200)+0.074-0.359+0.514
Gold Momentum (12m)-0.014-0.459+0.432
Counter-cyclical+0.074-0.362+0.507
Risk Budget (inv-vol)+0.032-0.408+0.470
Real Gold Trend (GLD/TIP)+0.081-0.354+0.509

每一條 95% 信賴區間都把 0 含在裡面,且區間寬度普遍超過 ±0.4。換句話說,bootstrap 重抽樣 10,000 次後,我們 沒有 95% 把握說任何一套動態策略真的優於或劣於 50/50 ——差距可能是真的有一點優勢,也可能完全是運氣,資料沒辦法分辨。

體制分析:黃金牛市/熊市分開看也救不回來

也許動態策略只在黃金某種特定體制下有效?我們把樣本切成 GLD 牛市(站上 200 日均線、約 13.94 年)與熊市(跌破 200 日均線、約 6.37 年)兩段:

 Gold Bull (黃金牛市):50/50 Sharpe 1.474,動態策略落在 1.32-1.55 區間,差距微小。  Gold Bear (黃金熊市):50/50 Sharpe 1.033,Risk Budget 是唯一明顯較高的(1.181),其他動態策略 0.93-0.97 反而 輸給  50/50。

這說明動態策略並沒有「在某一個體制裡發光」的故事可以講。

交易成本:每多動一次都是扣分

回測還沒考慮的事情是:動態策略每一次切換權重都要付交易成本。50/50 不再平衡的話 turnover 是 0,動態策略則普遍每天 turnover 0.45%-0.62%。

策略0bps5bps10bps20bps50bps
Static 50/501.331.331.331.331.33
Gold Trend / Counter-cyclical1.331.321.301.261.15
Risk Budget (inv-vol)1.421.411.391.371.28

Risk Budget 在 50bps 成本下 Sharpe 從 1.42 掉到 1.28, 而 50/50 始終是 1.33 不動 。在 ETF 實務中,散戶交易 SPY/GLD 來回成本約 5-10bps,機構更低;但若考慮稅、bid-ask spread、滑點與資金管理摩擦,10-20bps 是合理的保守估計。在這個範圍內,動態策略相對 50/50 的「改善」進一步被磨平。

為什麼動態策略全 null?三個可能解釋

 第一,50/50 本身已經偏離很多人想像的「靜態僵硬」 。它每天的權重的確是 50/50,但因為價格波動,它在 SPY 表現好時會自然把比重抬高(暫時類似順勢),熊市時 GLD 上漲又會自然把黃金比重抬高(暫時類似避險加碼)。再平衡頻率(這裡是月再平衡)介入時又會自然「賣掉漲多的、買進跌深的」(內建逆勢)。許多動態策略想做的事,50/50 在沒有任何訊號的情況下已經自動部分完成。

 第二,黃金本身的訊號雜訊比偏低 。黃金價格驅動因子複雜,實質利率、美元、通膨預期、避險需求、央行買盤,任何單一指標(200 日均線、12 個月動量、GLD/TIP 比率)都只能捕捉其中一部分。Cross-OOS 的高方差(個別期間 Sharpe 差異從 -0.76 到 +0.93)正是訊號低訊噪比的特徵。

 第三,與已有研究一致 。Baur 與 McDermott (2010, JBF) 與 Reboredo (2013, RIBAF) 等文獻早已指出黃金的避險與安全資產角色具有強烈的時變性,但時變的方向經常難以事前預測。我們先前的 K507(動態 SPY/GLD 相關性配置)與 K204(GLD 動量 VT)也都得到類似的微弱或不顯著結果。

對讀者的實務啟示

如果你是個人投資者,K557 給你的訊息很直接: 不要為了「動態調整」而動態調整 。在這個資產對(SPY/GLD)、這套基準(加上 12/VIX 槓桿)下,動態策略要在 21 年資料、5 段獨立 OOS、加上 bootstrap 與交易成本驗證後仍然壓倒 50/50,門檻極高。我們測的四套常見邏輯沒有一套通過。

當然,這不代表「所有動態配置都沒用」,我們只測了 SPY/GLD 這個對、只用了 4 種訊號、benchmark 是強健的 50/50 + 12/VIX。如果換成股債或多資產組合、用更精細的條件變數(如實質利率、CPI 突發、央行政策)、或允許槓桿擇時,結論可能不同。但 對於只想配置 SPY 與 GLD 的讀者,「黃金永遠 50%」目前仍是最難被推翻的選擇 。

Null result 看起來不性感,但它對配置決策的價值跟 positive result 是對等的,它告訴你哪裡不必再花力氣,可以把研究預算投到別處。

資料來源

  •  K557 :本實驗完整回測腳本與結果在 experiments/k557/,分析期間 2005-11-18 至 2026-03-26 共 5118 個交易日;OOS 切分 2008-2010 / 2011-2013 / 2014-2016 / 2017-2019 / 2020-2022 五段。
  •  價格資料 :SPY、GLD、TIP、^VIX 來自 yfinance(GLD 自 2004-11-18 上市起可得,限制了更早期樣本)。
  •  相關 K :K2、K64、K252、K275(50/50 SPY/GLD + 12/VIX 基準系列);K301 Claim 3(基準穩健性宣稱);K507(動態 SPY/GLD 相關性配置);K204(GLD 動量 VT)。
  •  方法論文獻 :Baur & McDermott (2010, JBF) 黃金避險角色;Reboredo (2013, RIBAF) 黃金與油價避險;Diebold & Mariano (1995) 配對預測檢定;嚴格統計 (2016) multiple-testing 顯著性門檻。

限制與未來方向

K557 的限制如預期:GLD 上市時間限制了 pre-2005 樣本;TIP 作為通膨代理並不完美;交易成本是估計值;體制分類採二元(MA200 上下)方式,真實體制更為連續模糊;12/VIX 槓桿覆寫本身有體制依賴性,本研究未拆解其貢獻。後續可探索方向包括:條件變數從技術指標換為基本面(實質利率、TIPS 利差、ETF 流向)、提高體制粒度(HMM 或閾值模型)、或測試其他資產對(SPY/TLT、QQQ/GLD、跨國股債)。

圖表

K557 動態黃金配置:全期間風險調整後報酬與最大回撤

跨 5 個 OOS 期間:四種動態策略 vs Static 50/50

DM 比較檢定:四種動態 vs 50/50(無一達嚴格門檻)

詳情

audience
research
experiment_refs
K557
audience_backfill
{"reason":"validator_371_historical_backfill","script":"scripts/backfill_audience.py","applied_at":"2026-05-26T16:21:47+00:00","article_id":"mile_be32d58a","previous_audience":"general"}

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
SPY 暴跌會「成串出現」嗎?條件式風險模型的真實答卷
## 為什麼這個問題重要 買股票的人最怕什麼?多數人會說「黑天鵝」、「閃崩」,但若你問風險經理或基金經理人,答案會稍微不同——他們真正怕的是「**虧損會不會成串出現**」。今天跌一根大棒,明天再跌一根,後天又跌一根,連續性的尾端事件比單一極端日更傷人,因為它會在你還來不及反應時把資本耗光。 這個現象在統計上有個名字:**VaR breach clustering**(風險值違規叢聚)。VaR(...
📄
風險模型的金本位:用 FZ 聯合分數重新檢驗 VaR/ES
# 風險模型的金本位:用 FZ 聯合分數重新檢驗 VaR/ES ## 一個比「準不準」更難的問題 當銀行、基金、自營商在計算風險的時候,有兩個數字幾乎人人會講: - **VaR(Value-at-Risk,風險值)**:在 95% 或 99% 信心水準下,明天最壞的虧損大概會是多少。 - **ES(Expected Shortfall,預期損失)**:如果真的踩進那 1% 或 5% 的尾部,...
📄
換 ETF 結果還一樣嗎?50/50 股金組合的 ETF 替代穩健性
# 換 ETF 結果還一樣嗎?50/50 股金組合的 ETF 替代穩健性 ## 為什麼這個檢驗很重要 在投資組合研究領域,最容易被忽略也最容易踩坑的,是「結果是否依賴於某個特定工具」。一個經典的例子:你做出了「美股 50%+黃金 50% 月度再平衡」的配置策略,並用 SPDR S&P 500 ETF(SPY)代表美股、用 SPDR Gold Shares(GLD)代表黃金,得到了不錯的風險調整...