← 研究動態
研究2026/05/02 上午05:00

Alt-data 在預測上失敗,那 allocation 上呢?K1121 給出同樣的答案 — Null

null-resultPaper4NFCIalt-dataEPUportfolio-allocation

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

摘要

[提出: Claude]

延續 K1116 / K1118 系列「alt-data 對 RV 預測一律 NULL」的發現,K1121 把同一組 alt-data(FRED EPU、NFCI、^VIX)轉換成  portfolio allocation signal ,配置 SPY+GLD 做 6-strategy horse race(S1 = 50/50 baseline、S2 = vol-target、S3 = NFCI 區間切換、S4 = EPU regime、S5 = NFCI regime、S6 = NFCI+EPU hybrid)。樣本 2019-01-15 至 2026-04-10、共 1,817 個交易日,stationary bootstrap (B=500) 與 Opdyke (2007) Sharpe inference 並用。 結論:5 種 alt-data spec 對 50/50 baseline 的 Sharpe 差全部 H0 無法拒絕 (p ∈ [0.264, 0.966],95% CI 全含零);Paper 4「alt-data null」compendium territory 從 forecasting 擴展到 allocation。

研究背景

K1116 在 SPY 上把 EPU、NFCI、STLFSI 加入 GJR-X 預測,QLIKE 不只沒贏 baseline 還反向劣化;K1118 把同樣 spec 推到 GLD / TLT / BTC 等跨資產也同樣 NULL,9/9 spec 全部 H0 無法拒絕(DM-HLN test)。在投資人實務上,下一個自然問題是: 就算 alt-data 不能改善 |forecasting error|,會不會在 regime detection 上有用? ——也就是把 alt-data 用做「該滿倉股、該防守、該避險」的開關,而不是一個 RV 點估計的輸入。

K1121 就是這個 pivot 的正式檢定。設計與既有 50/50 SPY/GLD 的 8 篇 replication moat(K2–K89)對齊:使用同樣的資產對、同樣的長期樣本期、同樣的 stationary bootstrap 抽樣方式,並排上 6 種 strategy spec 同一條 horse race。

方法與數據

項目設定
資產SPY, GLD(每日 close-to-close return)
Alt-dataFRED USEPUINDXD(EPU)、FRED NFCI、yfinance ^VIX
期間2019-01-15 ~ 2026-04-10(1,817 個交易日)
Lookahead 防護NFCI shift(5) 模擬 publication delay;EPU shift(2);VIX shift(1)
OOS 切點第 998 日(IS 997, OOS 820)
Sharpe inferencestationary bootstrap B=500,95% CI;Opdyke (2007) Δ Sharpe
Random seed42(全程 fixed)

策略 spec 摘要:

Strategy配置邏輯
S1固定 SPY 50% / GLD 50%(baseline,無 alt-data)
S2用 21 日 RV 做 vol-target(target ann vol = 12%)
S3NFCI 連續映射到 SPY weight [0.3, 0.7] 的線性切換
S4EPU 5-tier regime → 5 個離散 SPY weight
S5NFCI 5-tier regime → 5 個離散 SPY weight
S6hybrid: NFCI weight × EPU weight 取平均

對照下方 H1–H4 假設,這個設計同時測試了 alt-data  是否打贏 vol-target(H1) 、 是否打贏 50/50 baseline(H2) 、 是否在壓力期主動降股(H3) 、 hybrid 是否優於 single signal(H4) 。

核心發現

發現一:5 種 alt-data spec 對 50/50 baseline Δ Sharpe 全部 H0 無法拒絕

完整 full-sample headline 表:

StrategySharpe (full)Sharpe (OOS)MDDCalmarSortino平均 wSPY
S11.3091.975-0.2030.8881.6360.500
S21.0721.474-0.2200.7201.4170.880
S31.2101.748-0.1790.8831.5880.543
S41.2831.856-0.2320.7521.7090.566
S51.3121.656-0.1790.9501.7310.594
S61.3051.806-0.1840.9111.7340.568

stationary bootstrap (B=500) 對 S1 的 Δ Sharpe 與 95% CI:

比較obs Δ Sharpe95% CIbootstrap p
S2 vs S1-0.238[-0.670, +0.174]0.264
S3 vs S1-0.099[-0.344, +0.132]0.388
S4 vs S1-0.026[-0.310, +0.257]0.860
S5 vs S1+0.003[-0.231, +0.254]0.966
S6 vs S1-0.005[-0.191, +0.172]0.948

 5 條 CI 全部跨越零,5 個 p-value 全部 ≥ 0.264 。即便看起來最好的 S5(full-sample Sharpe 1.312 vs S1 1.309),bootstrap 後的 obs Δ 只有 +0.003,p=0.966 — 噪音水準。Harvey/Liu/Zhu (2016) Sharpe threshold(multiple-testing 後 |t| ≥ 3.0)門檻在這裡完全無關,因為連 single-test 顯著性都不成立。

K1121 Sharpe Δ 95% bootstrap CI

發現二:alt-data 沒打贏 vol-target,hybrid 也沒打贏 single

假設內容obs Δ Sharpebootstrap pPASS?
H1 coreS4 / S5 vs S2(alt-data > vol-target)+0.212 / +0.2410.280 / 0.166 FAIL 
H2 moatbest alt-data Sharpe ≥ S1S5 = 1.3122 vs S1 = 1.3094PASS(差 0.003,無實務意義)
H4 hybridS6 > max(S3, S4, S5)S6 = 1.3047 vs max = 1.3122 FAIL 

H2「PASS」是 trivially true(差 0.003),不可解讀為 alt-data 有用 — bootstrap 看就是噪音。H4 直接 FAIL:把兩個 signal 結合反而比 best single signal 略差,這跟 K1118b FX-IV 把多訊號組進 basket 反而拖累的型態一致。

發現三:壓力期 — H3 在 1/3 episode 部分 PASS,但無實務優勢

期間S1 wSPYS5 wSPYS5 reduce?S1 SharpeS5 Sharpe
COVID 2020 (Feb-Apr)0.5000.331YES-0.183+0.004
Rate Shock 2022 (Jan-Oct)0.5000.300YES-1.132-1.160
SVB 2023 (Mar-Apr)0.5000.513NO+5.491+2.837

S5 在 COVID 與 Rate Shock 確實有降股(H3 PASS in 2/3 episodes),但 換來的是與 S1 接近、甚至更差的壓力期 Sharpe :Rate Shock 2022 的 S5 Sharpe -1.160 比 S1 的 -1.132 還略差,COVID 2020 雖從 -0.183 拉回 +0.004 但金額微小(年化報酬 +0.13%)。SVB 2023 完全沒降股,S5 的 +2.837 甚至遠輸 S1 的 +5.491 — alt-data signal 在那次 idiosyncratic banking shock 上根本沒反應。

K1121 三段壓力期 Sharpe

換言之:「alt-data 主動降股」這個 H3 narrative 的部分 PASS 是 mechanical artifact(NFCI tiering 設計上會在金融壓力期把 wSPY 推低),但 降低後的風險調整報酬並沒有顯著優於 baseline 。50/50 在所有三段壓力期都表現得 at least as good,且免去 lookahead / spec / refit 的所有 model risk。

為何重要:Paper 4 compendium territory expand

Paper 4「Alt-data fails to predict realised volatility — a multi-asset compendium」的原 scope 是 forecasting null:9 spec × 4 asset 全部 NULL。K1121 把這個 null compendium 從 forecasting 擴展到  allocation :

  •  同 alt-data 來源 (EPU、NFCI、VIX)
  •  同 sample period family (2019-2026)
  •  同 statistical machinery (stationary bootstrap)
  •  同 baseline moat (50/50 SPY/GLD,K2–K89 8 篇 replication 已證 baseline 不可打敗)

5 種完全合理的 allocation spec 全部失靈,意味著 Paper 4 的核心訊息可以從「 alt-data 不能 forecast RV 」升級為「 alt-data 既不能 forecast RV,也不能取代 50/50 做 regime allocation 」。對讀者與審查者而言,這是 compendium territory 的一次顯著擴張:null result 不再侷限在 point forecast metric (QLIKE),而擴展到 portfolio-level 風險調整報酬(Sharpe、Sortino、Calmar、MDD)。

對實務投資人,啟示也更明確:別期待 EPU 指數或 NFCI 進入你的 allocation rule 會帶來顯著效用。50/50 的 K2–K89 moat 持續成立。

限制與穩健性

  1.  Lookahead 已防護 :NFCI shift(5) 對應 FRED 週發佈延遲、EPU shift(2) 對應日發佈延遲、VIX shift(1)。所有 signal 都使用 t-1 資訊產生 t 期 weight。
  2.  OOS 是 80/20 split, in-sample 997 / out-of-sample 820 :full-sample 與 OOS 結論一致(OOS S5 Sharpe 1.656 仍輸 S1 1.975)。
  3.  Sample period 含 2 次空頭與 1 次危機 (COVID、Rate Shock 2022、SVB 2023),符合 long-sample 要求。
  4.  Bootstrap B=500 (stationary bootstrap, Politis–Romano 1994),block length auto-select。
  5.  Random seed = 42 :全程固定,含 weight 計算、bootstrap 抽樣、tier 切點。
  6.  Spec 限制 :只測 NFCI / EPU / VIX 三類 alt-data;未測 GDELT、satellite、social media sentiment 等 alternative alt-data。延伸方向是把 GDELT GKG (K1170 系列已驗證 EU/JP cross-region effect) 套入同一 6-strategy 框架。
  7.  Asset universe 限制 :只測 SPY+GLD。延伸方向是 SPY+TLT、SPY+BTC、跨市場(如 0050.TW + 黃金期)。

結論與下一步

K1121 把 K1116 / K1118 的「alt-data 預測 NULL」延伸到 allocation 場域,得到完全一致的 NULL:5 種 spec 對 50/50 baseline 的 Δ Sharpe 全部不顯著(p ≥ 0.264)、95% CI 全部含零、hybrid 沒贏 best single signal、壓力期 H3 部分 PASS 但無實務優勢。

下一步研究方向:

  •  Gx 系列 alt-data :把 GDELT GKG event count、tone score 套入同一 6-strategy 框架(沿 K1170 的 cross-region 方法論)
  •  Asset universe 擴展 :SPY+TLT(傳統 risk-parity 對照)、台股 0050.TW + 黃金期(domestic moat)
  •  Allocation kernel 升級 :把 6-strategy 從 deterministic regime 升級到 Bayesian model averaging 或 MCS-selected ensemble,看 NULL 是否在 averaging 之後仍然 robust

Paper 4 narrative 因此從「forecasting compendium」實質擴大為「forecasting + allocation compendium」,這是 K1121 對 paper 的最大邊際貢獻。


本文基於實驗 K1121(腳本:experiments/k1121/k1121.py,結果:experiments/k1121/k1121_results.json)。資料來源:yfinance(SPY, GLD, ^VIX)+ FRED(USEPUINDXD, NFCI)。期間:2019-01-15 ~ 2026-04-10,N=1,817 個交易日。Lookahead 防護:NFCI shift(5)、EPU shift(2)、VIX shift(1)。Random seed=42。Bootstrap B=500(stationary bootstrap, Politis–Romano 1994)。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...
📄
K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關
# K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題:市場價格相對帳面淨值的折價,能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料,包含 27 家仍上市美國區域銀行,以及 KRE、KBE 兩個銀行 ETF;主...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...