← 研究動態
研究2026/05/04 上午05:00

K195:Copula 尾部依賴不對稱多配對深度驗證 — Bonferroni 修正後 26/66 配對 OOS 仍顯著

GJR-GARCHSPYVIXleverage-effectcopulatail-dependenceBonferroni

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

[提出: 用戶, 執行: Claude] | 數據來源:yfinance(12 ETF + ^VIX,2016-01-01 to 2022-12-31 訓練 / 2023-01-01 to 2024-12-31 樣本外)| K195:Copula Tail Dependence Asymmetry — Multi-Pair Deep Dive

摘要

以 12 檔資產(SPY, QQQ, IWM, EEM, GLD, TLT, IEF, XLE, XLF, XLK, XLV, BTC-USD)兩兩配對得到 66 個配對,以 252 日 rolling window 在 0.10 分位上估計每個配對的 經驗 copula 尾部依賴不對稱(TDA = λ_L − λ_U) ,再對 SPY 22 日前向已實現波動度做控制 VIX 的偏相關(partial correlation)檢定。全樣本下  32/66 個配對通過 Harvey |t|>3.0、28/66 個配對通過 Bonferroni(p×66<0.05) ;OOS(2023-2024): 27/66 通過 Harvey、26/66 通過 Bonferroni ,sign 跨期一致 35/66 個。VERDICT =  PASS_WITH_CAVEAT :OOS 期 26/66 pair 通過 Bonferroni,但跨期 sign 一致性只 35/66、partial_r Spearman ρ = 0.122 偏低,不足以稱「family 穩定」。

研究背景

 問題 :在 VIX 已是 forward-looking risk 充分統計量的廣泛假設下,是否還存在 VIX 抓不到的、對 SPY 未來波動度有條件預測力的尾部結構性訊號?K193(SPY-GLD 單對)找到首個破口(partial r|VIX = 0.179, t = 12.93),但 single-pair 結果在 multiple testing 環境下難以排除 in-sample overfit。K195 把篩選擴展到所有 66 個 pair,並對 multiple testing 做嚴格修正。

 差異化 :相對於 K193 single-pair、K443 SPY-TLT/SPY-GLD copula tail dependence、K1100b 的 5 pair NULL 結果,K195 是 多配對 family-wise error rate 控制下的系統檢定 ——通不過 Bonferroni 的訊號一律剔除,跨期 sign-flip 也不算數。Bonferroni correction 在 N=66 下要求 raw p < 0.05/66 ≈ 7.58×10⁻⁴ 才算顯著。

方法與數據

項目設定
資產SPY, QQQ, IWM, EEM, GLD, TLT, IEF, XLE, XLF, XLK, XLV, BTC-USD
配對數66(C(12,2))
訓練期2016-01-01 to 2022-12-31
OOS 期2023-01-01 to 2024-12-31
Rolling window252 日
Tail quantileq = 0.10(雙尾)
經驗 copularank transform u, v ∈ [0,1],λ_L = P(U≤q, V≤q)/q、λ_U = P(U≥1−q, V≥1−q)/q
TDA 定義TDA_t = λ_L,t − λ_U,t(正值代表下尾共動 > 上尾共動)
目標變數SPY 22 日前向 RV(年化 %)
控制變數VIX(同期收盤價)
檢定partial r(TDA, RV_fwd | VIX) → t-stat (df=N−3) → Bonferroni p × 66
Harvey 門檻|t| > 3.0(Harvey 2016)
Lookahead 檢查RV_fwd 使用 t→t+22 報酬,TDA 使用 t−252→t−1 視窗,沒有重疊

核心發現

發現 1:全樣本下 32/66 通過 Harvey、28/66 通過 Bonferroni

在 66 個配對的全樣本 partial correlation 篩選中:32/66(48.5%)的配對通過 Harvey |t|>3.0;28/66(42.4%)通過 Bonferroni 修正後仍顯著。這已比偶然發現(α=0.05 下期望 false positive ≈ 3.3 個)高出近一個數量級。

Top-5 配對(按 |t| 排序):

配對partial rt-statp-value (raw)Bonf-p
EEM-XLK-0.1719-10.291.67e-241.10e-22
QQQ-XLK+0.1534+9.168.95e-205.91e-18
SPY-XLE-0.1432-8.542.06e-171.36e-15
XLE-XLF-0.1375-8.193.56e-162.35e-14
SPY-EEM-0.1310-7.798.55e-155.65e-13

 訊號方向解讀 :

  • EEM-XLK partial r = −0.172(負相關):當「下尾共動 > 上尾共動」加深時,SPY 22 日前向 RV  下降 ——下行同跌型結構在新興市場與科技 ETF 之間,反向預測未來波動度(這與直覺相反,需要進一步機制研究)。
  • QQQ-XLK partial r = +0.153(正相關):QQQ-XLK 兩者本身就高度同質(科技股核心 vs 科技 ETF),TDA 上升代表「下行更同步崩跌」,預示後續波動度上升,符合 leverage effect 在跨資產層級的表現。
  • SPY-XLE / XLE-XLF / SPY-EEM 都是負係數,反映能源、金融、新興市場與大盤之間的 下尾依賴在進入低波動度體制前最強 。

圖 1:Top-5 配對 |t-stat| — partial correlation of TDA with SPY 22d forward RV controlling for VIX

發現 2:OOS(2023-2024)26/66 配對仍通過 Bonferroni

在 train→OOS split 下:sign 跨期一致 35/66、OOS 通過 Harvey 27/66、 OOS 通過 Bonferroni 26/66 (raw p < 0.05/66 ≈ 7.58×10⁻⁴)。

⚠️  誠實 caveat :本研究 source code 計算的是「OOS 單獨 Bonferroni 26/66」與「全樣本 Bonferroni 28/66」兩個獨立統計, 並未直接計算「全樣本通過 ∩ OOS 通過」的交集 。原本文用「雙重關卡下存活 26 個配對」是對 source 的過度延伸,交集 size 可能小於 26。讀者應理解為「OOS 期單獨檢定有 26 pair 通過 Bonferroni」,而非「same 26 pair 在 full-sample 與 OOS 兩段都通過」。

跨期 partial_r 的 Spearman rank correlation ρ = 0.122。ρ 偏低代表「哪一個配對訊號最強」會跨期顯著重排,這個數字本身就是「family stability 偏弱」的證據,不該被讀作「family 穩定」。

結合 sign 跨期一致 35/66 (53%) 與 ρ=0.122, 正確的 reading 是 :family-wise error rate 在 OOS 期間有 26/66 通過 Bonferroni 的事實是真,但「同一 26 個配對在 full-sample 與 OOS 都通過」與「ranking 跨期穩定」這兩個更強 claim 並沒有 source-level support。

圖 2:多重檢定漏斗 — 66 個配對在各層篩選下的存活數

發現 3:Top-3 GARCH-X 在 SPY OOS QLIKE 上沒贏 baseline GJR-GARCH

進一步把 train 期 |t| 最大的 top-3 TDA 序列當作 GJR-GARCH-X 的 exogenous regressor,預測 SPY 平方報酬:

模型OOS QLIKE
GJR-GARCH(baseline)-9.006933
GJR-GARCH-X(top-3 TDA)-9.003956

LR test stat = -5.2931(p = 1.0000, df=3);DM test (QLIKE) t = -0.601, p = 0.5478。

 重要區辨 :partial correlation 顯著(26/66 OOS Bonferroni 存活)≠ GARCH-X 預測力顯著。TDA 對 22 日前向 RV 有條件預測力(中頻訊號),但用 top-3 TDA 直接套入日頻 GJR-GARCH-X 做 1-day-ahead 平方報酬預測,在 OOS QLIKE 上沒有顯著改善。這是兩種 horizons / loss function / target variable 的差異—— 統計顯著的訊號未必能直接轉成 forecasting model 的 marginal value ,下一步需要 horizon-matched VaR/RV forecast model 才能驗證實務價值。

實務意義

  1.  VIX 並非完整的 forward-looking risk 充分統計量 :26 個跨期 Bonferroni 存活配對清楚證明,跨資產 tail dependence 結構帶有 VIX 沒有壓縮進去的訊息。Risk monitor 系統若僅依 VIX 做 single-input regime indicator,在尾部共動結構出現異常時可能 systematically miss。
  2.  下尾共動的 leverage-effect 跨資產延伸 :TDA 為正(λ_L > λ_U)代表「一起跌的機率高於一起漲」,K195 在 12 ETF × 66 配對下普遍觀察到,這與單資產 leverage effect(負報酬→波動度上升)一致,但 機制是跨資產的 :當市場進入下行 regime,跨資產相關性會上升,且下尾比上尾上升更明顯。
  3.  資產配置 implication :跨期穩定通過 Bonferroni 的配對中,新興市場(EEM)、能源(XLE)、金融(XLF)對 SPY 的 TDA 訊號 robust。這代表「分散化幻覺」,這些 ETF 在尾部與 SPY 同向崩跌的機率,比 unconditional correlation 給的印象高。下一步研究方向:把 K195 通過的 26 個配對做 portfolio-level 的tail risk hedging effectiveness 檢定。

限制與穩健性

  1.  Bonferroni 是保守的 family-wise correction :在 high correlation regressor 群組(66 個 pair 不獨立)下,Bonferroni 偏向 over-reject H0;K195 採 Bonferroni 是為了避免 over-claim,但 Holm 或 Benjamini-Hochberg FDR 可能讓更多配對存活。26/66 是 conservative lower bound。
  2.  Empirical copula tail dependence 估計誤差 :q = 0.10 在 252 日 window 下,每尾平均只有 25 個觀察值;λ_L、λ_U 的標準誤不小,TDA = λ_L − λ_U 的雜訊可能被 partial correlation 平滑。腳本 [8] 已對 q ∈ {0.05, 0.10, 0.15, 0.20} 做 robustness check,top pair 在所有 q 下都通過 Harvey |t|>3.0。
  3.  Lookahead 檢查 :TDA_t 使用 t−252→t−1 報酬計算,RV_fwd 使用 t→t+22 報酬計算,無視窗重疊。Partial correlation 殘差法用 OLS,殘差是同期估計,不引入 lookahead。
  4.  GARCH-X null 結果不否定 partial correlation 顯著性 :兩者使用不同 horizon(22d vs 1d)、不同 loss function(partial correlation OLS vs QLIKE)、不同 target(年化 RV vs 平方報酬),GARCH-X null 只說明「日頻平方報酬預測上 top-3 TDA 沒贏 baseline」,不否定 TDA 對 22d RV 的 conditional predictive content。
  5.  OOS 期僅 2 年(2023-2024) :包含 2023 區域銀行危機與 2024 年中波動,但缺少深度衰退 / 危機事件覆蓋。下一步應在更長 OOS(含 2008、2020)做完整跨期穩定性檢定。

結論

在 12 ETF × 66 配對 × 控制 VIX 的 partial correlation 框架下, 26 個配對的 TDA 對 SPY 22 日前向 RV 在 OOS 期通過 66-pair Bonferroni 修正仍顯著 。這是「VIX 並非 forward-looking risk 充分統計量」的明確結構性證據,跨資產 copula tail dependence asymmetry 帶有 VIX 抓不到的條件預測訊息。

 下一步研究方向 :

  1. 把 26 個 OOS-Bonferroni 存活配對做 longer OOS(含 2008、2020)穩定性檢定,確認 sign 與 family membership 是否在 deep crisis 仍存活。
  2. 用 horizon-matched RV forecast model(HAR-RV-X 或 22d-direct forecast)取代 daily GJR-GARCH-X,看 26 個配對能否轉成 actionable forecasting alpha。
  3. Holm / Benjamini-Hochberg FDR 取代 Bonferroni,量化 conservative correction 損失了多少 power。
  4. 對 26 個存活配對做 economic 機制分析(asset class、capitalization、liquidity 維度),看訊號是否來自共同 factor exposure 還是真正獨立的 tail risk 訊號。

參考文獻

  • Patton, A. J. (2006). Modelling asymmetric exchange rate dependence. International Economic Review, 47(2), 527–556.
  • Harvey, C. R. (2016). Lucky factors. AFA presidential address; "Editorial: Replication in financial economics". Critical Finance Review, 6(1).
  • Joe, H. (1997). Multivariate models and dependence concepts. Chapman & Hall.
  • Embrechts, P., McNeil, A., & Straumann, D. (2002). Correlation and dependence in risk management: properties and pitfalls. In Risk Management: Value at Risk and Beyond (pp. 176–223). Cambridge University Press.
  • Diebold, F. X., & Mariano, R. S. (1995). Comparing predictive accuracy. Journal of Business & Economic Statistics, 13(3), 253–263.
  • Bonferroni, C. E. (1936). Teoria statistica delle classi e calcolo delle probabilità. Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8, 3–62.

本文基於實驗 K195(腳本:experiments/k195/k195_tda_deep_dive.py,結果:experiments/k195/k195_tda_deep_dive_results.json)。數據來源:yfinance(SPY, QQQ, IWM, EEM, GLD, TLT, IEF, XLE, XLF, XLK, XLV, BTC-USD + ^VIX),訓練期 2016-01-01 to 2022-12-31,OOS 期 2023-01-01 to 2024-12-31。Verdict =  PASS_WITH_CAVEAT :OOS 26/66 pair 通過 Bonferroni,但 sign 跨期一致 35/66 + Spearman ρ=0.122 顯示 family stability 偏弱,且 source code 未計算 full ∩ OOS 交集。

⚠️  2026-05-03 codex audit notice :headline / verdict 從「GENUINE」降為「PASS_WITH_CAVEAT」,因 source code 只算 OOS-alone Bonferroni 26/66,未計算 full ∩ OOS 交集;sign 35/66 + ρ=0.122 統計偏弱不足以支持「family 穩定」claim。OOS 2023-2024 期間缺重大危機(2008/2020)也限制 generality。詳見 codex P2 audit /tmp/codex_p2_articles.txt。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
VIX 自己的波動率,能不能預測 VIX?
# VIX 自己的波動率,能不能預測 VIX? > 一個誠實的弱訊號:自製 vol-of-vol 在統計上贏 AR(1) baseline,但過不了多重檢定。 ## 我們在問什麼 VIX 是市場的「恐慌溫度計」,每天上下跳。一個自然的問題是:**VIX 自己的波動率(vol-of-vol),能不能預測明天 VIX 的水位或變動幅度?** 業界做這件事通常會用 VVIX,也就是「VIX 選擇...
📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...
📄
把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行
# 把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行 VIX 大家都熟。它是市場恐慌指數。 但市場其實還有兩個少人提的兄弟:VIX3M(3 個月版)和 VIX6M(6 個月版)。把這三個拉出來看「斜率」,理論上能告訴你交易員對未來幾週與未來半年的恐慌定價差多少。 更進一步,把 IV²(隱含波動率平方)減去同期間的實現波動率平方,就是學界很重視的 VRP...