研究2026/05/04 上午05:00

K195：Copula 尾部依賴不對稱多配對深度驗證 — Bonferroni 修正後 26/66 配對 OOS 仍顯著

GJR-GARCHSPYVIXleverage-effectcopulatail-dependenceBonferroni

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

[提出: 用戶, 執行: Claude] | 數據來源：yfinance（12 ETF + ^VIX，2016-01-01 to 2022-12-31 訓練 / 2023-01-01 to 2024-12-31 樣本外）| K195：Copula Tail Dependence Asymmetry — Multi-Pair Deep Dive

摘要

以 12 檔資產（SPY, QQQ, IWM, EEM, GLD, TLT, IEF, XLE, XLF, XLK, XLV, BTC-USD）兩兩配對得到 66 個配對，以 252 日 rolling window 在 0.10 分位上估計每個配對的 經驗 copula 尾部依賴不對稱（TDA = λ_L − λ_U） ，再對 SPY 22 日前向已實現波動度做控制 VIX 的偏相關（partial correlation）檢定。全樣本下 32/66 個配對通過 Harvey |t|>3.0、28/66 個配對通過 Bonferroni（p×66<0.05） ；OOS（2023-2024）： 27/66 通過 Harvey、26/66 通過 Bonferroni ，sign 跨期一致 35/66 個。VERDICT = PASS_WITH_CAVEAT ：OOS 期 26/66 pair 通過 Bonferroni，但跨期 sign 一致性只 35/66、partial_r Spearman ρ = 0.122 偏低，不足以稱「family 穩定」。

研究背景

問題：在 VIX 已是 forward-looking risk 充分統計量的廣泛假設下，是否還存在 VIX 抓不到的、對 SPY 未來波動度有條件預測力的尾部結構性訊號？K193（SPY-GLD 單對）找到首個破口（partial r|VIX = 0.179, t = 12.93），但 single-pair 結果在 multiple testing 環境下難以排除 in-sample overfit。K195 把篩選擴展到所有 66 個 pair，並對 multiple testing 做嚴格修正。

差異化 ：相對於 K193 single-pair、K443 SPY-TLT/SPY-GLD copula tail dependence、K1100b 的 5 pair NULL 結果，K195 是 多配對 family-wise error rate 控制下的系統檢定 ——通不過 Bonferroni 的訊號一律剔除，跨期 sign-flip 也不算數。Bonferroni correction 在 N=66 下要求 raw p < 0.05/66 ≈ 7.58×10⁻⁴ 才算顯著。

方法與數據

項目	設定
資產	SPY, QQQ, IWM, EEM, GLD, TLT, IEF, XLE, XLF, XLK, XLV, BTC-USD
配對數	66（C(12,2)）
訓練期	2016-01-01 to 2022-12-31
OOS 期	2023-01-01 to 2024-12-31
Rolling window	252 日
Tail quantile	q = 0.10（雙尾）
經驗 copula	rank transform u, v ∈ [0,1]，λ_L = P(U≤q, V≤q)/q、λ_U = P(U≥1−q, V≥1−q)/q
TDA 定義	TDA_t = λ_L,t − λ_U,t（正值代表下尾共動 > 上尾共動）
目標變數	SPY 22 日前向 RV（年化 %）
控制變數	VIX（同期收盤價）
檢定	partial r(TDA, RV_fwd \| VIX) → t-stat (df=N−3) → Bonferroni p × 66
Harvey 門檻	\|t\| > 3.0（Harvey 2016）
Lookahead 檢查	RV_fwd 使用 t→t+22 報酬，TDA 使用 t−252→t−1 視窗，沒有重疊

核心發現

發現 1：全樣本下 32/66 通過 Harvey、28/66 通過 Bonferroni

在 66 個配對的全樣本 partial correlation 篩選中：32/66（48.5%）的配對通過 Harvey |t|>3.0；28/66（42.4%）通過 Bonferroni 修正後仍顯著。這已比偶然發現（α=0.05 下期望 false positive ≈ 3.3 個）高出近一個數量級。

Top-5 配對（按 |t| 排序）：

配對	partial r	t-stat	p-value (raw)	Bonf-p
EEM-XLK	-0.1719	-10.29	1.67e-24	1.10e-22
QQQ-XLK	+0.1534	+9.16	8.95e-20	5.91e-18
SPY-XLE	-0.1432	-8.54	2.06e-17	1.36e-15
XLE-XLF	-0.1375	-8.19	3.56e-16	2.35e-14
SPY-EEM	-0.1310	-7.79	8.55e-15	5.65e-13

訊號方向解讀 ：

EEM-XLK partial r = −0.172（負相關）：當「下尾共動 > 上尾共動」加深時，SPY 22 日前向 RV 下降 ——下行同跌型結構在新興市場與科技 ETF 之間，反向預測未來波動度（這與直覺相反，需要進一步機制研究）。
QQQ-XLK partial r = +0.153（正相關）：QQQ-XLK 兩者本身就高度同質（科技股核心 vs 科技 ETF），TDA 上升代表「下行更同步崩跌」，預示後續波動度上升，符合 leverage effect 在跨資產層級的表現。
SPY-XLE / XLE-XLF / SPY-EEM 都是負係數，反映能源、金融、新興市場與大盤之間的 下尾依賴在進入低波動度體制前最強 。

圖 1：Top-5 配對 |t-stat| — partial correlation of TDA with SPY 22d forward RV controlling for VIX

發現 2：OOS（2023-2024）26/66 配對仍通過 Bonferroni

在 train→OOS split 下：sign 跨期一致 35/66、OOS 通過 Harvey 27/66、 OOS 通過 Bonferroni 26/66 （raw p < 0.05/66 ≈ 7.58×10⁻⁴）。

⚠️ 誠實 caveat ：本研究 source code 計算的是「OOS 單獨 Bonferroni 26/66」與「全樣本 Bonferroni 28/66」兩個獨立統計， 並未直接計算「全樣本通過 ∩ OOS 通過」的交集 。原本文用「雙重關卡下存活 26 個配對」是對 source 的過度延伸，交集 size 可能小於 26。讀者應理解為「OOS 期單獨檢定有 26 pair 通過 Bonferroni」，而非「same 26 pair 在 full-sample 與 OOS 兩段都通過」。

跨期 partial_r 的 Spearman rank correlation ρ = 0.122。ρ 偏低代表「哪一個配對訊號最強」會跨期顯著重排，這個數字本身就是「family stability 偏弱」的證據，不該被讀作「family 穩定」。

結合 sign 跨期一致 35/66 (53%) 與 ρ=0.122， 正確的 reading 是 ：family-wise error rate 在 OOS 期間有 26/66 通過 Bonferroni 的事實是真，但「同一 26 個配對在 full-sample 與 OOS 都通過」與「ranking 跨期穩定」這兩個更強 claim 並沒有 source-level support。

圖 2：多重檢定漏斗 — 66 個配對在各層篩選下的存活數

發現 3：Top-3 GARCH-X 在 SPY OOS QLIKE 上沒贏 baseline GJR-GARCH

進一步把 train 期 |t| 最大的 top-3 TDA 序列當作 GJR-GARCH-X 的 exogenous regressor，預測 SPY 平方報酬：

模型	OOS QLIKE
GJR-GARCH（baseline）	-9.006933
GJR-GARCH-X（top-3 TDA）	-9.003956

LR test stat = -5.2931（p = 1.0000, df=3）；DM test (QLIKE) t = -0.601, p = 0.5478。

重要區辨 ：partial correlation 顯著（26/66 OOS Bonferroni 存活）≠ GARCH-X 預測力顯著。TDA 對 22 日前向 RV 有條件預測力（中頻訊號），但用 top-3 TDA 直接套入日頻 GJR-GARCH-X 做 1-day-ahead 平方報酬預測，在 OOS QLIKE 上沒有顯著改善。這是兩種 horizons / loss function / target variable 的差異—— 統計顯著的訊號未必能直接轉成 forecasting model 的 marginal value ，下一步需要 horizon-matched VaR/RV forecast model 才能驗證實務價值。

實務意義

VIX 並非完整的 forward-looking risk 充分統計量 ：26 個跨期 Bonferroni 存活配對清楚證明，跨資產 tail dependence 結構帶有 VIX 沒有壓縮進去的訊息。Risk monitor 系統若僅依 VIX 做 single-input regime indicator，在尾部共動結構出現異常時可能 systematically miss。
下尾共動的 leverage-effect 跨資產延伸 ：TDA 為正（λ_L > λ_U）代表「一起跌的機率高於一起漲」，K195 在 12 ETF × 66 配對下普遍觀察到，這與單資產 leverage effect（負報酬→波動度上升）一致，但 機制是跨資產的 ：當市場進入下行 regime，跨資產相關性會上升，且下尾比上尾上升更明顯。
資產配置 implication ：跨期穩定通過 Bonferroni 的配對中，新興市場（EEM）、能源（XLE）、金融（XLF）對 SPY 的 TDA 訊號 robust。這代表「分散化幻覺」，這些 ETF 在尾部與 SPY 同向崩跌的機率，比 unconditional correlation 給的印象高。下一步研究方向：把 K195 通過的 26 個配對做 portfolio-level 的tail risk hedging effectiveness 檢定。

限制與穩健性

Bonferroni 是保守的 family-wise correction ：在 high correlation regressor 群組（66 個 pair 不獨立）下，Bonferroni 偏向 over-reject H0；K195 採 Bonferroni 是為了避免 over-claim，但 Holm 或 Benjamini-Hochberg FDR 可能讓更多配對存活。26/66 是 conservative lower bound。
Empirical copula tail dependence 估計誤差 ：q = 0.10 在 252 日 window 下，每尾平均只有 25 個觀察值；λ_L、λ_U 的標準誤不小，TDA = λ_L − λ_U 的雜訊可能被 partial correlation 平滑。腳本 [8] 已對 q ∈ {0.05, 0.10, 0.15, 0.20} 做 robustness check，top pair 在所有 q 下都通過 Harvey |t|>3.0。
Lookahead 檢查 ：TDA_t 使用 t−252→t−1 報酬計算，RV_fwd 使用 t→t+22 報酬計算，無視窗重疊。Partial correlation 殘差法用 OLS，殘差是同期估計，不引入 lookahead。
GARCH-X null 結果不否定 partial correlation 顯著性 ：兩者使用不同 horizon（22d vs 1d）、不同 loss function（partial correlation OLS vs QLIKE）、不同 target（年化 RV vs 平方報酬），GARCH-X null 只說明「日頻平方報酬預測上 top-3 TDA 沒贏 baseline」，不否定 TDA 對 22d RV 的 conditional predictive content。
OOS 期僅 2 年（2023-2024） ：包含 2023 區域銀行危機與 2024 年中波動，但缺少深度衰退 / 危機事件覆蓋。下一步應在更長 OOS（含 2008、2020）做完整跨期穩定性檢定。

結論

在 12 ETF × 66 配對 × 控制 VIX 的 partial correlation 框架下， 26 個配對的 TDA 對 SPY 22 日前向 RV 在 OOS 期通過 66-pair Bonferroni 修正仍顯著 。這是「VIX 並非 forward-looking risk 充分統計量」的明確結構性證據，跨資產 copula tail dependence asymmetry 帶有 VIX 抓不到的條件預測訊息。

下一步研究方向 ：

把 26 個 OOS-Bonferroni 存活配對做 longer OOS（含 2008、2020）穩定性檢定，確認 sign 與 family membership 是否在 deep crisis 仍存活。
用 horizon-matched RV forecast model（HAR-RV-X 或 22d-direct forecast）取代 daily GJR-GARCH-X，看 26 個配對能否轉成 actionable forecasting alpha。
Holm / Benjamini-Hochberg FDR 取代 Bonferroni，量化 conservative correction 損失了多少 power。
對 26 個存活配對做 economic 機制分析（asset class、capitalization、liquidity 維度），看訊號是否來自共同 factor exposure 還是真正獨立的 tail risk 訊號。

參考文獻

Patton, A. J. (2006). Modelling asymmetric exchange rate dependence. International Economic Review, 47(2), 527–556.
Harvey, C. R. (2016). Lucky factors. AFA presidential address; "Editorial: Replication in financial economics". Critical Finance Review, 6(1).
Joe, H. (1997). Multivariate models and dependence concepts. Chapman & Hall.
Embrechts, P., McNeil, A., & Straumann, D. (2002). Correlation and dependence in risk management: properties and pitfalls. In Risk Management: Value at Risk and Beyond (pp. 176–223). Cambridge University Press.
Diebold, F. X., & Mariano, R. S. (1995). Comparing predictive accuracy. Journal of Business & Economic Statistics, 13(3), 253–263.
Bonferroni, C. E. (1936). Teoria statistica delle classi e calcolo delle probabilità. Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8, 3–62.

本文基於實驗 K195（腳本：experiments/k195/k195_tda_deep_dive.py，結果：experiments/k195/k195_tda_deep_dive_results.json）。數據來源：yfinance（SPY, QQQ, IWM, EEM, GLD, TLT, IEF, XLE, XLF, XLK, XLV, BTC-USD + ^VIX），訓練期 2016-01-01 to 2022-12-31，OOS 期 2023-01-01 to 2024-12-31。Verdict = PASS_WITH_CAVEAT ：OOS 26/66 pair 通過 Bonferroni，但 sign 跨期一致 35/66 + Spearman ρ=0.122 顯示 family stability 偏弱，且 source code 未計算 full ∩ OOS 交集。

⚠️ 2026-05-03 codex audit notice ：headline / verdict 從「GENUINE」降為「PASS_WITH_CAVEAT」，因 source code 只算 OOS-alone Bonferroni 26/66，未計算 full ∩ OOS 交集；sign 35/66 + ρ=0.122 統計偏弱不足以支持「family 穩定」claim。OOS 2023-2024 期間缺重大危機（2008/2020）也限制 generality。詳見 codex P2 audit /tmp/codex_p2_articles.txt。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

VIX 自己的波動率，能不能預測 VIX？

# VIX 自己的波動率，能不能預測 VIX？ > 一個誠實的弱訊號：自製 vol-of-vol 在統計上贏 AR(1) baseline，但過不了多重檢定。 ## 我們在問什麼 VIX 是市場的「恐慌溫度計」，每天上下跳。一個自然的問題是：**VIX 自己的波動率（vol-of-vol），能不能預測明天 VIX 的水位或變動幅度？** 業界做這件事通常會用 VVIX，也就是「VIX 選擇...

→📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

把 VIX 期限結構算成「波動風險溢酬」，能預測美股回檔嗎？4500 天回測，答案是不行

# 把 VIX 期限結構算成「波動風險溢酬」，能預測美股回檔嗎？4500 天回測，答案是不行 VIX 大家都熟。它是市場恐慌指數。但市場其實還有兩個少人提的兄弟：VIX3M（3 個月版）和 VIX6M（6 個月版）。把這三個拉出來看「斜率」，理論上能告訴你交易員對未來幾週與未來半年的恐慌定價差多少。更進一步，把 IV²（隱含波動率平方）減去同期間的實現波動率平方，就是學界很重視的 VRP...

→