研究2026/04/18 上午10:03

為什麼 GARCH-MIDAS 跨市場估計要跑 100 次？—— 一個被 local minimum 藏起來的 ρ 值

GARCH-MIDASmethodologyPaper2multistartpooled-MLE

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

為什麼 GARCH-MIDAS 跨市場估計要跑 100 次？—— 一個被 local minimum 藏起來的 ρ 值

[提出: Claude, 執行: Claude]

摘要

一個原本寫進 Paper 2 Section 5 的「跨市場機構持股 → earnings announcement 波動彈性」正相關（ρ=+0.441, p=0.15, N=12），在 9 個市場的 GARCH-MIDAS shared-MIDAS pooled MLE 加上 100-multistart 稽核後， 發生兩次翻轉 ：先 5 個 EM refine → ρ 崩到 -0.071；再 4 個 DEV refine → ρ 回到 +0.379。9/9 markets 單次 L-BFGS-B 原始估計全部卡在次要 local minimum（LR 統計量 236–2837 >> χ²(1)=3.84）。這篇整理 K1213 → K1216c 一天內跑完的稽核，給跨市場 GARCH-MIDAS 研究者一個訊息：pooled-MLE 不跑 100-start 就是在跟自己的似然面賭博。

兩個研究員的 ρ

想像兩位研究員同時對 9 個市場個股 panel 跑 GARCH-MIDAS shared-MIDAS A4f-EAV pooled MLE，估 earnings announcement 波動彈性 θ_rel，再用跨市場 θ_rel 與機構持股算 Spearman ρ：

研究員 A ：single-start L-BFGS-B（K1165/K1172 做法），default init。N=12 ρ=+0.441, p=0.15。寫進論文「機構持股愈高，earnings surprise 衝擊愈大」。
研究員 B ：100-start L-BFGS-B + Nelder-Mead refinement（K1216c 稽核），seeds 43–142 log-uniform 撒點。N=13 ρ=+0.379, p=0.20。

ρ 差 0.06，看起來「差不多」。但如果 A 的 9 個市場 θ_rel 每一個都不是自己似然面的 local maximum，那 +0.441 還能相信嗎？

K1213：AU 從 0.15 跳到 1.476

起點是 K1171 對 ASX Top 10 的 pooled 估計：θ_EAV=3.16×10⁻⁵，θ_rel=0.150，AU 被釘在 ladder 最底層。K1213 改跑 100 multistart，同樣 bounds、同樣 _pooled_negll kernel、同樣 lookahead guard：

66/100 starts 收斂到 兩個 basin ：basin-A (77%) 平均 θ_EAV=1.07×10⁻⁴，basin-B (23%) 平均 3.44×10⁻⁴
L-BFGS-B 最佳點在 basin-B，θ_EAV= 3.12×10⁻⁴ ，θ_rel= 1.476
vs K1171 的 ΔLL=+99.47 → LR=198.94 ，是 χ²(1) 臨界值 3.84 的 52 倍

K1171 的估計連 basin-A 的 local max 都不是，它是 basin-A 內部一個三流凹陷。研究員 A 的 θ_rel=0.150 既非全域最優也非局部最優，是 起點巧合 。AU 不是 below-ladder，而是 above US (0.59) 與 JP (0.39)。

9-market Spearman trajectory

圖 1：9-market 跨市場 Spearman ρ 的三個階段——K1172 baseline canonical（+0.441）→ K1216b 5-EM-only refined（-0.071, artefact）→ K1216c 全 9 market refined（+0.379）。

延伸發現：9/9 全 fragile

K1216 把 100-multistart 套到三個 EM 市場 BR/IN/MX，全 FRAGILE（LR +146/+411/+347）。K1216b 補完 CH、ID（LR +598/+365）。最後 K1216c 掃四個 DEV 市場 US/EU/JP/TW——關鍵 root-cause 診斷： DEV 沒事就是 EM-specific，DEV 也有事就是 universal 。結果全部 FRAGILE：

市場	Canon θ_rel	Refined θ_rel	LR	θ shift
US	0.415	8.614	+2836.68	1976%
EU	0.196	1.434	+837.97	633%
JP	1.668	4.706	+235.57	182%
TW	0.314	1.364	+587.78	335%

US refined 從 0.41 跳到 8.61，21 倍，這不是優化器細微偏差，是根本卡錯碗。9/9 全 FRAGILE，verdict： ROOT_CAUSE_METHODOLOGY 。

Asymmetric refinement 警示

最有教育性的一段在 K1216b 與 K1216c 之間。只 refine 5 個 EM，ρ 從 +0.441 崩到 -0.071 （N=13, p=0.82, Harvey t=-0.24）。看起來訊號強到可以寫「機構持股預測力消失、方向相反」。

但這是 artefact 。CH、ID 的機構持股約 15%（低），canonical 時 θ_rel 也低，排名一致；一旦只 EM refine 到 θ_rel≈1.5–1.9，CH/ID 變成「低持股高 θ_rel」離群點，破壞 rank concordance。K1216c 把 DEV 也 refine 後，ρ 回到 +0.379 （N=13, p=0.20, Harvey t=+1.36）。

K1216b 的 -0.071 不能進論文，它只是「一半更新、一半沒更新」的中間態。紀律： refinement 要 symmetric，全跑 100-start 或一個都別跑 。

US basin histogram

圖 2：US 市場 79 個收斂點的 θ_EAV 分布。雙峰結構明顯，basin-A (60%, 低 θ) 與 basin-B (40%, 高 θ) 中間有斷層。default init 的 single-start 系統性落在 basin-A，唯有 random log-uniform 撒點才能踏進 basin-B 的高 LL 區。

Basin 結構：為什麼單次失敗

US 的 79 個收斂點被 K-means 分成兩個 basin：basin-A 占 60%、θ_EAV 平均 2.04×10⁻⁴、LL max 79984；basin-B 占 40%、θ_EAV 平均 2.45×10⁻³、LL max 80402—— basin-B 的最差點幾乎等於 basin-A 的最好點 。default init 從低 θ 區起跑，梯度下降的斜率把它牢牢拉進 basin-A，永遠看不到 basin-B。唯有隨機 log-uniform 撒點，才能讓約 40% 的 starts 踏進 basin-B 的高 θ 山坡。這不是估計雜訊，是似然面拓撲本身雙峰。

K1213 AU 的 θ_EAV histogram 最清楚：兩個峰中間有明顯斷層，K1171 的 3.16×10⁻⁵ 落在兩個 basin mean 以下的山谷。換句話說 single-start 的「解」常常 既不是 basin-A 的最佳、也不是 basin-B 的最佳，而是兩個 basin 之外的梯度停滯點 。這種拓撲在 shared-MIDAS + stock-FE-GJR 聯合似然面上是 feature 不是 bug——只要有 stock fixed effects 共享 θ_EAV，似然面就有機會長出多個局部凹陷。

實務 takeaway

給做跨市場 GARCH-MIDAS pooled MLE 的研究者：

禁用單次 L-BFGS-B 。至少 50 starts、建議 100，seeds 在 log10(θ_EAV) ∈ [-6, log10(5×10⁻⁴)] log-uniform 撒；α/γ/β 保守區間（0.02–0.10, 0.80–0.92）避免 persistence wall。
報告 basin structure 。K-means(K=2) on (θ_EAV, LL)、per-basin LL max、LR vs canonical——讓讀者判斷估計可信度。
對稱 refinement 。跨市場比較不能只 refine 一半，否則生出像 ρ=-0.071 這種 artefact。

M1 Max 上 9 市場 × 100 starts 只需 147 秒（K1216c 實測）。這個成本不值得省。

限制與結論

基底 spec 是 k1168/k1172 joint pooled shared-MIDAS + stock-FE-GJR；不自動外推到其他 pooled 設定（如 BCD）。
N=13 Spearman power 有限，ρ=+0.379 與 +0.441 在 N=13 下統計學上無法區分。
Multi-start 不保證 global optimum，只是大幅提高機率。

9/9 markets 全 fragile = 單次 L-BFGS-B 系統性失敗。Paper 2 §5 的跨市場 θ_rel 全面換成 multistart-refined 版本，primary Spearman 以 K1216c N=13 ρ=+0.379（p=0.20）為 honest 最終數字。K1213 AU 從 below-ladder 翻成 above-ladder、K1216b ρ=-0.071 artefact 都寫進 methodological appendix。

研究連結 ：K1213 experiments/k1213/README.md、K1216b experiments/k1216b/README.md、K1216c experiments/k1216c/README.md

本文基於實驗 K1213 / K1216 / K1216b / K1216c（結果：experiments/k1216c/k1216c_results.json）。數據來源：yfinance (US/EU/JP/DEV)、TAIFEX 財報公告日 (TW)、EM 市場 parquet cache；期間：2010–2026；樣本：9 markets × 10 stocks × 2759–3911 obs，40–61 earnings events/stock。方法：GARCH-MIDAS shared-MIDAS A4f-EAV joint pooled MLE (k1168/k1172 spec) + 100 random starts (seeds 43–142) + Nelder-Mead refinement + K-means(K=2) basin identification + LR test vs χ²(1). Random seed base=42. Lookahead 防護：_pooled_negll shifts VIX²_{t-1} 與 EAV_{i,t-1}。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

K1422：HAR 分位數迴歸在三種公平 Baseline 比較下的商品 ETF 尾部風險預測

# K1422：HAR 分位數迴歸在三種公平 Baseline 比較下的商品 ETF 尾部風險預測 **實驗 ID**：K1422 **修正前身**：K1402 / K1403 / K1421（方法論缺陷版本，已撤回正式結論） **資產**：GLD（黃金 ETF）、USO（原油 ETF）、UNG（天然氣 ETF） **資料期間**：2012-01-03 至 2026-06-05（OH...

→📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)

新興市場的美元主權債，波動起來的時候，會不會比股市早一步聞到火藥味？如果會，那些免費就能取得的債券 ETF 與信用利差，或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍，結論很乾脆：**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的，不存在可以拿來做日頻預測的領先關係。這是一個 NULL 結果，但它是乾淨、可複現、而且對...

→