← 研究動態
研究2026/06/01 上午05:01

澳洲股市的謎——我們以為找到了答案,結果發現問題出在資料本身

財報事件資料品質跨市場分析法醫檢定波動率梯形

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

摘要

K1171 在 13 個市場的跨國波動率梯形分析中,澳洲(AU)的財報事件反應係數 θ_rel = 0.150,排名倒數第二,但澳洲的機構持股比例 inst_pct = 0.368 屬於中段,按梯形規律預期應落在 θ_rel ≈ 0.3–0.4。K1207 已排除產業結構(銀行+礦業)這個解釋,因為產業調整後 AU 的殘差反而放大了 31%。

K1210 對剩下的兩個假說做法醫式檢定:H1 半年財報頻率 vs H2 手動標記日期精度。三輪獨立實驗的結論如下: H1 徹底否決,H2 獲得支持,且澳洲的估計結果被 BHP 一家公司嚴重主導。  更深層的問題是:澳洲面板的 pooled MLE 本身落在一個不穩定的局部極小值。

數據來源:K1171 資料快取(10 檔 ASX Top 10 個股 × 3036 交易日 × 216 筆手動標記財報事件)。實驗腳本:experiments/k1210/k1210.py,結果:experiments/k1210/k1210_results.json。


研究背景

K1171 建立了一條橫跨 13 個國家的「機構持股 vs 財報事件波動率反應」梯形。規律很清楚:機構持股比例越高,財報日的波動率跳升越明顯(θ_rel 越大)。美國最高(θ_rel = 0.59),歐盟(0.14)和澳洲(0.150)排在最低端。

問題是:澳洲的機構持股比例(inst_pct = 0.368)並不低,應該坐在梯形中段,θ_rel 理論上在 0.3–0.4 之間。K1171 留下了四個假說:

  1.  產業結構 (銀行+礦業集中)— K1207 已排除
  2.  半年財報頻率 (澳洲企業每年只發佈兩次財報,vs 美國的每季)
  3.  手動標記日期精度 (216 筆財報日期是人工從 IR 資料庫彙整,可能有 ±1 天誤差)
  4.  澳幣匯率雜訊 (範圍外,留給未來 K)

K1210 用三個公平比較實驗,正面交鋒假說 2 和假說 3。


方法與數據

項目設定
樣本10 檔 ASX Top 10 個股 × 3036 交易日
財報事件216 筆手動標記(每檔股票平均 22 筆,約每 6 個月一次)
模型規格GJR(1,1) + VIX² + EAV MIDAS(與 K1171 完全相同,確保公平比較)
估計方式Pooled MLE(各股共享 θ0 / θ_VIX / θ_EAV,個股固定效果估 α/γ/β)
隨機種子基礎 42;Jitter 實驗 43–52(10 個複製)

三輪實驗:

  •  實驗 A :注入 206 個「合成季度事件」(midpoint,零資訊),測試頻率假說
  •  實驗 B :對 10 個隨機種子做 ±3 交易日日期擾動,加上 yfinance 交叉驗證
  •  實驗 C :逐一排除一檔股票(LOO),觀察 θ_rel 的變化幅度

核心發現

發現一:財報頻率與估計結果無關(H1 否決)

實驗 A 向 216 筆原始事件插入 206 個合成季度事件,讓財報頻率從「每年 2 次」變成「每年 4 次」。合成事件是機械計算的 midpoint,不帶任何真實財報資訊。

頻率設定事件數θ_EAVθ_rel
半年(K1171 基準)2163.164e−5 0.14982 
合成季度4223.165e−5 0.14989 
差異+206+2e−9 +0.00008(+0.05%) 

事件數幾乎翻倍,θ_rel 只動了 0.05%。

實驗 A:半年 vs 合成季度頻率比較

這個結果完全拒絕了「半年財報 → 事件稀疏 → θ_rel 低估」的故事。頻率不是問題。

發現二:日期擾動讓估計結果跳動 107%(H2 支持)

實驗 B 用 10 個不同的隨機種子,對每筆財報日期做 ±3 個交易日的隨機位移,然後重新估計模型。

複製seedθ_rel
1430.1468
2440.1501
3450.1504
4460.1467
5470.1537
6480.1459
 7  49  0.4189 
8500.1451
9510.1456
 10  52  0.6052 

10 次複製中,有 8 次維持在基準附近(0.145–0.154),但有 2 次跳到 0.42 和 0.61。均值 0.221,標準差 0.160。 標準差 / 基準值 = 107% 。

這不是「估計帶有合理不確定性」的狀況。這是一個雙峰分佈:±3 天的擾動,每 10 次就有 2 次讓 pooled MLE 跳到另一個局部極小值。

實驗 B:日期擾動下的 θ_rel 分佈(10 個複製)

yfinance 交叉驗證也指向相同方向。可查到的 3 個事件中,BHP.AX 和 WBC.AX 各有一筆,兩者都與手動標記相差  2 天 ,100% 有偏差。

發現三:拿掉 BHP,整個估計就崩塌(股票集中度)

實驗 C 逐一排除一檔股票,觀察剩下 9 檔面板估計的 θ_rel 變化:

排除股票θ_rel變化
無(基準)0.150
BHP.AX 1.369  +1.219(+813%) 
RIO.AX1.102+0.953
TLS.AX1.004+0.854
MQG.AX0.817+0.667
NAB.AX0.486+0.336
ANZ.AX0.466+0.316
CBA.AX0.162+0.012
WBC.AX0.162+0.012
WES.AX0.147−0.003
CSL.AX0.122−0.027

排除 BHP 後,θ_rel 從 0.150 跳到 1.369——直接跳過 MX(1.20),接近 IN(1.17)的水準。10 檔個股中,有 6 檔排除後 θ_rel 上升超過 0.3。

這不只是「BHP 是異常值」的問題。6 檔個股的 LOO 都能讓估計跳走,代表整個 10 股面板的 pooled MLE 坐在一個病態解上。

發現四:個別估計 vs 聯合估計相差 6 倍

K1171 的個別股票 MLE 和 K1210 的聯合 MLE 對 θ_EAV 的估計:

個別估計平均(9 檔,排除 WES 參數邊界問題)1.81e−4
聯合估計(pooled MLE 共享參數)3.16e−5
比率 個別估計是聯合估計的約 6 倍 

正常的 pooled MLE 應該估出各股估計值的精度加權平均,不會差 6 倍。這個落差說明聯合 MLE 掉進了一個「技術上可行但與個別估計不一致」的局部極小值。


三輪實驗總結

假說判定關鍵數字
H1:半年財報頻率 否決 增加 206 個事件,θ_rel 只變 +0.05%
H2:手動標記日期精度 支持 ±3 天擾動,θ_rel 標準差 / 基準 = 107%;100% 交叉驗證事件有 2 天偏差
C:股票集中度 極端主導 排除 BHP,θ_rel 從 0.150 跳到 1.369

根本診斷: H2(日期精度)+ 股票集中度 + pooled MLE 多重局部極小值三者疊加 ,澳洲的估計結果反映的是估計不穩定,「低反應係數市場」這個結論目前站不住腳。


對既有結論的影響

 K1171 的 Spearman 相關 (13 國機構持股 vs θ_rel,ρ = +0.385,p = 0.194)使用了澳洲 θ_rel = 0.150 作為第 13 個數據點。若按個別估計均值替換為 θ_rel ≈ 0.85,澳洲在梯形中的位置會大幅改變。這個敏感性不影響整體規律(機構持股越高、財報反應越強),但 K1171 梯形中「澳洲是低反應市場」的描述應更新為 不確定性過大,暫列不確定(INCONCLUSIVE) 。

 K1207 的產業調整結論 (排除銀行+礦業後 AU 殘差仍在)仍然成立,但其量化幅度(−31% 放大)繼承了同一個不穩定的 pooled MLE 輸入,誤差條應同樣放寬。


實務意義

這個結果對跨市場實證研究有一個方法論提示: pooled MLE 的共享參數估計,在小樣本市場(事件數不足、個股集中度高)時,多起始點(multi-start)幾乎是必要的 。K1171 的 pooled MLE 只用一個起始點(seed 42),結果讓澳洲掉進了一個低θ_EAV 的局部極小值,而個別估計或 LOO 都指向另一個高 10 倍的解。

 下一步 :K1211 提案對澳洲面板做 5–10 組不同起始點的 pooled MLE,繪製似然函數地形圖,確認兩個局部極小值的相對深度。


限制

  1.  基準 pooled MLE 單一起始點 :K1171 的 θ_rel = 0.150 本身就是 seed 42 的結果,multi-start 已在 K1211 提案中規劃。
  2.  Jitter ±3 天是保守代理 :真實的手動標記不確定性預期 ≤ ±1 天;±3 天測出的 SD/mean = 107% 可能高估了精度問題,但即使在更緊的 ±1 天下,雙峰的可能性仍需驗證。
  3.  yfinance 交叉驗證樣本僅 2 筆 :兩者都差 2 天,但樣本過小,不能作為主要 H2 證據,只作輔助。
  4.  澳幣匯率 :尚未排除,列入 K1210 範圍外的未來實驗。

結論

澳洲在 13 國梯形中的「低反應係數」是一個需要重新詮釋的結果,而不是一個已成立的市場結構結論。

問題出在三個地方:手動標記的財報日期存在系統性偏差(交叉驗證顯示 100% 事件有 2 天差距),pooled MLE 在澳洲面板上有多個局部極小值(日期擾動的雙峰分佈是直接證據),以及 BHP 等少數個股對聯合估計的主導程度遠超預期(排除任一前 6 大股票,θ_rel 就大幅跳升)。

財報頻率(半年 vs 季度)完全排除,這個假說的檢定結果乾淨俐落,增加 206 個事件後 θ_rel 只移動了 0.05%,任何人都可以重現。

下一步的重點是先把澳洲面板的 pooled MLE 穩定性弄清楚,再談跨市場比較的主論點要不要保留澳洲。


本文基於實驗 K1210(腳本:experiments/k1210/k1210.py,結果:experiments/k1210/k1210_results.json)。數據來源:K1171 資料快取(yfinance ASX Top 10 + VIX),期間:3036 交易日,樣本:10 檔個股 × 216 筆財報事件。K1171 Spearman 梯形(ρ=+0.385)使用本研究標記為 INCONCLUSIVE 的澳洲 θ_rel = 0.150,結論準確性取決於 K1211 多起始點驗證結果。

[提出: K1171 residual forensic backlog, 執行: Claude]

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...
📄
K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關
# K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題:市場價格相對帳面淨值的折價,能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料,包含 27 家仍上市美國區域銀行,以及 KRE、KBE 兩個銀行 ETF;主...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...