← 研究動態
研究2026/04/13 下午08:03

Paper 2 完整 7 實驗 Null Arc:Pre-Registration 如何終結 Fabless 假說

Taiwanmethodologynull-resultA4fEAVPaper_2pre-registrationcherry-pickfirm-selection

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

摘要

[提出: 賴奕豪,執行: Claude]

本文報告 Paper 2「個股 EAV 篩選規則」路線的完整實驗歷程(K1067→K1113,共 7 個實驗)。這條研究路線試圖回答一個核心問題: 哪些台股公司能從財報事件驅動波動率模型(A4f-EAV)中獲益?  最終答案是:我們找不到任何可觀測的公司特徵能預測 EAV 增益,但過程中揭示了一個更重要的方法論教訓—— Cherry-pick artifact 如何把 p=0.278 的 null result 偽裝成 p=0.004 的顯著發現 ,以及 pre-registration 如何系統性拆穿這個假象。


一、背景:A4f-EAV 模型與研究動機

A4f-EAV(Asymmetric Four-Factor with Earnings Announcement Volatility)是一個將財報公告日作為外生衝擊的 GJR-GARCH 延伸模型。其核心假設是:財報發布後的隔日(T+1),市場不確定性急劇上升,傳統 GARCH 模型低估了此段時間的波動率水準。A4f-EAV 透過在 GARCH 方程中加入財報事件指示變數 ItEAVI_t^{EAV},捕捉這種結構性跳躍:

aut=heta0+heta1rUS,t12+heta2ItEAV au_t = heta_0 + heta_1 r_{US,t-1}^2 + heta_2 I_t^{EAV}

其中 heta2>0 heta_2 > 0 代表財報事件顯著墊高長期波動率分量(long-run component),heta2<0 heta_2 < 0 則意味著模型在財報日周圍反而「過度修正」(over-correction)。

早期在 ETF 層面(0050.TW)的測試雖有描述性發現,但 K1064 已證實個股 EAV 信號無法轉化為 ETF 層面的預測增益(Descriptive ≠ Predictive)。Paper 2 的研究路線因此轉向: 直接在個股層面測試,並嘗試歸納「哪類公司有效」的選股規則。 


二、初步試驗:從 TSMC 的 Null 開始(K1067)

研究以台積電(2330.TW)作為起點。TSMC 是 0050.TW 最大成分股(權重約 35%),財報公告的市場影響力理論上最大。然而結果令人意外:

  •  OOS 期間 (2019-2025):A4f vs A4f-EAV,DM t=0.348,p=0.728,方向上 A4f 略優(EAV 惡化 QLIKE -0.07%)
  •  事件窗口(T+1) :DM t=0.083,p=0.935,完全無顯著差異
  •  heta2 heta_2 分佈 :mean=-4.5×10⁻⁴,正值比例 59%,t-vs-zero=-1.68,不穩定

TSMC 的機制解讀:TSMC 全球機構法人比例極高(外資持股>70%),財報資訊早已充分定價於選擇權隱含波動率;EAV binary indicator 沒有增量預測力。


三、看似突破:UMC 的 +39% 改善(K1067b)

研究隨即轉向聯華電子(2303.TW),台灣第二大晶圓代工廠,機構持股較低、財報驚喜效應可能更大。結果截然不同:

  •  事件窗口(T+1)改善 :QLIKE 從 1.990 降至 1.209, 改善幅度 +39.27% ,DM t=-2.20,p=0.036(顯著)
  •  heta2 heta_2 分佈 :mean=+6.6×10⁻⁴,正值比例  100% ,one-sample t=15.43,p=6.7×10⁻¹⁵(極顯著)
  •  非事件日 :DM p=0.873,完全無差異(EAV 信號精準定位於財報窗口)

初步結論令人振奮: 代工廠(foundry)似乎比大型科技股更能受益於 EAV 。


四、第一個裂縫:MediaTek 的反方向結果(K1067c)

為測試「fabless(無晶圓廠設計)公司是否不同於 foundry」,研究納入聯發科(2454.TW)。然而:

  •  事件窗口(T+1) :EAV  惡化  QLIKE -23.46%(A4f 從 1.458 → A4f-EAV 達 1.800),DM t=+1.588,p=0.124
  •  heta2 heta_2 分佈 :mean=-9.3×10⁻⁴,正值比例  19% ,bootstrap 95% CI=[-1.83×10⁻³, -1.76×10⁻⁴],顯著負向
  •  Monotonicity FAIL :若「foundry benefit」假說成立,fabless 應接近零,但實際是反向顯著負值

問題随之而來: 為什麼同樣是台灣科技股,foundry 和 fabless 的 EAV 反應方向截然相反?  這是真實的公司異質性,還是只是噪音?

K1103 隨後確認 τ-lag bug 修正後三家公司的結果基本穩定(final verdict: UMC event |t|≥2 after fix)。


五、表象上的確認:N=24 截面回歸與「顯著」的 fabless(K1104)

為系統化測試,K1104 擴展至 24 家 0050.TW 成分股,執行公司特徵對 heta2 heta_2 的截面回歸:

heta2,i=α+β1extfoundryi+β2extfablessi+β3log(extmktcapi)+εi heta_{2,i} = \alpha + \beta_1 \cdot ext{foundry}_i + \beta_2 \cdot ext{fabless}_i + \beta_3 \cdot \log( ext{mktcap}_i) + \varepsilon_i

 結果 :fabless dummy 係數 β=-9.61×10⁻⁴,t=-2.215, p=0.039(顯著) ,支持「fabless 公司的 EAV 效應為負」。

此時整個故事看似已成立:foundry 正向、fabless 負向、市值負向,一個優雅的分類規則。


六、Cherry-Pick 的引誘:K1106b 的陷阱(p=0.004 ***)

K1106b 在 K1104 基礎上進一步「精煉」:手工挑選 7 個 sector 各 1-3 家公司(N=14),重點測試跨 sector 異質性。 *ANOVA F(6,5)=6.87,p=0.026;fabless dummy 係數 β=-2.29×10⁻³,p=0.004 **  這是整個路線中最強的統計信號。

然而這裡埋藏了一個致命的設計缺陷,被 E052 記錄為「 Cherry-pick bias 」:

K1106b 在 fabless sector 只納入了 MediaTek(K1067c 已知 heta2<0 heta_2<0)和 Realtek(同樣負值), 系統性排除了 K1104 中 fabless 公司中 heta2>0 heta_2>0 的個案 。這等同於先看結果、再選樣本,用「已知的負值例子」反覆確認同一個負向信號。

更關鍵的問題: N=14,dof=5 ——這個樣本在統計上完全無法識別 7 個 sector dummy 加 2 個連續協變數的模型。p=0.004 的強信號,有多少是來自真實的 sector 效應?

Cherry-Pick vs Pre-Registration:Fabless β 估計對比

圖 1:K1106b(手選樣本)vs K1109(隨機樣本)的 fabless dummy 係數估計。|β| 衰減 46%,p 值從 0.004 放大到 BH 校正後 0.278——相差 70 倍。


七、Pre-Registration 的反擊(K1109)

為嚴格測試 K1106b 的結論,K1109 採用 事前登記(pre-registration) 設計:

  1.  樣本鎖定於結果估計前 :pre_registration.locked_at_utc=2026-04-13T05:27:36Z,commit 4c59a41a 記錄 prereg_sample.json,時間戳先於所有 Stage 1 估計
  2.  隨機抽樣 :每個 sector 用 numpy.random.default_rng(seed=42) 隨機抽取 4-5 家,N=31(8 sectors)
  3.  多重比較校正 :所有 p 值均通過 BH-FDR(Benjamini-Hochberg)校正

 結果(全部 NULL): 

檢驗統計量原始 p 值BH-adj p 值結論
ANOVA H1(joint F-test)F(7,20)=1.310.297REJECTED
fabless dummy H2β=-1.23×10⁻³,t=-2.200.040 0.278  REJECTED 
shipping H3(CI 包含 0)CI=[-3.6×10⁻⁵, 2.5×10⁻⁴]PASS(信號為零)

 K1106b fabless p=0.004 完全是 sampling artifact:  在控制多重比較後,同一假設的 BH 校正 p=0.278,遠超 0.05 門檻。β 幅度從 -2.29×10⁻³ 衰減至 -1.24×10⁻³(46% 下降),p 值放大超過 11 倍。

7 實驗完整 Null Arc:從個股試驗到 Pre-Registration 終結

圖 2:7 個實驗的假設支持強度時間線。K1067b 的暫時成功和 K1106b 的 cherry-pick artifact 在 K1109 pre-registration 設計下完全瓦解,最終以 K1113 的全面 null 收尾。


八、終局:Firm-Level 協變數也無法預測(K1113)

既然 sector 類別無法區分「有效」vs「無效」公司,K1113 轉向連續型協變數,測試 6 個可觀測的公司特徵:

協變數假說方向βHC1 p 值BH-adj p 值
log_mktcap(市值)H2: β<0-1.10×10⁻⁴0.6820.854
beta_rolling_0050(系統風險)-8.96×10⁻⁵0.7460.854
earnings_freq_per_year(財報頻率)+5.72×10⁻⁵0.6230.854
log_avg_volume(成交量)+1.98×10⁻⁴0.2390.854
price_volatility(股價波動度)H3: β>0+3.28×10⁻⁵0.8540.854
ind_momentum(產業動能)-5.81×10⁻⁵0.5980.854

 5/5 假設全部 FAIL: 

  • H1(至少一個 BH 存活):min BH-adj p=0.854, 無任何存活 
  • H2(市值負向):β<0 但 p=0.682, FAIL 
  • H3(波動度正向):方向正確但 p=0.854, FAIL 
  • H4(5-fold CV R²>0):CV R²= -0.661 , FAIL ——模型比純截距項預測還差
  • H5(Tier A≥3家):Tier A 家數= 0 , FAIL 

K1113:6 個協變數 BH 校正 p 值

圖 3:K1113 各協變數的原始 HC1 p 值與 BH-FDR 校正後 p 值。最小的 raw p=0.239(成交量),BH 校正後全部收斂至 0.854。CV R²=-0.661 表示截面模型沒有任何超出截距的解釋力。


九、完整實驗總表

實驗標的/設計核心結果最終判定
K1067TSMC 單檔 A4f-EAV事件窗口 DM p=0.935,θ₂不穩定NULL
K1067bUMC 強信號試驗事件窗口 QLIKE+39.27%,DM p=0.036PASS(但 n=1)
K1067cMediaTek T+1θ₂=-9.3×10⁻⁴,反方向,monotonicity FAILFAIL
K1103三家 τ-lag bug-fixUMC 穩定,bug 影響輕微穩定性確認
K1104N=24 截面回歸fabless p=0.039 *,foundry 不顯著弱信號(白噪異方差問題)
K1106bN=14 手選 7 sectorsfabless p=0.004 * **,ANOVA F(6,5)=6.87** Cherry-pick artifact**
K1109N=31 Pre-Reg 隨機樣本ANOVA F(7,20)=1.31 p=0.297;fabless BH-adj p=0.278 NULL(確認性) 
K11136 firm-level 連續協變數5/5 FAIL,CV R²=-0.661,Tier A=0 NULL(確認性) 

十、對未來研究的啟示

 A4f-EAV 在 pooled level 有 signal,但 heterogeneity 不可解釋。 

本路線的終結並不意味著 EAV 概念無效——UMC 的 +39% 改善是真實的,pooled 層面也有統計信號。但這個增益的來源無法被任何可觀測的公司特徵所捕捉。

可能的原因包括:

  1.  需要私有數據 :散戶持股比例(非公開)、管理層溝通品質、分析師分散度(高頻更新的隱含波動率)
  2.  財報意外性的非線性 :earnings surprise 的量級和方向(非二元 binary)可能是真正的調節變數
  3.  時變異質性 :某家公司在某段時間有效,但無法事前預測

 Null result 本身是 contribution:  它告訴未來研究者不需要走同一條路,節省了寶貴的資源;同時它確認了 pre-registration 作為防止 cherry-pick 的必要方法論工具。在整個 7 實驗路線中,若沒有 pre-registration(K1109)和獨立確認(K1113),研究者可能會帶著 p=0.004 的「顯著結論」撰寫論文,卻完全沒有意識到那只是一個 sampling artifact。


局限性

  1.  樣本來源 :0050.TW 成分股偏向大型藍籌,不代表全市場
  2.  財報公告日數據 :來源為用戶提供的 財報公告日.txt(2,411 公司,158,674 筆),未與 TEJ 交叉驗證
  3.  OOS 期間 :2019-2025,含 COVID-19(2020)和台積電超級週期(2023-2024),異質性可能影響截面回歸穩定性
  4.  二元 EAV indicator 的侷限 :使用 0/1 二元變數,未考慮財報意外量級(earnings surprise magnitude)

數據來源:yfinance(日頻股價,auto_adjust=True)+ 財報公告日.txt(用戶提供) 實驗腳本:experiments/k1067/experiments/k1067b/experiments/k1067c/experiments/k1103/experiments/k1104/experiments/k1106b/experiments/k1109/experiments/k1113/ 結果數據:各實驗目錄下的 *_results.json

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
K1422:HAR 分位數迴歸在三種公平 Baseline 比較下的商品 ETF 尾部風險預測
# K1422:HAR 分位數迴歸在三種公平 Baseline 比較下的商品 ETF 尾部風險預測 **實驗 ID**:K1422 **修正前身**:K1402 / K1403 / K1421(方法論缺陷版本,已撤回正式結論) **資產**:GLD(黃金 ETF)、USO(原油 ETF)、UNG(天然氣 ETF) **資料期間**:2012-01-03 至 2026-06-05(OH...
📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...
📄
K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關
# K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題:市場價格相對帳面淨值的折價,能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料,包含 27 家仍上市美國區域銀行,以及 KRE、KBE 兩個銀行 ETF;主...