← 研究動態
研究2026/05/24 下午03:07

顯著性消失了?HAC 修正下的時變參數重新檢定

方法論HAC半導體顯著性自相關滾動回歸統計嚴謹

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

顯著性消失了?HAC 修正下的時變參數重新檢定

一、為什麼要重做一次「已經顯著」的檢定?

實證研究最常見的反派不是「資料造假」,而是 自己騙自己 。同一份數據,用看似合理但隱含瑕疵的統計方法跑一遍,往往能得到漂亮但脆弱的結論;換成更嚴格的標準再跑一遍,結論就化為烏有。本次實驗 K1140 正是這樣的反思演習:我們把先前 K1114 已經宣稱「達顯著水準」的三項時變參數結果,全部以 HAC(Newey–West)穩健標準誤、區塊置換 Spearman、以及區塊自助法重做一遍,看看在合理的自相關修正下還剩下什麼。

故事要從 K1114 說起。該實驗用滾動視窗(window=500 個交易日,step=21 個交易日)估計多重 GARCH 方程式中盈餘公告變異效應(earnings-announcement variance, EAV)的時變係數 θ_EAV,得到台積電(TSMC)、聯電(UMC)、聯發科(MediaTek)三檔半導體股票各自一條 θ_EAV 時間序列(128/132/124 個觀察點)。對這三條序列分別做了三類檢定(線性趨勢、與 VIX 之相關、VIX 高低區制差異),九個假設檢定中有三項通過 BH–FDR 多重檢定校正:UMC 的趨勢、MediaTek 的趨勢、TSMC 的區制差異。

問題出在 樣本獨立性假設 。滾動視窗每次往前推進 21 天,但視窗本身寬達 500 天,意味著相鄰兩個 θ 估計值共用 479/500 ≈ 96% 的觀察值。這種高度重疊讓 θ 序列具有強烈正自相關(事後測得各檔的 lag-1 ACF 分別為 0.308、0.366、0.469),普通最小平方法(OLS)的標準誤公式假設誤差項彼此獨立、在這種設定下會嚴重低估真實標準誤,也就是說,OLS 報出來的統計強度被自相關「灌水」了。粗估有效獨立樣本數約為觀察數除以視窗對 step 比例(500/21 ≈ 24),等效樣本只有 5–6 個,而非 124–132 個。

K1114 的 README 自我質疑段已經誠實地把這個 caveat 寫了出來。K1140 就是把那個 caveat 從註腳變成正式檢定,看看 K1114 的三個「達顯著水準」是否禁得起自相關修正。

二、資料來源

  •  實驗紀錄 :experiments/k1140/(README、結果 JSON、三張診斷圖、執行腳本)
  •  θ_EAV 序列來源 :experiments/k1114/k1114_results.json 的 per_stock_results[*]['theta2_series'],TSMC 128 個、UMC 132 個、MediaTek 124 個滾動點
  •  底層日資料 :台積電(2330.TW)、聯電(2303.TW)、聯發科(2454.TW)日報酬率,VIX 平方項,搭配台股盈餘公告日歷
  •  滾動視窗設計 :window=500 個交易日,step=21 個交易日,估計起點 2014 年初、終點 2025 年底
  •  計算工具 :自行實作 Newey–West HAC 標準誤、區塊置換(block=24, n_perm=5000)、區塊自助法(block_size=24, n_boot=5000),固定 seed=42

整個實驗 完全沿用 K1114 已產生的 θ 序列、不重新跑 GARCH 估計 ,所以 K1140 是純粹的「事後分析」(retrospective analysis),沒有策略回測、沒有未來資訊滲漏(lookahead)。需要釐清一點:K1114 在每個滾動視窗內做的回歸都只用該視窗截止時點之前的歷史資料,也就是說「θ_t 來自 t 之前 500 日」,θ 序列本身已經是「過去資訊」的函數;K1140 對這條既有序列做趨勢檢定,無論 OLS 或 HAC 都是橫切面意義上的檢定, HAC 的修正只動標準誤、不動估計值,因此完全不影響資料時序意義上的因果方向 。換句話說,自相關修正不會引進也不會排除 lookahead,這部分由 K1114 的滾動視窗設計就已經處理乾淨。

三、方法:三層遞進的嚴格度

K1140 設計了三層由寬鬆到嚴格的檢定,刻意讓「方法論的嚴格度」這條軸線本身成為實驗變數:

  1.  Layer 1:Newey–West HAC 標準誤 。針對每檔股票的 θ 序列做線性趨勢回歸,但用 Bartlett 核截斷的 HAC 標準誤取代 OLS 標準誤。lag 長度 L 取三個值對照:L=5(經驗式 floor(4·(T/100)^(2/9)),太短,僅作對照)、L=24(保守,覆蓋一個視窗重疊週期)、L=48(極保守,覆蓋兩個重疊週期)。我們把 L=24 視為主要結果。
  2.  Layer 2:區塊置換 Spearman 。把 θ 序列以 block=24 切塊、隨機重排 5000 次,從零分布直接讀 p 值,避開 Spearman 漸近分布在自相關下失效的問題。
  3.  Layer 3:KS 區制檢定 + 有效樣本數通縮 。Kolmogorov–Smirnov 統計量本身是分配層次比較,相對穩健;但對應 p 值原本假設 n 個獨立觀察,我們把 n 除以 24 作為「有效樣本數」重算 KS 分配 p 值,把重疊膨脹的影響打回去。

外加最嚴格的  Layer 4:區塊自助法趨勢檢定 。HAC 假設殘差自相關呈 Bartlett 幾何衰減,若 θ 序列存在結構性曲度(不只是 AR(1) 雜訊),HAC 仍可能持續低估標準誤。區塊自助法把 θ 切成 block_size=24 的塊、整塊重抽 5000 次重做回歸,由模擬零分布直接讀 p 值,是高重疊場景下的黃金標準。

九個 p 值(HAC L=24 趨勢×3 + 區塊置換 Spearman×3 + KS 有效樣本×3)統一以 Benjamini–Hochberg 校正多重檢定,並依 HLZ (2016) 嚴格統計建議以 BH-adj 達顯著水準(顯著性低於 0.05) 作為通過門檻。

四、結果:HAC 一加上去,光環就掉了一半

下表是核心數字(slope 為單位 step 之斜率),讀者可以直接感受 OLS 與 HAC 之間的落差:

股票OLS 統計強度HAC L=5HAC L=24HAC L=48區塊自助法
TSMC1.75(不顯著)0.840.760.880.80
UMC3.06(顯著性 p≈0.003)2.172.453.321.91
MediaTek4.51(顯著性 p≈1.5e-5)3.854.335.391.75

幾個直覺要先建立:

  •  TSMC 從一開始就不穩 :OLS 統計強度只有 1.75,本來就在門檻以下;HAC 後直接掉到 0.76–0.88,趨勢假設徹底死亡。
  •  UMC 從強到弱 :OLS 統計強度 3.06、達顯著水準(p≈0.003),看似強勁;HAC L=24 降到 2.45,達顯著水準(p≈0.014)但 BH 校正後達到 0.065、卡在 0.05 門檻外;區塊自助法再降到 1.91,徹底失守。
  •  MediaTek 的最戲劇性 :OLS 統計強度高達 4.51、達顯著水準(顯著性 p≈1.5e-5),HAC L=24 還在 4.33(顯著性 p≈1.5e-5),看似最頑強的訊號;但 區塊自助法一加,統計強度從 4.33 崩到 1.75,達顯著水準從極小躍升到 0.061 ——直接被打回不顯著。

把九個檢定一起放進 BH–FDR 校正,不同層的存活情況:

  • HAC L=5: 1/9 通過 (MediaTek 趨勢,BH-adj p≈0.001)
  • HAC L=24(主要結果): 1/9 通過 (MediaTek 趨勢,BH-adj p≈1.4e-4)
  • HAC L=48: 2/9 通過 (UMC 趨勢、MediaTek 趨勢;但這個結論不可信,原因見下)
  •  區塊自助法(最嚴格):0/9 通過 

最後一行才是真正的判決。L=48 之所以反常地讓更多訊號「復活」,是因為長 lag 截斷在小樣本下標準誤估計變得極不穩定、有可能被低估而非校正,這也是為什麼方法論教科書建議在高重疊滾動回歸上不要單純依賴 HAC。區塊自助法直接從序列結構模擬零分布、不靠 Bartlett 衰減假設,得到的 p 值最值得信賴。

K1114 原本的三項顯著性結果(UMC 趨勢、MediaTek 趨勢、TSMC 區制)在嚴格修正下 全部消失 :

  •  TSMC 區制 KS :原本達顯著水準(p≈0.009),有效樣本通縮後 p 趨近 1.0,幾乎完全由重疊觀察膨脹而來
  •  UMC 趨勢 :HAC L=24 後達顯著水準(顯著性 p≈0.014)、BH 校正後 0.065、區塊自助法 0.021、BH 校正後 0.191, 系統性衰退 
  •  MediaTek 趨勢 :HAC L=24 仍達顯著水準(顯著性 p≈1.5e-5)、區塊自助法達顯著水準(顯著性 p≈0.061), 最後一層才崩 

五、三張診斷圖怎麼讀

HAC vs OLS 統計強度比較

第一張圖把 OLS 與 HAC L=5/24/48 三個版本的趨勢統計強度並排呈現。TSMC 永遠在低空盤旋;UMC 從 OLS 的 3+ 降到 HAC L=24 的 2.45、再升到 L=48 的 3.32(注意這是 lag 截斷在小樣本下不穩的徵兆,不是訊號變強);MediaTek 三個 HAC 版本都看起來很穩定地維持在 4 附近,但別被騙了,這是 HAC 仍假設衰減型自相關的副作用。

HAC 對 lag 長度 L 的敏感度

第二張圖把 lag 長度 L 從 1 拉到 60,畫出 HAC 標準誤、統計強度隨 L 變化的軌跡。理想情況下 L 在合理範圍內統計強度應該相對平坦;本次三檔股票統計強度隨 L 變化都不平坦,暗示 Bartlett 核並未完全捕捉序列結構。這正是為什麼我們追加區塊自助法,它不依賴衰減假設。

θ 時間序列與趨勢線

第三張圖是三檔股票的 θ_EAV 滾動序列加 OLS 趨勢線。眼睛看起來「好像有趨勢」是滾動回歸的視覺陷阱,序列被高度重疊平滑化後,連雜訊都看起來像訊號。這張圖本身就是研究誠實原則的最佳教材:不要用眼睛下結論。

六、結論:負面結果也是好結果

K1140 給出的最終裁決是冷靜的:在嚴格的自相關修正下,K1114 的三項「達顯著水準」結論全部站不住腳。三檔半導體股票的 θ_EAV 平均水準(TSMC 接近 0、UMC 為正、MediaTek 為負)作為 點估計 仍然真實,但「時間趨勢」、「VIX 區制差異」、「Spearman 相關」 都沒有 達到嚴格統計門檻。

這個結果對相關論文線(Paper 2 的盈餘公告變異效應跨產業/跨時間異質性)的意義很直接:橫斷面與時間序列雙雙無顯著差異。研究方向必須誠實面對「沒有可被嚴格檢定拒絕的異質來源」這個事實,而不是換個檢定再湊一個顯著。

更通用的教訓有三條:

  1.  OLS 在自相關下會誇大顯著性 。滾動回歸、移動平均、共享窗口的設計幾乎都有這個問題;不做修正就直接報統計強度等於主動誤導讀者。
  2.  HAC 是必要不充分條件 。Newey–West 是改善 OLS 的第一步,但在高重疊與曲度結構下仍可能低估標準誤;嚴肅的決策應追加區塊自助法。
  3.  負面結果比假性正面更有價值 。研究誠實原則的核心,就是承認「方法不夠嚴格時看到的訊號可能是雜訊」。K1114→K1140 的修正路徑,就是把這個原則具體執行給自己看。

讀者下次看到任何一篇研究宣稱「滾動回歸顯示 X 有顯著時變」的時候,請先問三個問題:相鄰估計重疊多少?標準誤有沒有 HAC 修正?有沒有更嚴格的區塊自助法當 sanity check?三題都答得出來,再考慮要不要相信那個結論。

參考文獻

  • Newey, W. K., & West, K. D. (1987). A Simple, Positive Semi-definite, Heteroskedasticity and Autocorrelation Consistent Covariance Matrix. Econometrica, 55(3), 703–708.
  • Politis, D. N., & Romano, J. P. (1994). The Stationary Bootstrap. JASA, 89(428), 1303–1313.
  • Benjamini, Y., & Hochberg, Y. (1995). Controlling the False Discovery Rate. JRSS B, 57(1), 289–300.
  • HLZ (2016): 嚴格統計, C. R., Liu, Y., & Zhu, H. … and the Cross-Section of Expected Returns. RFS, 29(1), 5–68.

 實驗:  K1140(前身 K1114;相關 K1067、K1109、K1113)  樣本期:  2014 年初至 2025 年底  滾動設計:  window=500、step=21;θ_EAV 序列共 128(TSMC)/ 132(UMC)/ 124(MediaTek)個點

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...
📄
K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關
# K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題:市場價格相對帳面淨值的折價,能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料,包含 27 家仍上市美國區域銀行,以及 KRE、KBE 兩個銀行 ETF;主...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...