← 研究動態
一般讀者2026/06/19 上午04:00

把上一個實驗再算一次,原本的『顯著』就不見了

方法論半導體顯著性自相關滾動回歸統計嚴謹

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

把上一個實驗再算一次,原本的「顯著」就不見了

一、上次到底發現了什麼?

幾個月前我們做過一個實驗,想看半導體三檔股票(台積電、聯電、聯發科)在「公布盈餘的那段時間,股價波動會不會特別大」這件事,有沒有隨著年份慢慢變化。

當時結果看起來很漂亮。九個檢定有三個過關:聯電的趨勢過了、聯發科的趨勢過了、台積電的高低波動環境差異也過了。三個顯著結論,看起來像是抓到了半導體業特有的故事。

但上次實驗的紀錄裡有一段自我懷疑:那個檢定有沒有作弊?這次重做就是把那段懷疑拿出來正面對決。

二、為什麼要懷疑?

上次用的方法叫「滾動回歸」。想像拿一張 500 天寬的窗框,每次往前推 21 天,看一個新的波動參數值。

問題在這裡:窗框寬 500 天,每次只推 21 天。下一格的 500 天裡,有 479 天和上一格重複,重疊率高達 96%。

窗框幾乎沒動,算出來的兩個值會非常像。對統計來說,那代表「兩個值之間有關聯」,叫做「自相關」。

標準的統計公式假設「每個觀察值彼此獨立」。把高度自相關的數據塞進去,公式會以為自己看了 128 個獨立樣本,其實只看了大約 5、6 個。樣本看似很多,可信度卻像只有 5、6 個。

可能的結論:原本「3 個顯著」也許只是這個假象造出來的。重做這次實驗要做的,是換更嚴格的標準,看看原本的結論還剩下什麼。

三、資料來源與方法

  •  波動參數來源 :上次實驗的滾動視窗時間序列(台積電 128 點、聯電 132 點、聯發科 124 點)
  •  底層日資料 :三檔股票 2014 到 2025 的日報酬率、VIX 指數
  •  隨機種子 :固定 seed=42(所有隨機過程都鎖死,方便他人重現)

這次完全沿用上次已經算好的序列,沒有重新跑模型估計。所以這是純粹的事後分析,跟未來資訊外流的風險無關。

我們用四個由寬到嚴的層次重新檢定:

  •  自相關修正版的標準誤 :把標準誤公式換成考慮自相關的版本。lag 長度設 5、24、48 三個對照值,看結論穩不穩。
  •  區塊置換版的相關係數 :把序列切成 24 天一塊,隨機重排 5000 次,從重排結果直接讀 p 值。
  •  有效樣本通縮的分配差異檢定 :把樣本數除以重疊倍數,重新算 p 值。
  •  區塊重抽版的趨勢檢定(最嚴格) :把序列切成 24 天一塊,整塊重抽 5000 次,由模擬分布直接讀 p 值。

第四層是「黃金標準」。它不假設自相關長什麼形狀,直接從資料本身的結構估計變異。一個結論連這層都過得了,可信度才算夠硬。

四、結果:三個顯著一個都沒留下

下表是核心數字。t 統計量越大代表訊號越強,過 2 算是基本門檻:

股票原本標準修正 lag=5修正 lag=24修正 lag=48區塊重抽
台積電1.750.840.760.880.80
聯電3.062.172.453.321.91
聯發科4.513.854.335.391.75

三個直觀的觀察:

 台積電 :原本就只有 1.75,本來就在 2 以下。修正後掉到 1 以下,趨勢假設徹底死亡。

 聯電 :原本 3.06 看起來很強。修正主要結果(lag=24)降到 2.45,雖然單獨還算過關,但九個檢定合在一起做多重檢定校正後,p 值 0.065,卡在 0.05 門檻外面。再加上區塊重抽,降到 1.91,徹底失守。

 聯發科 :原本 4.51 是最強的訊號,修正 lag=24 還在 4.33 撐住。區塊重抽一加,從 4.33 直接崩到 1.75,跟一開始原本標準的台積電同水準。

把九個檢定一起做多重檢定校正,不同層的結果:

  • 修正 lag=5:九個檢定剩一個過
  • 修正 lag=24(主要結果):九個檢定剩一個過(聯發科趨勢)
  • 修正 lag=48:九個檢定剩兩個過(小樣本下 lag=48 估計不穩,這個結果不可信)
  •  區塊重抽(最嚴格):九個檢定全軍覆沒 

最後一行是真正的判決。lag=48 看起來反常地讓更多訊號「復活」,是因為 lag 截斷太長、小樣本下公式本身會變不穩定,可能反向低估標準誤。區塊重抽不靠那個假設,得到的 p 值最值得信任。

至於台積電原本最漂亮的「高低波動環境差異」,把樣本數除以重疊倍數重算之後,p 值飆到接近 1.0。代表訊號幾乎完全是 96% 重疊製造出來的假象。

五、三張診斷圖怎麼看

自相關修正與原本標準的統計強度比較

第一張圖把原本標準和三個修正版的 t 統計量並排。台積電低空盤旋;聯電從原本的 3+ 一路降;聯發科三個修正版看似穩定在 4 附近,但修正版仍假設衰減型自相關,那個「穩定」其實是公式的副作用,不是訊號真的強。

修正版對 lag 長度的敏感度

第二張圖把 lag 長度從很短一路拉到接近半個樣本的水準。理想情況下 t 統計量應該在合理範圍內相對平坦。三檔都不平坦,代表衰減假設沒抓到序列真正的結構。所以我們追加區塊重抽,它不依賴衰減假設。

波動係數時間序列與趨勢線

第三張圖是三檔股票的波動係數滾動序列加趨勢線。眼睛看起來「好像有趨勢」是視覺陷阱:序列被高度重疊平滑化後,連雜訊都看起來像訊號。圖本身就是研究誠實原則的具體示範:不要憑眼睛下結論。

六、給一般讀者的三個重點

 第一 :滾動回歸這種「窗框幾乎沒動」的做法,產生的數字會自帶強烈自相關。用標準公式直接算 p 值,會誇大訊號強度。原本「顯著」可能只是公式假設沒成立。

 第二 :自相關修正是必要不充分。改善標準誤是第一步,能處理一般程度的自相關。遇到高重疊滾動回歸的極端情況,修正自己也撐不住,需要再加區塊重抽才算嚴肅。

 第三 :負面結果是好結果。上次的三個顯著全部消失,代表那條研究路線走不通。半導體三檔股的盈餘公告波動效應,在時間維度上沒有可被嚴格檢定確認的差異。誠實面對這個結果,比再換一個檢定湊一個顯著有價值。

對相關論文線(探討盈餘公告波動效應的跨產業、跨時間差異)的意義很直接:橫斷面與時間序列雙雙無顯著。研究方向會調整成「在嚴格控制後找不到系統性的差異來源」這個誠實版本。

下次看到任何研究宣稱「滾動回歸顯示某參數有顯著時變」,先問三個問題:

  • 相鄰估計重疊幾趴?
  • 有沒有自相關修正?
  • 有沒有區塊重抽當守門員?

三題都答得出來,再考慮要不要相信那個結論。

參考文獻

  • Newey, W. K., & West, K. D. (1987). A Simple, Positive Semi-definite, Heteroskedasticity and Autocorrelation Consistent Covariance Matrix. Econometrica, 55(3), 703-708.
  • Politis, D. N., & Romano, J. P. (1994). The Stationary Bootstrap. JASA, 89(428), 1303-1313.
  • Benjamini, Y., & Hochberg, Y. (1995). Controlling the False Discovery Rate. JRSS B, 57(1), 289-300.

 樣本期 :2014 到 2025 年  滾動設計 :window=500、step=21;波動係數序列共 128(台積電)、132(聯電)、124(聯發科)個點

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
商品 ETF 的方向對了一半,可惜統計撐不住:波動分高低之後的動能 vs 反轉拼圖
商品市場的學界研究這兩年冒出一個新講法:短期的反轉跟動能其實同時存在,誰贏要看當下的波動高低。波動高的時候反轉壓過動能,波動低的時候動能壓過反轉。 聽起來很合理。趨勢交易圈裡這也是常識:行情急的時候追高會被打臉,行情慢的時候趨勢能跑很久。 我們把這個猜想搬到 6 個常見商品 ETF 上實際算。樣本是 2010 年 1 月到 2026 年 6 月,黃金、白銀、原油、天然氣、銅、廣義商品籃,週和月...
📄
VIX 只有十幾點,選擇權市場卻在偏心加價:偏斜三讀法,讀懂它正替誰的恐懼定價
# VIX 只有十幾點,選擇權市場卻在偏心加價:偏斜三讀法,讀懂它正替誰的恐懼定價 上半年結束,大盤氣氛看起來很鬆。VIX 停在十幾點的低檔,最近一次留在檔案裡的讀數是 18.4(2026 年 6 月 27 日)。同一段時間,標普 500 前五大成分股的權重合計衝上 32.8%,比 2020 年初的 17.8% 整整高了 15 個百分點。 指數集中在少數幾檔股票手上,波動率卻壓在低檔,這個組合...
📄
蘋果一週跌 4.8%、波動跳 2.3 倍;NVDA 跌 8.6% 卻反而最低 — AI 硬體股的兩種定價
# 蘋果一週跌 4.8%、波動跳 2.3 倍;NVDA 跌 8.6% 卻反而最低 — AI 硬體股的兩種定價 上週五(2026-06-26)收盤,AAPL 報 192.53,五天跌 4.78%,這段期間的年化已實現波動率衝上 53.7%,是過去 30 天平均 29.7% 的 1.81 倍,把窗口收窄到「最近五天 vs 前 25 天」的話更誇張,**比值 2.32**,是這份名單裡最高。同一週裡 ...