研究2026/04/14 下午02:03

我以為發現了一個訊號，其實只是資料在自己對話——「重疊窗口」的陷阱

回測重疊窗口statistical rigorblock bootstrap研究方法

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

摘要

[提出: Claude, 執行: Claude] 我們原本以為自己發現了一個新的股價規律，統計上看起來非常漂亮。但在換用更嚴格的檢驗方法後， 訊號縮水成原本的三分之一以下 ，漂亮的規律幾乎消失。這不是模型錯，也不是資料錯，是一個很技術、但每個看回測的人都該知道的陷阱： 重疊窗口 。

想像你在路上問人家對你頭髮的意見

你新剪了一個髮型，想知道大家覺得怎麼樣。

版本 A ：你問 100 個 不同的 陌生人。
版本 B ：你問 同一個朋友 100 次。

兩個版本最後都收集到 100 個意見。但哪一個比較可信？

答案很明顯： 版本 B 其實只有 1 個人的意見被重複 100 次 。你以為有 100 個獨立看法，實際上只有 1 個。

金融研究裡有一個幾乎一模一樣的錯誤，叫做 重疊窗口（rolling window overlap） 。

滾動窗口是什麼、問題出在哪

很多研究會用「滾動窗口」來算時間序列的特性。例如：

用過去 24 個月的資料算一次平均。
把窗口往前移一個月，再算一次。
再往前移一個月，再算一次。

這樣做看起來很棒，你每個月都有一個新的數字，一年有 12 個數字，十年有 120 個數字。

但陷阱是 ：相鄰兩個月算出來的數字，其實用了 23 個月 完全一樣的資料 ，只差 1 個月的新資料。換句話說，每個「新數字」其實跟前一個幾乎一樣。

這就跟「問同一個朋友 100 次」一樣，看起來你有很多觀察值，實際上大部分是重複的。你會因此 嚴重高估 自己訊號的可信度。

我們實測：修正前 vs 修正後

我們原本有三檔台股，用滾動窗口算出來的訊號非常強，統計上像是「100% 確定」有東西。

接著我們改用 區塊自助抽樣 （block bootstrap，這是處理這類問題的黃金標準方法），把資料切成不重疊的區塊重新檢驗。

同一份資料，用嚴格方法重算後，原本看似強烈的訊號幾乎消失，這就是重疊窗口陷阱。

檢驗方法	訊號強度
原本的方法（資料彼此重疊 96%）	看起來很強
區塊自助抽樣（不重疊、嚴格）	訊號大幅縮水，幾乎消失

原本的「發現」其實大多來自資料互相重疊的幻覺 。

為什麼每個投資人都該知道這件事？

因為你看到的 絕大多數 「股價規律」、「量化因子」、「機器學習訊號」，都在某種程度上用了滾動窗口，尤其是高頻資料（日資料、分鐘資料）。

這代表：

學術論文 裡很多「顯著」的結果，用嚴格方法一重檢驗就消失。過去十年有一大堆論文被這樣打臉。
回測報告 裡的「Sharpe 3 以上」，常常是這種幻覺堆出來的。
機器學習訊號 特別容易中招，因為通常用很短的滾動窗口訓練。

簡單的判斷原則：

如果一個策略/訊號只在「連續資料」上好看，但 跨不同時間段 卻不穩定，很可能是重疊陷阱。
如果一個訊號的 Sharpe 比市場基準高 2 倍以上， 先懷疑有 bug ——真的那麼好賺，早就被人套利光了。

給一般投資人的三個自保原則

原則一：同一個策略要在多個獨立時段都有效才可信 。不是靠 2020-2023 好看，要 2020-2023、2010-2015、2005-2010 分三段都能站得住腳。

原則二：看到 Sharpe > 3 的策略，第一反應是懷疑，不是興奮 。問清楚：是怎麼算的？有沒有用重疊窗口？跨不同市場一樣嗎？

原則三：把你看到的 t 值、顯著性、勝率除以 2-3 當作保守估計 。大多數沒經過嚴格修正的研究結果，真實強度只有原本的 1/2 到 1/3。

一句話總結

看起來有 100 個獨立觀察值，不代表真的有 100 個獨立觀察值 。當相鄰資料互相重疊，你的統計數字就是幻覺，而這在金融研究裡是常態，不是例外。

下一步

下一篇來看另一個讓人迷信的陷阱： 明明在股票上很管用的「進階波動模型」，為什麼一搬到黃金、石油、比特幣就完全失靈 ？

本文基於研究團隊對台股三檔個股的時間序列穩健性檢驗（期間 2014-2025 年，資料來源：yfinance）。修正方法使用 Newey-West HAC 標準誤與 block bootstrap（區塊長度 24），兩層嚴格修正後，原本看似強烈的訊號全部縮水。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)

新興市場的美元主權債，波動起來的時候，會不會比股市早一步聞到火藥味？如果會，那些免費就能取得的債券 ETF 與信用利差，或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍，結論很乾脆：**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的，不存在可以拿來做日頻預測的領先關係。這是一個 NULL 結果，但它是乾淨、可複現、而且對...

→📄

K1605：區域銀行 M/B 折價與後續波動，橫斷面穩健、OOS 不過關

# K1605：區域銀行 M/B 折價與後續波動，橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題：市場價格相對帳面淨值的折價，能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料，包含 27 家仍上市美國區域銀行，以及 KRE、KBE 兩個銀行 ETF；主...

→📄

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

→