成交量真的能預測波動嗎？SPY 與 0050 的二十年實測

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

一、為什麼很多人相信「量先價行」

在台灣股市的散戶教學書裡，「量先價行」幾乎是金科玉律。歐美技術分析教材也常把成交量當成判斷後續波動的重要線索，邏輯聽起來很直覺，當大量資金同時湧入或湧出，價格不可能風平浪靜；反過來，如果成交量縮小，市場就會冷卻。這個直覺在學術界其實有正式的名字，叫做「 混合分佈假說（Mixture of Distributions Hypothesis, MDH） 」。Clark（1973）和 Tauchen & Pitts（1983）都用模型論證過：股價波動之所以呈現「群聚（clustering）」，也就是大波動接著大波動、小波動接著小波動，其實是因為市場資訊以 時間扭曲 的方式傳進來，而成交量正是這個資訊抵達速度的代理變數。

換句話說，如果這個假說是對的，那麼把成交量加進波動率模型裡，應該能讓模型對「明天到底會多動」這個問題回答得更準。Lamoureux & Lastrapes（1990，發表於 Journal of Finance）就做了這個實驗，他們發現成交量加進 GARCH 模型後，反映波動「持續性」的參數會大幅下降，因此推論「成交量解釋掉了 GARCH 效應」。

但學術界後來陸續有研究發現，這個結論雖然在「樣本內」很漂亮， 樣本外卻不一定能複製 。實驗 K527 就是在 2026 年用更乾淨的方法、更長的資料、跨美股與台股兩個市場，重新檢驗這個三十多年前的經典結論，結果非常值得每一位習慣看量判斷盤面的投資人看一看。

二、實驗怎麼設計的

K527 抓了兩個指標型 ETF 的每日資料：

SPY （標普 500 ETF）：5,242 個交易日，期間從 2005 年初到 2026 年 3 月
0050.TW （元大台灣 50）：4,116 個交易日，期間同上

兩個資料集都來自 yfinance，並把樣本外（out-of-sample, OOS）測試期間設定在 2023 年 1 月到 2024 年 12 月 ——也就是用前面長達十多年的資料訓練模型，再拿 2023 之後的資料來考它。模型估計用滾動視窗（SPY 用 2,000 個交易日、0050.TW 用 1,500 個交易日），每 21 個交易日（約一個月）重新校準一次。

測試的四種模型都是 GARCH 家族：

GARCH(1,1) ：純粹用過去的價格波動預測未來波動，不看成交量，也是學術界的標準對照組（baseline）
Volume-GARCH ：在 GARCH(1,1) 上加入成交量項
Volume-replacing ：把 GARCH 的「過去波動」項拿掉， 只用成交量 預測波動
GJR + Volume ：同時加入「壞消息比好消息影響更大」的不對稱項，再疊上成交量

判斷一個模型「真的有用」必須三關都過：(1) 樣本內看起來有改善；(2) 樣本外的預測誤差要顯著降低（用 QLIKE 損失函數衡量）；(3) 通過嚴格統計檢驗門檻，光是平均誤差小一點不夠，還要排除「只是運氣好」的可能。

幾個重要的方法論細節值得提一下，因為它們決定了這次實驗能不能信：

避免偷看未來 ：成交量用「昨天」的（V_{t-1}），不是當天的，否則會犯所有量化研究最忌諱的「lookahead bias」
成交量去趨勢 ：把當日成交量除以過去 252 個交易日的移動平均（V_t / MA(V, 252)），這樣才能比較不同年份的相對量能
波動代理變數 ：用報酬平方（r²）和絕對報酬（|r|）兩種尺度都跑一次，確認結果一致

三、樣本內看似驚人，樣本外卻完全失靈

先看一個非常戲劇性的數字。所謂「持續性（persistence）」是 GARCH 模型裡 α + β 的和，它告訴我們「今天的大波動會延續到明天的程度」，數值愈接近 1，代表波動群聚效應愈強。

市場	GARCH(1,1) 持續性	加入成交量後持續性	下降幅度
SPY	0.976	0.936	4.0%
0050.TW	0.881	0.070	92.1%

台灣 0050 的持續性從 0.881 直接被打到 0.070， 下降幅度 92% 。這個結果如果只看樣本內，會讓人忍不住下標題「成交量解釋了台股波動的絕大部分」。SPY 雖然只下降 4%，用滾動視窗看 26 個分窗的平均下降也達到 17.6%——而且每一個分窗成交量係數都是正的（delta_positive_frac = 100%）。

但是—— 樣本外完全是另一個故事 。

市場	模型	樣本外 QLIKE 變化	通過嚴格統計檢驗？
SPY	Volume-GARCH	+0.11%（更差）	否
SPY	GJR + Volume	-0.17%（極微改善）	否
SPY	Volume-replacing	+0.13%（更差）	否
0050.TW	Volume-GARCH	+436%（嚴重惡化）	否
0050.TW	GJR + Volume	+118%（嚴重惡化）	否
0050.TW	Volume-replacing	+895,295%（崩壞）	否

QLIKE 變化是百分比（正值=更差，負值=更好）。SPY 那邊四個成交量模型的樣本外改善幅度都不到千分之二，和 GARCH(1,1) 比較起來實質上是平手；而台灣 0050 的情況更慘，加進成交量後 預測誤差暴增三位數百分比 ，最極端的「Volume-replacing」（完全拿掉 ARCH 項、只用成交量）甚至產生超過八十萬個百分比的誤差爆炸。沒有任何一個模型通過嚴格統計檢驗門檻，也就是說，從統計顯著性來看， 沒有證據支持「加入成交量能改善波動率預測」 。

四、為什麼樣本內這麼漂亮、樣本外卻如此糟糕？

這就是實驗 K527 最重要的訊息，它揭露了一個量化研究中最常見、最容易誤導散戶的陷阱—— 樣本內的「解釋力」不等於樣本外的「預測力」 。

關鍵的分水嶺在於 資訊抵達的時間點 。MDH 假說的原始版本說，成交量代表資訊抵達，但這個資訊和波動是 同時發生 的（contemporaneous），它們在同一個交易日內共同被一個看不見的「資訊強度」變數推動。如果你用「今天的成交量」解釋「今天的波動」，當然能解釋得很漂亮，因為兩者本來就被同一個底層因子驅動。但是當你在預測時誠實地只用「昨天的成交量」，這個共因就斷了，昨天的資訊強度跟今天的資訊強度其實只有微弱的相關。

K527 的結果和早期類似研究一致地指出： MDH 沒有錯，錯的是把它當成預測工具的人 。成交量是一個非常好的「同期指標」（解釋當下發生了什麼），但它 不是領先指標 （預測明天會發生什麼）。Hillebrand（2005）甚至證明過，許多 GARCH 模型「持續性」過高的問題其實來自結構斷裂被誤認為是長期記憶，這也解釋了為什麼把成交量塞進去之後，持續性會「假性」下降，但這個下降在樣本外無法兌現成更好的預測。

特別值得注意的是台灣 0050 的失敗模式。它的樣本內持續性下降幅度（92%）比 SPY（4%）大得多，但這恰恰不是「台股成交量資訊更有用」的證據，反而是台股 0050 的成交量序列本身有很多結構性特徵（除權息、ETF 申購贖回潮、外資季末調整等），這些特徵在樣本內被模型「過度配適（overfitting）」進去，到樣本外完全派不上用場。樣本內愈漂亮的下降，樣本外失敗得愈慘。

五、給一般投資人的三個 takeaway

從 K527 的結果，散戶可以很實用地調整三件事：

第一，不要把「今天爆量」當成明天波動的預測訊號 。當你看到盤後新聞寫「今日成交量為近三月最大」，這件事確實告訴你今天市場很激動，但 它對明天會不會繼續激動的預測力，幾乎等於零 ——至少在 SPY 和 0050 上是這樣。要預測明天的波動，過去幾天的「報酬平方」這種純價格資訊就足夠了，不需要把成交量放進來。

第二，警惕「量價齊揚」「量縮整理」這類解讀的時間屬性 。這些術語在描述「現在發生了什麼」的時候是合理的，但很多技術分析教材會把它包裝成「 接下來 會怎樣」的預測——K527 告訴我們，這個包裝沒有統計支持。它是一個事後合理化的解釋框架，不是事前可操作的訊號。

第三，看到任何「樣本內漂亮、樣本外不檢驗」的策略宣傳要提高警覺 。台股 0050 在樣本內持續性下降 92% 的數字，如果被某個策略商品包裝成「我們的模型解釋了台股波動的 92%」，散戶可能會覺得這是非常強大的研究，但 K527 告訴你， 這個 92% 在預測現實時不會變現 。任何一個負責任的回測，都應該明確區分「我訓練資料看起來多好」和「我新資料能不能複製」。問問自己看到的策略，有沒有一個獨立的、未來的、模型沒看過的測試期間。

六、學術上的意義

K527 加入了一個正在累積的反證證據鏈，包括：

K113 （成交量驚奇 null）：成交量「驚奇」（與預期相比）對波動同樣沒有預測力
K135 （GLD 黃金 ETF 量比 null）：在黃金市場用相對量比同樣失敗
K136 （BTC 量條件 gamma）：加密貨幣上有部分跡象但不穩健
K418 （台股量 null）：另一個台股版本得到一致結論
K510 （Lamoureux & Lastrapes 直接複製）：直接複製原論文設定，OOS 同樣 null

K527 在這些前作的基礎上加上 雙資產（SPY + 0050.TW） 、 修正 lookahead 偏誤 、 新增 Volume-replacing 模型 等強化版本，再次得到一致的結果，成交量資訊 是同期的，不是預測的 。這個發現對學術界並不算新，但每多一份獨立、嚴謹、跨市場的驗證，就讓研究界對 MDH 的「正確讀法」更有信心。

七、結論

成交量很重要，但它的角色被普遍誤解了。它告訴我們現在市場有多激動、資訊抵達速度有多快，但它不會告訴我們明天市場會多激動。把它當成同期狀態指標，是合理的；把它當成預測明天波動的訊號，K527 在 SPY 和 0050.TW 上的實測都證明這條路走不通。

對個人投資者來說，這個結論其實是個好消息：你不需要訂閱昂貴的高頻量能訊號服務、不需要鑽研複雜的 Volume-GARCH 模型，簡單的純價格波動模型已經做得一樣好。把省下的時間用在更重要的事情上：分散風險、控制部位、堅持紀律，這些事情的長期報酬，遠遠超過任何「量先價行」的精微技巧。

資料來源

資料來源 ：yfinance 每日 OHLCV，SPY 與 0050.TW，2005-01-01 至 2026-03-27
樣本外期間 ：2023-01-01 至 2024-12-31（SPY 502 個有效交易日，0050.TW 481 個有效交易日）
方法論依據 ：Lamoureux & Lastrapes (1990), Journal of Finance 45(1):221-229；Clark (1973) MDH；Tauchen & Pitts (1983) Econometrica；Hillebrand (2005) persistence inflation；Patton (2011) imperfect proxies
相關前作 ：K113（成交量驚奇 null）、K135（GLD 量比 OOS null）、K136（BTC 量條件 gamma）、K418（台股量 null）、K510（L&L 複製 null）
完整實驗檔 ：experiments/k527/k527_volume_garch_results.json
裁定：四個成交量模型在 SPY 與 0050.TW 樣本外均未通過嚴格統計檢驗門檻；確認 MDH 成交量資訊為同期性而非預測性