成交量真的能預測波動嗎?SPY 與 0050 的二十年實測
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
一、為什麼很多人相信「量先價行」
在台灣股市的散戶教學書裡,「量先價行」幾乎是金科玉律。歐美技術分析教材也常把成交量當成判斷後續波動的重要線索,邏輯聽起來很直覺,當大量資金同時湧入或湧出,價格不可能風平浪靜;反過來,如果成交量縮小,市場就會冷卻。這個直覺在學術界其實有正式的名字,叫做「 混合分佈假說(Mixture of Distributions Hypothesis, MDH) 」。Clark(1973)和 Tauchen & Pitts(1983)都用模型論證過:股價波動之所以呈現「群聚(clustering)」,也就是大波動接著大波動、小波動接著小波動,其實是因為市場資訊以 時間扭曲 的方式傳進來,而成交量正是這個資訊抵達速度的代理變數。
換句話說,如果這個假說是對的,那麼把成交量加進波動率模型裡,應該能讓模型對「明天到底會多動」這個問題回答得更準。Lamoureux & Lastrapes(1990,發表於 Journal of Finance)就做了這個實驗,他們發現成交量加進 GARCH 模型後,反映波動「持續性」的參數會大幅下降,因此推論「成交量解釋掉了 GARCH 效應」。
但學術界後來陸續有研究發現,這個結論雖然在「樣本內」很漂亮, 樣本外卻不一定能複製 。實驗 K527 就是在 2026 年用更乾淨的方法、更長的資料、跨美股與台股兩個市場,重新檢驗這個三十多年前的經典結論,結果非常值得每一位習慣看量判斷盤面的投資人看一看。
二、實驗怎麼設計的
K527 抓了兩個指標型 ETF 的每日資料:
- SPY (標普 500 ETF):5,242 個交易日,期間從 2005 年初到 2026 年 3 月
- 0050.TW (元大台灣 50):4,116 個交易日,期間同上
兩個資料集都來自 yfinance,並把樣本外(out-of-sample, OOS)測試期間設定在 2023 年 1 月到 2024 年 12 月 ——也就是用前面長達十多年的資料訓練模型,再拿 2023 之後的資料來考它。模型估計用滾動視窗(SPY 用 2,000 個交易日、0050.TW 用 1,500 個交易日),每 21 個交易日(約一個月)重新校準一次。
測試的四種模型都是 GARCH 家族:
- GARCH(1,1) :純粹用過去的價格波動預測未來波動,不看成交量,也是學術界的標準對照組(baseline)
- Volume-GARCH :在 GARCH(1,1) 上加入成交量項
- Volume-replacing :把 GARCH 的「過去波動」項拿掉, 只用成交量 預測波動
- GJR + Volume :同時加入「壞消息比好消息影響更大」的不對稱項,再疊上成交量
判斷一個模型「真的有用」必須三關都過:(1) 樣本內看起來有改善;(2) 樣本外的預測誤差要顯著降低(用 QLIKE 損失函數衡量);(3) 通過嚴格統計檢驗門檻,光是平均誤差小一點不夠,還要排除「只是運氣好」的可能。
幾個重要的方法論細節值得提一下,因為它們決定了這次實驗能不能信:
- 避免偷看未來 :成交量用「 昨天 」的(V_{t-1}),不是當天的,否則會犯所有量化研究最忌諱的「lookahead bias」
- 成交量去趨勢 :把當日成交量除以過去 252 個交易日的移動平均(V_t / MA(V, 252)),這樣才能比較不同年份的相對量能
- 波動代理變數 :用報酬平方(r²)和絕對報酬(|r|)兩種尺度都跑一次,確認結果一致
三、樣本內看似驚人,樣本外卻完全失靈
先看一個非常戲劇性的數字。所謂「持續性(persistence)」是 GARCH 模型裡 α + β 的和,它告訴我們「今天的大波動會延續到明天的程度」,數值愈接近 1,代表波動群聚效應愈強。
| 市場 | GARCH(1,1) 持續性 | 加入成交量後持續性 | 下降幅度 |
|---|---|---|---|
| SPY | 0.976 | 0.936 | 4.0% |
| 0050.TW | 0.881 | 0.070 | 92.1% |
台灣 0050 的持續性從 0.881 直接被打到 0.070, 下降幅度 92% 。這個結果如果只看樣本內,會讓人忍不住下標題「成交量解釋了台股波動的絕大部分」。SPY 雖然只下降 4%,用滾動視窗看 26 個分窗的平均下降也達到 17.6%——而且每一個分窗成交量係數都是正的(delta_positive_frac = 100%)。
但是—— 樣本外完全是另一個故事 。
| 市場 | 模型 | 樣本外 QLIKE 變化 | 通過嚴格統計檢驗? |
|---|---|---|---|
| SPY | Volume-GARCH | +0.11%(更差) | 否 |
| SPY | GJR + Volume | -0.17%(極微改善) | 否 |
| SPY | Volume-replacing | +0.13%(更差) | 否 |
| 0050.TW | Volume-GARCH | +436%(嚴重惡化) | 否 |
| 0050.TW | GJR + Volume | +118%(嚴重惡化) | 否 |
| 0050.TW | Volume-replacing | +895,295%(崩壞) | 否 |
QLIKE 變化是百分比(正值=更差,負值=更好)。SPY 那邊四個成交量模型的樣本外改善幅度都不到千分之二,和 GARCH(1,1) 比較起來實質上是平手;而台灣 0050 的情況更慘,加進成交量後 預測誤差暴增三位數百分比 ,最極端的「Volume-replacing」(完全拿掉 ARCH 項、只用成交量)甚至產生超過八十萬個百分比的誤差爆炸。沒有任何一個模型通過嚴格統計檢驗門檻,也就是說,從統計顯著性來看, 沒有證據支持「加入成交量能改善波動率預測」 。
四、為什麼樣本內這麼漂亮、樣本外卻如此糟糕?
這就是實驗 K527 最重要的訊息,它揭露了一個量化研究中最常見、最容易誤導散戶的陷阱—— 樣本內的「解釋力」不等於樣本外的「預測力」 。
關鍵的分水嶺在於 資訊抵達的時間點 。MDH 假說的原始版本說,成交量代表資訊抵達,但這個資訊和波動是 同時發生 的(contemporaneous),它們在同一個交易日內共同被一個看不見的「資訊強度」變數推動。如果你用「今天的成交量」解釋「今天的波動」,當然能解釋得很漂亮,因為兩者本來就被同一個底層因子驅動。但是當你在預測時誠實地只用「昨天的成交量」,這個共因就斷了,昨天的資訊強度跟今天的資訊強度其實只有微弱的相關。
K527 的結果和早期類似研究一致地指出: MDH 沒有錯,錯的是把它當成預測工具的人 。成交量是一個非常好的「同期指標」(解釋當下發生了什麼),但它 不是領先指標 (預測明天會發生什麼)。Hillebrand(2005)甚至證明過,許多 GARCH 模型「持續性」過高的問題其實來自結構斷裂被誤認為是長期記憶,這也解釋了為什麼把成交量塞進去之後,持續性會「假性」下降,但這個下降在樣本外無法兌現成更好的預測。
特別值得注意的是台灣 0050 的失敗模式。它的樣本內持續性下降幅度(92%)比 SPY(4%)大得多,但這恰恰 不是 「台股成交量資訊更有用」的證據,反而是台股 0050 的成交量序列本身有很多結構性特徵(除權息、ETF 申購贖回潮、外資季末調整等),這些特徵在樣本內被模型「過度配適(overfitting)」進去,到樣本外完全派不上用場。樣本內愈漂亮的下降,樣本外失敗得愈慘。
五、給一般投資人的三個 takeaway
從 K527 的結果,散戶可以很實用地調整三件事:
第一,不要把「今天爆量」當成明天波動的預測訊號 。當你看到盤後新聞寫「今日成交量為近三月最大」,這件事 確實 告訴你今天市場很激動,但 它對明天會不會繼續激動的預測力,幾乎等於零 ——至少在 SPY 和 0050 上是這樣。要預測明天的波動,過去幾天的「報酬平方」這種純價格資訊就足夠了,不需要把成交量放進來。
第二,警惕「量價齊揚」「量縮整理」這類解讀的時間屬性 。這些術語在描述「現在發生了什麼」的時候是合理的,但很多技術分析教材會把它包裝成「 接下來 會怎樣」的預測——K527 告訴我們,這個包裝沒有統計支持。它是一個事後合理化的解釋框架,不是事前可操作的訊號。
第三,看到任何「樣本內漂亮、樣本外不檢驗」的策略宣傳要提高警覺 。台股 0050 在樣本內持續性下降 92% 的數字,如果被某個策略商品包裝成「我們的模型解釋了台股波動的 92%」,散戶可能會覺得這是非常強大的研究,但 K527 告訴你, 這個 92% 在預測現實時不會變現 。任何一個負責任的回測,都應該明確區分「我訓練資料看起來多好」和「我新資料能不能複製」。問問自己看到的策略,有沒有一個獨立的、未來的、模型沒看過的測試期間。
六、學術上的意義
K527 加入了一個正在累積的反證證據鏈,包括:
- K113 (成交量驚奇 null):成交量「驚奇」(與預期相比)對波動同樣沒有預測力
- K135 (GLD 黃金 ETF 量比 null):在黃金市場用相對量比同樣失敗
- K136 (BTC 量條件 gamma):加密貨幣上有部分跡象但不穩健
- K418 (台股量 null):另一個台股版本得到一致結論
- K510 (Lamoureux & Lastrapes 直接複製):直接複製原論文設定,OOS 同樣 null
K527 在這些前作的基礎上加上 雙資產(SPY + 0050.TW) 、 修正 lookahead 偏誤 、 新增 Volume-replacing 模型 等強化版本,再次得到一致的結果,成交量資訊 是同期的,不是預測的 。這個發現對學術界並不算新,但每多一份獨立、嚴謹、跨市場的驗證,就讓研究界對 MDH 的「正確讀法」更有信心。
七、結論
成交量很重要,但它的角色被普遍誤解了。它告訴我們 現在 市場有多激動、資訊抵達速度有多快,但它 不會 告訴我們明天市場會多激動。把它當成同期狀態指標,是合理的;把它當成預測明天波動的訊號,K527 在 SPY 和 0050.TW 上的實測都證明這條路走不通。
對個人投資者來說,這個結論其實是個好消息:你不需要訂閱昂貴的高頻量能訊號服務、不需要鑽研複雜的 Volume-GARCH 模型,簡單的純價格波動模型已經做得一樣好。把省下的時間用在更重要的事情上:分散風險、控制部位、堅持紀律,這些事情的長期報酬,遠遠超過任何「量先價行」的精微技巧。
資料來源
- 資料來源 :yfinance 每日 OHLCV,SPY 與 0050.TW,2005-01-01 至 2026-03-27
- 樣本外期間 :2023-01-01 至 2024-12-31(SPY 502 個有效交易日,0050.TW 481 個有效交易日)
- 方法論依據 :Lamoureux & Lastrapes (1990), Journal of Finance 45(1):221-229;Clark (1973) MDH;Tauchen & Pitts (1983) Econometrica;Hillebrand (2005) persistence inflation;Patton (2011) imperfect proxies
- 相關前作 :K113(成交量驚奇 null)、K135(GLD 量比 OOS null)、K136(BTC 量條件 gamma)、K418(台股量 null)、K510(L&L 複製 null)
- 完整實驗檔 :experiments/k527/k527_volume_garch_results.json
- 裁定 :四個成交量模型在 SPY 與 0050.TW 樣本外均未通過嚴格統計檢驗門檻;確認 MDH 成交量資訊為同期性而非預測性
詳情
- audience
- research
- experiment_refs
- K527
- audience_backfill
- {"reason":"validator_371_historical_backfill","script":"scripts/backfill_audience.py","applied_at":"2026-05-26T16:21:47+00:00","article_id":"mile_0e3fb5f6","previous_audience":"general"}
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊