← Research Feed
研究2026/05/08 上午05:00

成交量真的能預測波動嗎?SPY 與 0050 的二十年實測

波動率成交量投資迷思樣本外驗證跨市場比較

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

一、為什麼很多人相信「量先價行」

在台灣股市的散戶教學書裡,「量先價行」幾乎是金科玉律。歐美技術分析教材也常把成交量當成判斷後續波動的重要線索,邏輯聽起來很直覺,當大量資金同時湧入或湧出,價格不可能風平浪靜;反過來,如果成交量縮小,市場就會冷卻。這個直覺在學術界其實有正式的名字,叫做「 混合分佈假說(Mixture of Distributions Hypothesis, MDH) 」。Clark(1973)和 Tauchen & Pitts(1983)都用模型論證過:股價波動之所以呈現「群聚(clustering)」,也就是大波動接著大波動、小波動接著小波動,其實是因為市場資訊以 時間扭曲 的方式傳進來,而成交量正是這個資訊抵達速度的代理變數。

換句話說,如果這個假說是對的,那麼把成交量加進波動率模型裡,應該能讓模型對「明天到底會多動」這個問題回答得更準。Lamoureux & Lastrapes(1990,發表於 Journal of Finance)就做了這個實驗,他們發現成交量加進 GARCH 模型後,反映波動「持續性」的參數會大幅下降,因此推論「成交量解釋掉了 GARCH 效應」。

但學術界後來陸續有研究發現,這個結論雖然在「樣本內」很漂亮, 樣本外卻不一定能複製 。實驗 K527 就是在 2026 年用更乾淨的方法、更長的資料、跨美股與台股兩個市場,重新檢驗這個三十多年前的經典結論,結果非常值得每一位習慣看量判斷盤面的投資人看一看。

二、實驗怎麼設計的

K527 抓了兩個指標型 ETF 的每日資料:

  •  SPY (標普 500 ETF):5,242 個交易日,期間從 2005 年初到 2026 年 3 月
  •  0050.TW (元大台灣 50):4,116 個交易日,期間同上

兩個資料集都來自 yfinance,並把樣本外(out-of-sample, OOS)測試期間設定在  2023 年 1 月到 2024 年 12 月 ——也就是用前面長達十多年的資料訓練模型,再拿 2023 之後的資料來考它。模型估計用滾動視窗(SPY 用 2,000 個交易日、0050.TW 用 1,500 個交易日),每 21 個交易日(約一個月)重新校準一次。

測試的四種模型都是 GARCH 家族:

  •  GARCH(1,1) :純粹用過去的價格波動預測未來波動,不看成交量,也是學術界的標準對照組(baseline)
  •  Volume-GARCH :在 GARCH(1,1) 上加入成交量項
  •  Volume-replacing :把 GARCH 的「過去波動」項拿掉, 只用成交量 預測波動
  •  GJR + Volume :同時加入「壞消息比好消息影響更大」的不對稱項,再疊上成交量

判斷一個模型「真的有用」必須三關都過:(1) 樣本內看起來有改善;(2) 樣本外的預測誤差要顯著降低(用 QLIKE 損失函數衡量);(3) 通過嚴格統計檢驗門檻,光是平均誤差小一點不夠,還要排除「只是運氣好」的可能。

幾個重要的方法論細節值得提一下,因為它們決定了這次實驗能不能信:

  •  避免偷看未來 :成交量用「 昨天 」的(V_{t-1}),不是當天的,否則會犯所有量化研究最忌諱的「lookahead bias」
  •  成交量去趨勢 :把當日成交量除以過去 252 個交易日的移動平均(V_t / MA(V, 252)),這樣才能比較不同年份的相對量能
  •  波動代理變數 :用報酬平方(r²)和絕對報酬(|r|)兩種尺度都跑一次,確認結果一致

三、樣本內看似驚人,樣本外卻完全失靈

先看一個非常戲劇性的數字。所謂「持續性(persistence)」是 GARCH 模型裡 α + β 的和,它告訴我們「今天的大波動會延續到明天的程度」,數值愈接近 1,代表波動群聚效應愈強。

市場GARCH(1,1) 持續性加入成交量後持續性下降幅度
SPY0.9760.9364.0%
0050.TW0.8810.070 92.1% 

台灣 0050 的持續性從 0.881 直接被打到 0.070, 下降幅度 92% 。這個結果如果只看樣本內,會讓人忍不住下標題「成交量解釋了台股波動的絕大部分」。SPY 雖然只下降 4%,用滾動視窗看 26 個分窗的平均下降也達到 17.6%——而且每一個分窗成交量係數都是正的(delta_positive_frac = 100%)。

但是—— 樣本外完全是另一個故事 。

市場模型樣本外 QLIKE 變化通過嚴格統計檢驗?
SPYVolume-GARCH+0.11%(更差)
SPYGJR + Volume-0.17%(極微改善)
SPYVolume-replacing+0.13%(更差)
0050.TWVolume-GARCH+436%(嚴重惡化)
0050.TWGJR + Volume+118%(嚴重惡化)
0050.TWVolume-replacing+895,295%(崩壞)

QLIKE 變化是百分比(正值=更差,負值=更好)。SPY 那邊四個成交量模型的樣本外改善幅度都不到千分之二,和 GARCH(1,1) 比較起來實質上是平手;而台灣 0050 的情況更慘,加進成交量後 預測誤差暴增三位數百分比 ,最極端的「Volume-replacing」(完全拿掉 ARCH 項、只用成交量)甚至產生超過八十萬個百分比的誤差爆炸。沒有任何一個模型通過嚴格統計檢驗門檻,也就是說,從統計顯著性來看, 沒有證據支持「加入成交量能改善波動率預測」 。

四、為什麼樣本內這麼漂亮、樣本外卻如此糟糕?

這就是實驗 K527 最重要的訊息,它揭露了一個量化研究中最常見、最容易誤導散戶的陷阱—— 樣本內的「解釋力」不等於樣本外的「預測力」 。

關鍵的分水嶺在於 資訊抵達的時間點 。MDH 假說的原始版本說,成交量代表資訊抵達,但這個資訊和波動是 同時發生 的(contemporaneous),它們在同一個交易日內共同被一個看不見的「資訊強度」變數推動。如果你用「今天的成交量」解釋「今天的波動」,當然能解釋得很漂亮,因為兩者本來就被同一個底層因子驅動。但是當你在預測時誠實地只用「昨天的成交量」,這個共因就斷了,昨天的資訊強度跟今天的資訊強度其實只有微弱的相關。

K527 的結果和早期類似研究一致地指出: MDH 沒有錯,錯的是把它當成預測工具的人 。成交量是一個非常好的「同期指標」(解釋當下發生了什麼),但它 不是領先指標 (預測明天會發生什麼)。Hillebrand(2005)甚至證明過,許多 GARCH 模型「持續性」過高的問題其實來自結構斷裂被誤認為是長期記憶,這也解釋了為什麼把成交量塞進去之後,持續性會「假性」下降,但這個下降在樣本外無法兌現成更好的預測。

特別值得注意的是台灣 0050 的失敗模式。它的樣本內持續性下降幅度(92%)比 SPY(4%)大得多,但這恰恰 不是 「台股成交量資訊更有用」的證據,反而是台股 0050 的成交量序列本身有很多結構性特徵(除權息、ETF 申購贖回潮、外資季末調整等),這些特徵在樣本內被模型「過度配適(overfitting)」進去,到樣本外完全派不上用場。樣本內愈漂亮的下降,樣本外失敗得愈慘。

五、給一般投資人的三個 takeaway

從 K527 的結果,散戶可以很實用地調整三件事:

 第一,不要把「今天爆量」當成明天波動的預測訊號 。當你看到盤後新聞寫「今日成交量為近三月最大」,這件事 確實 告訴你今天市場很激動,但 它對明天會不會繼續激動的預測力,幾乎等於零 ——至少在 SPY 和 0050 上是這樣。要預測明天的波動,過去幾天的「報酬平方」這種純價格資訊就足夠了,不需要把成交量放進來。

 第二,警惕「量價齊揚」「量縮整理」這類解讀的時間屬性 。這些術語在描述「現在發生了什麼」的時候是合理的,但很多技術分析教材會把它包裝成「 接下來 會怎樣」的預測——K527 告訴我們,這個包裝沒有統計支持。它是一個事後合理化的解釋框架,不是事前可操作的訊號。

 第三,看到任何「樣本內漂亮、樣本外不檢驗」的策略宣傳要提高警覺 。台股 0050 在樣本內持續性下降 92% 的數字,如果被某個策略商品包裝成「我們的模型解釋了台股波動的 92%」,散戶可能會覺得這是非常強大的研究,但 K527 告訴你, 這個 92% 在預測現實時不會變現 。任何一個負責任的回測,都應該明確區分「我訓練資料看起來多好」和「我新資料能不能複製」。問問自己看到的策略,有沒有一個獨立的、未來的、模型沒看過的測試期間。

六、學術上的意義

K527 加入了一個正在累積的反證證據鏈,包括:

  •  K113 (成交量驚奇 null):成交量「驚奇」(與預期相比)對波動同樣沒有預測力
  •  K135 (GLD 黃金 ETF 量比 null):在黃金市場用相對量比同樣失敗
  •  K136 (BTC 量條件 gamma):加密貨幣上有部分跡象但不穩健
  •  K418 (台股量 null):另一個台股版本得到一致結論
  •  K510 (Lamoureux & Lastrapes 直接複製):直接複製原論文設定,OOS 同樣 null

K527 在這些前作的基礎上加上 雙資產(SPY + 0050.TW) 、 修正 lookahead 偏誤 、 新增 Volume-replacing 模型 等強化版本,再次得到一致的結果,成交量資訊 是同期的,不是預測的 。這個發現對學術界並不算新,但每多一份獨立、嚴謹、跨市場的驗證,就讓研究界對 MDH 的「正確讀法」更有信心。

七、結論

成交量很重要,但它的角色被普遍誤解了。它告訴我們 現在 市場有多激動、資訊抵達速度有多快,但它 不會 告訴我們明天市場會多激動。把它當成同期狀態指標,是合理的;把它當成預測明天波動的訊號,K527 在 SPY 和 0050.TW 上的實測都證明這條路走不通。

對個人投資者來說,這個結論其實是個好消息:你不需要訂閱昂貴的高頻量能訊號服務、不需要鑽研複雜的 Volume-GARCH 模型,簡單的純價格波動模型已經做得一樣好。把省下的時間用在更重要的事情上:分散風險、控制部位、堅持紀律,這些事情的長期報酬,遠遠超過任何「量先價行」的精微技巧。

資料來源

  •  資料來源 :yfinance 每日 OHLCV,SPY 與 0050.TW,2005-01-01 至 2026-03-27
  •  樣本外期間 :2023-01-01 至 2024-12-31(SPY 502 個有效交易日,0050.TW 481 個有效交易日)
  •  方法論依據 :Lamoureux & Lastrapes (1990), Journal of Finance 45(1):221-229;Clark (1973) MDH;Tauchen & Pitts (1983) Econometrica;Hillebrand (2005) persistence inflation;Patton (2011) imperfect proxies
  •  相關前作 :K113(成交量驚奇 null)、K135(GLD 量比 OOS null)、K136(BTC 量條件 gamma)、K418(台股量 null)、K510(L&L 複製 null)
  •  完整實驗檔 :experiments/k527/k527_volume_garch_results.json
  •  裁定 :四個成交量模型在 SPY 與 0050.TW 樣本外均未通過嚴格統計檢驗門檻;確認 MDH 成交量資訊為同期性而非預測性

詳情

audience
research
experiment_refs
K527
audience_backfill
{"reason":"validator_371_historical_backfill","script":"scripts/backfill_audience.py","applied_at":"2026-05-26T16:21:47+00:00","article_id":"mile_0e3fb5f6","previous_audience":"general"}

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
夜盤與日內波動:誰才是隔日波動的主角?
# 夜盤與日內波動:誰才是隔日波動的主角? ## 一、為什麼要把一天的波動拆兩段? 如果你打開財經 App 看到的「今日波動」其實藏著兩段截然不同的時間: - **隔夜(overnight)**:昨日收盤到今日開盤之間,市場根本沒在交易,但價格還是動了 —— 因為這段時間美股以外的世界在發生事情:歐洲股市、亞洲交易、財報盤後發布、地緣政治新聞、聯準會官員談話。 - **日內(intraday...
📄
EWMA 平滑參數最佳值:Lag 修正後的誠實答案
# EWMA 平滑參數最佳值:Lag 修正後的誠實答案 ## 一句話結論 把 EWMA(指數加權移動平均)波動率平滑參數 λ 從常見的 0.94(RiskMetrics 1996 預設)調到 0.98 之後,**風險調整後報酬從 0.484 提升到 0.507**——數字確實有微幅進步;但同樣這個「最佳」的波動率目標化策略,**仍然輸給最簡單的 50/50 買入持有(Sharpe 0.545)...
📄
波動的波動率能預測動盪嗎?實證 NULL
# 波動的波動率能預測市場切換嗎?一個直覺漂亮但實證失敗的故事 ## 一個聽起來很合理的想法 當 VIX 從 15 漲到 35,每個投資人都知道市場進入動盪。但若我們再進一步問:「VIX 自己的波動率」(也就是波動的波動率,vol-of-vol,簡稱 VoV)會不會在市場真正爆炸前先動起來?這個概念在學術圈有不少正面文獻:Huang & Shaliastovich (2015) 把 VoV 視...