← 研究動態
一般讀者2026/06/22 上午02:00

散戶越熱,0050 明天就越震?數字給的答案很保守

Taiwan0050realized-volatilityretail-flowmargin

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

台股散戶很活躍時,市場隔天會不會更容易變大聲?

這個問題很有直覺。散戶追漲殺跌、融資融券變熱、近期又剛跌一段,聽起來都像隔天波動放大的材料。問題在於,台灣沒有一條乾淨、每日公開、完整的「全市場散戶占比」資料可以直接拿來用。

所以這次先做保守版:只看 0050.TW,用公開資料做兩個 proxy。

第一個 proxy 是「扣掉三大法人買賣後,剩下的 0050 成交占比」。第二個 proxy 是「融資融券買賣活動除以 0050 成交量」。兩個都不是散戶本人逐筆下單紀錄,只能當 ETF 層級的替代指標。

結論先講: 有一點訊號,但不夠穩。 

0050 散戶 proxy、互動方向與樣本外誤差改善

我們到底測了什麼

實驗問的是很具體的一件事:

若昨天之前 5 天 0050 已經下跌,而且散戶 proxy 偏高,今天的 0050 波動會不會更大?

這裡的波動用了兩種量法:

波動量法白話意思
平方報酬年化看收盤到收盤的價格跳動
Parkinson high-low range看當天最高價到最低價的振幅

模型也有基本防線。所有訊號都先往後移一天:昨天以前看得到的散戶 proxy、過去 5 天報酬、過去波動,拿來預測今天的波動。這避免了把今天成交和今天波動混在一起的時間錯位。

資料期間是 2009-01-05 到 2026-03-17,0050 價格共有 4,208 個交易日。殘差散戶 proxy 有 3,370 筆有效資料,融資融券 proxy 有 3,383 筆有效資料。

殘差散戶 proxy 的平均值是 81.77%。但這個數字不能讀成「0050 每天八成都是散戶在買賣」,因為 ETF 成交還混著造市、避險、申贖與機構交易拆單。它比較適合讀成:在公開資料能做到的範圍內,法人以外的交易占比 proxy。

四個結果,只有兩個看起來有互動

把兩種波動量法和兩種散戶 proxy 交叉後,一共有四個規格。

目標proxy方向樣本外誤差改善嚴格門檻
平方報酬殘差散戶占比方向反直覺9.55%未過
平方報酬融資融券活動方向符合直覺8.93%未過
High-low range殘差散戶占比係數不穩11.83%未過
High-low range融資融券活動係數不穩9.59%未過

最尷尬的是第一列。

殘差散戶占比遇到近期下跌時,平方報酬模型裡的互動係數很強,卻是反方向:它看起來和較低的隔天波動連在一起。這和「散戶跌後活躍會放大風險」的故事相反。

第二列比較符合直覺:融資融券活動遇到近期下跌時,隔天平方報酬波動有上升跡象。但放到 2022 年以後的樣本外預測,強度不夠。

High-low range 那兩列更像另一種訊號:預測誤差改善看起來不小,最好的一格達 11.83%,但模型比較的統計強度還是沒有越過我們要求的門檻。

樣本外模型比較強度沒有越過嚴格門檻

第二張圖把重點攤開。四個規格都在嚴格門檻右邊,最接近的是 high-low range 加殘差散戶 proxy,強度約 -2.78;門檻是 -3。差一點就是差一點,不能把它寫成已確認訊號。

對投資人比較有用的讀法

這份結果最有價值的地方,不是找到一個能直接交易的散戶指標。

真正有用的是界線:公開的 0050 ETF proxy 可能含有一些資訊,但資訊不穩,也不一定跟直覺同方向。把它拿去做正式波動預測訊號,證據還不夠。

這對一般投資人有三個提醒。

第一,不要把「散戶很熱」直接等同於「明天一定大震」。熱度要看是什麼資料、什麼市場、什麼時間點。0050 的 ETF 成交不是純散戶行為。

第二,融資融券活動比較接近我們想像中的槓桿情緒,但它在這次樣本外測試裡仍沒有過關。直覺合理,只能當研究線索。

第三,如果真的要把散戶行為做成波動訊號,需要更好的資料:全市場散戶占比、個股層級面板,或逐筆委託與成交資料。ETF 日資料能做 pilot,不能承擔太強的結論。

一句話結論

這次答案很保守:0050 的公開散戶-like proxy 有些跡象,但沒有強到能說「散戶活躍加近期下跌,會穩定預測明天波動放大」。

更精準的說法是:這條研究線值得用更好的資料重開;目前這份 ETF proxy 版,只能放在 suggestive,不該上架成正式訊號。

資料來源:本文基於實驗 K1530(腳本:experiments/k1530_tw_retail_interaction_rv/k1530_tw_retail_interaction_rv.py,結果:experiments/k1530_tw_retail_interaction_rv/k1530_tw_retail_interaction_rv_results.json)。資料源為本地公開快照:storage/macro/yf_0050.TW.csvstorage/sentiment/tw_institutional_0050.csvstorage/sentiment/tw_margin_0050.csv。價格樣本 2009-01-05 至 2026-03-17,樣本外測試自 2022-01-01 起;seed=42。主要限制:proxy 只針對 0050 ETF,不是官方全市場散戶占比;法人與融資券資料快照只到 2026 年 3 月。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
VIX 跌破 16 之後:三個波動率裂縫,比恐慌指數本身更值得留意
# VIX 跌破 16 之後:三個波動率裂縫,比恐慌指數本身更值得留意 VIX 這五個交易日一路探底:6/29 收 17.65,6/30 收 16.45,7/1 收 16.59,7/2 收 16.15,7/3 美股開盤前來到 15.84。連 16 這個心理關卡都守不住,是今年少見的低檔區。 FRED 資料顯示,7/1 當天 VIX3M 收在 19.16,比現貨 VIX 的 16.59 高出 2...
📄
波動率「測不準」能不能當減碼訊號?六檔 ETF、六十天的老實答案
打開任何一套波動率監控面板,你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個,用當天的開盤、最高、最低、收盤算出另一個,把隔夜跳空也加進去又是一個。多數時候它們差不多,偶爾會明顯對不上。這篇想回答一個很實際的問題:當這些數字彼此吵起來的時候,是不是代表隔天更難預測、應該先把部位縮小一點? ## 先講清楚「分歧」是什麼 把量測市場波動的方法想像成幾支溫度計。它們原理不同、...
📄
把五分鐘資料切得更細,預測真的會更準嗎?台指期給了一個保守答案
做波動率預測時,很容易想把資料切得更細。一天一筆收盤價太粗,那就看每五分鐘一筆;只看總波動太粗,那就再拆成上漲、下跌、跳動、估計噪音。直覺上,資料越細,模型應該越聰明。 這次台指期日盤實測給的答案比較冷靜:細資料有幫助,但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動,期間從 2017-05-16 到 2026-06-29,共 2219 個原始交易日。正式可判斷的樣本外...