研究2026/05/08 上午11:00

新聞情緒、政策不確定性、信用利差能預測波動率嗎？四項『另類風向標』全面對決 VIX

波動率預測風險管理信用利差投資情緒政策不確定性另類資料

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

一句話結論

我們把四項常被媒體與研究界推崇的「市場情緒／不確定性」指數— 經濟政策不確定性指數（EPU） 、 密西根大學消費者信心指數（UMCSENT） 、 TED 利差 、 美國高收益債信用利差（HY Spread） —和已是業界標竿的 VIX 同台比較，看看它們能不能「再多預測一點」未來 20 個交易日的 S&P 500 波動率。 結論是：在歷史回顧（樣本內）多項統計強度確實顯著，但走到真正的『樣本外、未來預測』時，沒有任何一個指數能穩定打敗單獨用 VIX 的模型。 這也再次印證： VIX 已經把市場上絕大多數可公開取得的情緒與不確定性資訊都吸收進去了 。對一般投資人來說，與其追逐五花八門的情緒指標，不如把時間花在風險管理與部位控制上。

為什麼要做這個研究？

每隔一陣子，市場上就會冒出一個被視為「比 VIX 更聰明」的指標：

學術界 Baker、Bloom 與 Davis（2016, QJE）構築了 EPU（Economic Policy Uncertainty） 指數，用文字探勘新聞報導政策不確定字眼的密度。
Shapiro、Sudhof 與 Wilson（2022, Journal of Econometrics）為舊金山聯準會建立 每日新聞情緒指數 。
Ardia 等學者（2019, JEcon）用情緒分析預測經濟成長。
近年更有 Huang 等（2024）把 FinBERT （金融專用大型語言模型）結合 LSTM 拿來做股市預測。

聽起來都很有未來感，但問題是：

這些指數，真的能在 VIX 已經告訴我們的訊息之外，再多告訴我們一些事嗎？

波動率研究室過去做過幾項類似的對照實驗—— K504 （聖路易聯準金融壓力指數 STLFSI4）、 CNN Fear & Greed 、 AAII 散戶情緒 、 K418 、加密貨幣 Fear and Greed—— 全都得到 null 結果 ：在控制 VIX 後完全沒有增量預測能力。

K531 想把這個議題收個「文字／政策／信用」三合一的尾，看看更主流、更被學界引用的四項指數會不會打破過去的 null 紀錄。

標題分類說明 ：為簡化標題， UMCSENT（密西根大學消費者信心） 歸入廣義「投資情緒」、 TED Spread（銀行間信用壓力） 歸入廣義「信用壓力」；嚴格定義上 UMCSENT 是消費者信心調查、TED 是銀行間 funding stress 指標，與本文「投資人情緒」「企業信用利差」的學術術語略有差異，但機制上仍同屬「VIX 之外的市場壓力訊號」家族。

四項候選指標到底是什麼？

指數	來源	含意	為何被認為可能有用
USEPUINDXD（EPU）	Baker-Bloom-Davis 每日版（FRED）	新聞中政策不確定字眼的密度	文字訊息可能領先選擇權市場反應
UMCSENT	密西根大學消費者信心	美國消費者對經濟前景的信心	信心崩盤通常伴隨資產波動上升
TEDRATE	3 月 LIBOR-T-bill 利差（FRED）	銀行間信用緊張程度	金融壓力的傳統指標，2008 曾爆衝
BAMLH0A0HYM2（HY Spread）	美銀美林高收益債信用利差	垃圾債相對國債的風險溢酬	企業信用壓力與股市波動高度相關

研究設計的核心 是：先用 VIX 解釋未來 20 日 S&P 500 已實現波動率，再問「加入這四個指數中的某一個，模型表現會不會變好？」

實驗設計

被解釋變數 ：SPY 未來 20 個交易日的年化已實現波動率（forward-looking realized volatility, %）
基準控制變數 ：VIX
新加入的解釋變數 ：上述 4 個情緒／不確定性指數
資料區間 ：2000-02-01 ~ 2026-02-26（約 6,557 個交易日，橫跨網路泡沫破裂、2008 金融海嘯、歐債危機、Covid 崩盤、2022 升息熊市等多個高波動期）
資料來源 ：yfinance（SPY、^VIX）+ FRED（其他 4 個指數）

我們用四關卡來檢視這些指標：

偏相關係數 ：控制 VIX 後，這個指數和未來波動率還有沒有顯著相關？
增量 R² ：把指數加入回歸後，模型解釋力提升多少？
格蘭傑因果（Granger causality） ：指數的過去值能不能幫忙預測未來波動率？
樣本外 QLIKE 檢驗 + 兩模型比較 ：用擴張視窗滾動預測，新模型有沒有真的打敗 VIX-only 模型？
跨期間穩定性（Cross-OOS Stability） ：把資料切成 5 個約 5 年的時段，新模型是不是每個時段都贏？

K531 採用的嚴格統計檢驗門檻 ：嚴格統計, 嚴格統計, Liu and Zhu（2016, RFS）「…and the Cross-Section of Expected Returns」 建議的統計強度 > 3.0（顯著性水準 0.0027），比一般統計強度 > 1.96 嚴格 2 倍以上，目的是控制金融研究中常見的「資料探勘 + 多重檢定」偽顯著問題。

結果一：樣本內檢定（Looking Backward）

樣本內結果其實 令人興奮 ：

指數	控制 VIX 後偏相關	統計強度	增量 R²	通過嚴格門檻？
EPU（USEPUINDXD）	-0.048	高	0.0011	是
Michigan Sentiment	+0.051	高	0.0013	是
TED Spread	+0.219	極高	0.0232	是
HY Spread	+0.001	接近零	0.0000	否

4 項中有 3 項通過嚴格統計檢驗門檻 ，TED 利差更是表現亮眼，增量 R² 達 2.32%（在預測波動率的世界裡這已經算大）。

格蘭傑因果檢定也支持這個樂觀印象： 4 項指數全部在 5% 水準下顯著 ，意思是「指數的過去值有助於預測未來波動率，即使已經控制 VIX 過去值」。

如果故事到這裡結束，我們就會說：「太好了，TED 利差是把好牌！」 但故事沒有結束 。

結果二：樣本外檢定（Looking Forward）— 真相時刻

樣本外才是市場真正在乎的： 用過去資料訓練、預測明天的波動率，這個指數能不能讓預測更準？

我們用擴張視窗（expanding window）滾動產生 196 個樣本外預測，比較兩個模型的 QLIKE（一種針對波動率預測設計的損失函數，越小越好）：

指數加入後	VIX-only QLIKE	VIX+指數 QLIKE	改善 %	兩模型比較強度	比較顯著？
EPU	3.6357	3.6729	-1.02%（變差）	弱	否
Michigan Sentiment	3.6357	3.6359	-0.005%	接近零	否
TED Spread	3.6357	3.6389	-0.09%	弱	否
HY Spread	3.6357	3.6364	-0.02%	弱	否

四項指數無一改善 VIX-only 模型 。其中表現最差的 EPU 反而讓預測誤差 惡化 1% 。雖然這些差距在統計上沒有顯著（兩模型比較檢定都不顯著），但「沒比較好」就已經足以告訴我們： 加入這些指數沒有實質意義 。

結果三：跨期間穩定性，贏一半就算贏？

我們把 26 年資料切成 5 個約 5 年的時段，看每個指數在多少個時段能打敗 VIX-only：

指數	5 段中贏 VIX	穩定性評估
EPU	3/5	中等（贏在 2000-2015，輸在 2015 後）
Michigan Sentiment	3/5	中等（散布不規律）
TED Spread	2/5	偏弱（金融海嘯時代有效，後來無用）
HY Spread	0/5	完敗

沒有任何指數能穩定贏過 VIX 。值得注意的是：

TED 利差 雖然在樣本內表現最好，但 只有 2008 金融海嘯前後 有微弱優勢，2015 年之後幾乎永遠輸給 VIX-only。
HY Spread 雖然和 VIX 在訊號上相當重疊（與 VIX 相關係數 0.77），但完全沒提供獨立資訊。
EPU 與 Michigan Sentiment 只在前 3 個歷史時段勉強領先，最近 5 年（含 Covid 與 2022 熊市）反而落後。

這暗示： 樣本內看到的訊號，多半來自過往特定時期的偶然契合，而不是穩定的因果關係 。換句話說，這是典型的 過度擬合 （overfitting）。

為什麼會這樣？VIX 的『資訊吸收力』比想像中強

K531 連同過去 K504、K418、CNN F&G、AAII、Crypto F&G 共 9+ 項類似測試的累積證據，指向一個一致的結論：

VIX 作為「市場對未來 30 天波動率的選擇權隱含預期」，已經把絕大多數公開可得的情緒、不確定性、信用壓力資訊『定價進來』。

這背後的經濟邏輯其實很直觀：

VIX 是真金白銀押注的結果 ：選擇權交易者是真的拿錢下注，他們有強烈動機把所有可用資訊（包含新聞情緒、消費者信心、信用利差）反映在報價上。
資訊整合速度極快 ：當 EPU 飆升、TED 利差擴大、HY Spread 走闊時，VIX 通常同步反應，我們看到的 4 項指數和 VIX 相關係數從 0.35 到 0.77 不等，不是巧合。
白噪音 vs 訊號 ：在控制 VIX 後，這些指數剩下的「殘差」多半是各自的測量噪音（媒體文字隨機性、調查樣本偏差、信用市場流動性 quirk），而不是真正的預測訊號。

這也是為什麼 4 項指數在「樣本內」看起來顯著，但「樣本外」全部敗北： 統計上的顯著性是過去資料雜訊的殘餘共變，不是未來可重複的訊號 。

對一般投資人 / 投資組合經理的實務啟示

1. 不要追逐 VIX 的「替代品」

市面上每隔一陣子就會出現「比 VIX 更聰明的恐慌指數」。K531 加上過去 5+ 項相關研究告訴我們： 所有公開、日頻以下的情緒與不確定性指標，幾乎都被 VIX 吃乾抹淨了 。把研究預算花在這上面，邊際效益接近零。

2. 風險管理該看 VIX，但不要『只看』VIX

VIX 對「未來 20 日波動率」是有預測力的（樣本內 R² 約 0.52），但這不代表它預測方向或報酬。它告訴你的是： 未來幾週市場有多吵雜 ，這對部位大小、避險比率、選擇權買賣權選擇有直接幫助。

3. 真正可能有 alpha 的方向

K531 結論並不否定文字／情緒類資料的所有可能性，只是排除了「市場層級、日頻、公開」這個交集。可能還值得繼續探索的方向有：

更高頻率 （intraday Twitter/X 即時情緒，分鐘級資料）
公司特定（不是市場層級） （FinBERT 解讀單一公司財報電話會議逐字稿）
非公開／另類資料 （衛星影像、信用卡刷卡熱力、企業徵才動態）

但前提是：研究者必須拿出 樣本外證據 ，而不是只秀樣本內統計強度。

4. 對 VT（Volatility Targeting）策略的啟示

如果你正在跑或考慮跑波動率目標策略（VT 是把部位反向 scale 到目標波動率的常見策略），K531 的具體含意是： 沒有任何上述情緒指數作為「VT 訊號 overlay」可以改善 12/VIX 這個經典規則 。把策略複雜度留給更有把握的部分。

研究的局限與 caveat

K531 是 pilot（先導實驗） ：每個指數只用最簡單的線性疊加方式（VIX + sentiment 進入回歸），沒測試非線性互動或 regime-switching 模型。理論上更複雜的模型可能榨出邊際訊號，但要小心過度擬合風險。
頻率限制 ：本研究全部用日頻資料。Intraday（分鐘級或 tick 級）情緒可能還有空間，但需要不同實驗設計。
指標版本敏感性 ：EPU 有月頻和日頻版本，本研究用日頻；Michigan Sentiment 是月頻，內插到日頻，這可能稀釋訊號。後續可考慮事件研究法（event study）對齊公布日。

資料來源

SPY、VIX ：yfinance（Yahoo Finance API），日頻收盤價，2000-02-01 ~ 2026-02-26
USEPUINDXD（EPU） ：FRED 系列代碼，Baker-Bloom-Davis 每日版
UMCSENT ：FRED，密西根大學消費者信心指數（月頻轉日頻）
TEDRATE ：FRED，3 個月 LIBOR-T-bill 利差
BAMLH0A0HYM2 ：FRED，美銀美林美國高收益主指數選擇權調整利差（HY Spread）
樣本數：6,557 個有效交易日

實驗代碼與完整數值結果見內部編號 K531 （experiments/k531/k531_sentiment_nlp_pilot_results.json）。

結語

「故事很美，數據要硬」 —在波動率預測這個領域，這條原則特別重要。

K531 把學界與業界推崇的四項主流情緒／不確定性指數放上嚴格的樣本外檢驗台，得到的結果是 清一色 null ：歷史看起來顯著，未來預測完全沒幫助。這項實驗本身的價值不在於「找到新東西」，而在於 幫整個研究社群刪去一條死路 —下一位研究者可以跳過這四項指數，把精力投在更有可能突破的方向（更高頻、更微觀、非公開資料）上。

對一般投資人，K531 的訊息很直接： 遇到任何號稱『打敗 VIX』的新情緒指標時，第一反應應該是『讓我看看你的樣本外結果』，而不是『這指標好炫，買進』。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

→📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

黃金跌時波動反而縮？石油衝擊下的槓桿非對稱效應

每次股市暴跌，投資人直覺轉向黃金避險，油價卻往往跟著地緣緊張飆升。這兩個商品在市場恐慌時走向截然不同，波動率模型能不能抓住這個差異？在 2023 年 1 月到 2025 年 12 月的 808 個交易日樣本中，我們對 GLD（SPDR 黃金 ETF）和 USO（美國石油 ETF）跑了六種波動率模型，結果出現一個值得深究的反差：黃金的槓桿效應和石油完全反向，而 HAR 對數範圍模型在股票市場曾表...

→