← 研究動態

研究2026/04/08 上午04:03

天氣預報告訴你「明天平均氣溫 25 度」，但沒告訴你可能颱風——投資風險預測也一樣

CAViaRGARCHSPYVaR波動率預測風險管理分位數預測

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

摘要

你的投資組合有沒有可能一個月內蒸發 15%？傳統的風險模型只告訴你「平均」可能發生什麼，但真正讓投資人徹夜難眠的，從來不是平均，而是最壞的那個情況。我們的研究比較了五種能直接預測「極端風險」的模型，找出了哪一個最能準確預估你真正需要擔心的尾部風險。

[提出: Claude]

你的天氣預報有沒有說過「颱風機率」？

想像一個場景：氣象局告訴你「明天台北平均氣溫 28 度，晴時多雲」。好的，這個「平均預測」很有用，你知道穿短袖就好。

但如果氣象局同時告訴你：「最壞情況下，有 5% 的機率明天下午颱風登陸」，你的決策會完全不同。你可能會提前備糧、把花盆搬進去、取消戶外行程。

投資風險預測也一樣。

傳統的風險模型，就像只報「平均氣溫」的氣象局。它能告訴你「下個月 SPY 預期波動率約 X%」，但對於真正讓人虧大錢的尾部風險，它幾乎無能為力。

什麼是「分位數預測」？一個冰箱溫度的例子

假設你的冰箱平均溫度是 4 度，但某天因為門沒關好，溫度可能飆到 12 度，食物就壞了。如果你只看「平均 4 度」，你永遠不知道什麼時候食物會壞。

分位數預測就是解決這個問題的工具。它不只問「平均風險是多少？」，而是問：

第 5 百分位 ：最好的 5% 情況，波動率會有多低？
第 95 百分位 ：最壞的 5% 情況，波動率會有多高？

換成投資語言：你能預測「最壞 5% 的交易日，你的損失大概在哪個範圍」，這正是 VaR（風險值）的核心精神。

我們測試了哪些模型？

我們用 2006 年到 2025 年共近 20 年的 SPY（標普 500 ETF）日報酬資料，測試了五種不同的分位數預測方法，並以 2016-2025 年（約 2,500 個交易日）做「樣本外驗證」，也就是模型沒看過的真實市場表現：

模型	簡介
CAViaR-SAV	直接對風險值建模，不假設任何分配
GARCH 參數法	傳統 GARCH + Student-t 分配假設
Quantile RF	隨機森林機器學習版本
MF-GJR 參數法	融入 VIX 訊號的進階 GARCH
QR-GARCH	GARCH 特徵 + 分位數迴歸

核心發現：誰預測「最壞情況」最準？

五種分位數模型預測精度比較 圖1：五種模型的平均 Pinball Loss（越低越好）。CAViaR-SAV 和傳統 GARCH 並列最佳，兩者遠優於其他三種方法。

用「Pinball Loss」這個專業評分指標來衡量（分數越低越準），排名如下：

🥇 CAViaR-SAV：40.46 （最佳）
🥈 GARCH 參數法：40.56 （近乎並列）
Quantile RF：43.03
MF-GJR 參數法：43.91
QR-GARCH：44.88

第一個意外發現： CAViaR-SAV 勝出，但傳統 GARCH 幾乎追平。這告訴我們，對於 SPY 這樣的成熟市場，傳統模型已經相當強大。

預測區間有沒有「說到做到」？

光說準還不夠。如果我宣稱「我預測的 90% 區間一定包住 90% 的實際結果」，那到底做不做得到？

90% 預測區間覆蓋率比較 圖2：各模型的 90% 預測區間實際覆蓋率。目標是 90%，CAViaR-SAV 達到 91.2%，QR-GARCH 只有 84.6%，嚴重低估尾部風險。

模型	實際覆蓋率	達標？
CAViaR-SAV	91.2%	✅ 達標
Quantile RF	90.0%	✅ 達標
MF-GJR 參數法	89.3%	✅ 接近達標
GARCH 參數法	88.7%	⚠️ 略低
QR-GARCH	84.6%	❌ 明顯不足

第二個意外發現： QR-GARCH 的覆蓋率只有 84.6%，比目標少了 5.4 個百分點。用白話說：它宣稱「90% 的時間你的損失在這個範圍內」，但實際上有更多的時間損失超過了這個範圍。對投資人來說，這意味著你以為的安全邊際其實比想像的更小。

真正的意外：傳統 GARCH 竟然是黑馬

在 Winkler 評分（同時考慮覆蓋率和預測區間寬度的綜合指標）上，GARCH 參數法和 CAViaR-SAV 幾乎打成平手（0.000902 vs 0.000902）。

這表示：你不需要花大量力氣建立複雜的機器學習模型，一個設定得當的傳統 GARCH 模型，在分位數預測上已經相當有競爭力。

這背後的直覺： SPY 的報酬分配並非完全無法用參數描述。Student-t 分配（GARCH 模型的假設）已經能捕捉大部分的尾部特性。

投資人的實際行動建議

這些研究結果對一般投資人有什麼啟示？

1. 風險管理要問「最壞情況」，不只是「平均情況」

當你評估一個投資組合的風險，不要只看「預期波動率」。問一問：「最壞的 5% 情況，我可能損失多少？」這才是真正保護你的問題。

2. 傳統方法的可靠性不容小覷

在媒體大肆宣傳 AI 和機器學習的時代，我們的研究發現，一個紮實的傳統統計模型（GARCH）在預測極端風險上，表現與複雜機器學習方法相當甚至更好。別為了新潮而拋棄經過時間考驗的工具。

3. 小心「保守到虛假」的風險估計

QR-GARCH 的覆蓋率不足提醒我們：有些風險估計表面上看起來保守（區間比較窄），但實際上低估了真正的尾部風險。如果你的風控模型宣稱「90% 的時間在這個範圍」，要問清楚這個數字是如何驗證的。

結論

預測風險不只是預測「平均」，更要預測「最壞情況」。在五種分位數預測模型中，CAViaR-SAV 表現最佳，覆蓋率準確達到 91.2%，平均預測精度也是五者之冠。令人驚喜的是，傳統 GARCH 參數模型緊追在後，提醒我們不要為了複雜而複雜。

這個研究的限制是：我們只測試了 SPY 一個資產，未來需要驗證這些結論是否在其他市場（如台股、新興市場）同樣成立。

本文基於實驗 K941 的實證結果（數據來源：yfinance，期間：2006-2025，樣本外驗證：2016-2025，N=2,513 個交易日）

相關文章

先讀正式關聯，若無則使用標籤與主題相似度補齊

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

黃金跌時波動反而縮？石油衝擊下的槓桿非對稱效應

每次股市暴跌，投資人直覺轉向黃金避險，油價卻往往跟著地緣緊張飆升。這兩個商品在市場恐慌時走向截然不同，波動率模型能不能抓住這個差異？在 2023 年 1 月到 2025 年 12 月的 808 個交易日樣本中，我們對 GLD（SPDR 黃金 ETF）和 USO（美國石油 ETF）跑了六種波動率模型，結果出現一個值得深究的反差：黃金的槓桿效應和石油完全反向，而 HAR 對數範圍模型在股票市場曾表...