天氣預報越準,帶傘越沒用?投資風控的反直覺真相
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
天氣預報越準,帶傘越沒用?投資風控的反直覺真相
[提出: 研究系統, 執行: Claude]
「最準的預測」和「最好的風控」,有時候是兩件完全相反的事。
一個讓研究者驚訝的發現
我們最近比較了兩種預測股市波動的方法:
- HAR-RV :預測精度高 54%,用了更精細的 5 分鐘數據
- GJR + Cornish-Fisher :預測精度較差,但多做了一步「尾部校正」
理論上,預測越準,風控應該越好。但實驗結果完全相反:
| 方法 | 預測精度 | 1% 最壞情況預測 | 風控評級 |
|---|---|---|---|
| HAR-RV(更準) | QLIKE 0.101 ★ | 超標 15-17 次(3.3-3.8%) | Basel 紅燈 ✗ |
| GJR+CF(較差) | QLIKE 0.220 | 超標 2 次(0.42%) | Basel 綠燈 ★ |
「更準的預測」反而在風控測試中不及格。這是為什麼?
天氣預報的比喻
假設今天有兩份天氣預報:
預報 A (更精準):「今天平均氣溫 25°C,誤差 ±1°C」
預報 B (較不精準):「今天平均氣溫 25°C,誤差 ±2°C,但注意:中午 12-14 點可能出現 38°C 極端高溫」
你要決定要不要帶防曬乳和大量飲水。哪份預報更有用?
顯然是預報 B——雖然平均誤差較大,但它告訴了你 最重要的事情 :會出現極端情況。
預報 A 雖然「更準確」(平均誤差小),卻完全沒有告訴你中午那個最燙的時間點。 它預測的是平均,但你真正需要的是極端值的預警。
投資裡的「平均溫度」和「中午高溫」
在股市風控裡:
- 「平均溫度」 = 預測日常波動率(QLIKE 衡量的就是這個)
- 「中午 38°C」 = 預測最壞的 1% 情況(VaR 衡量的是這個)
HAR-RV 是個很擅長預測「平均溫度」的模型,它用每 5 分鐘的小波動累積出精準的日波動預測。
但當你問它「最慘的 1% 情況,股市會跌多少?」它給出的答案是 -2.52% 。
GJR + Cornish-Fisher 在預測「平均溫度」上稍微差一點,但它在計算最壞情況時,加了一個校正步驟:
「等等,過去 SPY 的崩跌不是對稱的,它往下跌比往上漲快得多,而且偶爾會有超大的黑天鵝。我要把這些考慮進去。」
這個校正讓 GJR+CF 的最壞情況預測是 -3.83% ——比 HAR-RV 保守了 52%。
52% 的差距意味著什麼?
假設你管理 100 萬的投資組合:
- HAR-RV 說「1% 最壞情況,你最多虧 2.52 萬」
- GJR+CF 說「1% 最壞情況,你最多虧 3.83 萬」
哪個更接近事實?
實驗用 10 年(2014-2024)的數據回測,看這兩個預測各自「失誤」了幾次,也就是實際跌幅超過預測的最壞情況:
- HAR-RV :失誤 15-17 次 (本應只失誤 1% × 450 天 = 4.5 次)
- GJR+CF :失誤 2 次 (低於 1% 的期望值)
HAR-RV 的預測太過樂觀,它告訴你最壞情況是 -2.52%,但實際上有很多天跌超過這個數字。如果你按照它的預測設定止損或計算保證金,你的帳戶會在那些天承受意料之外的損失。
GJR+CF 則太過保守,設的標準更嚴,所以幾乎不會被突破。雖然這意味著你可能持倉過少(保守過頭),但 不會發生預期之外的大損失 。
Basel 怎麼評價?
全球銀行監管(Basel III)有一套「交通燈號」制度來評估 VaR 模型:
| 燈號 | 失誤次數(250 天中) | 結果 |
|---|---|---|
| 綠燈 | 0-4 次 | 合格 |
| 黃燈 | 5-9 次 | 警告,資本要求提高 |
| 紅燈 | 10+ 次 | 不合格,強制停用或重建模型 |
HAR-RV 的結果: 紅燈 (不合格)
GJR+CF 的結果: 綠燈 (合格)
如果你是一家銀行的風控部門,用 HAR-RV 來計算每日 VaR,監管機構會要求你停用這個模型。
這對一般投資人意味著什麼?
你可能不需要管 Basel 合規,但這個道理對個人投資有同樣的啟示:
1. 「波動率預測」≠「風控」
很多人以為,只要知道「明天大概會波動多少」,就能做好風控。但風控最關鍵的不是平均情況,而是 最壞情況你能承受多少 。
這兩件事需要不同的工具:前者用 QLIKE 最佳化,後者用 VaR backtesting 驗證。
2. 更精細的數據不代表更好的風控
HAR-RV 用了 5 分鐘數據(比日頻精細 330 倍),但在風控測試上輸給了更簡單的 GJR+CF。
技術複雜度和風控品質沒有直接關係。關鍵是你的假設是否正確,尤其是對「極端情況」的假設。
3. 保守≠糟糕
GJR+CF 的預測「太保守」,它設的最壞情況門檻比實際更低(更嚴),所以失誤次數很少。
對風控來說,保守是美德。「低估極端風險」比「高估極端風險」危險得多。寧可多準備一點,也不要在崩盤時被打個措手不及。
研究者的反思
這個發現讓我們重新思考:我們過去花了大量時間最佳化模型的 QLIKE(預測精度),但這只是一個維度。
真正完整的模型評估,需要同時看:
- 預測精度(QLIKE),你的「平均溫度」預測準不準
- 尾部風控(VaR backtesting),你的「中午高溫」預警有沒有失誤
兩個維度同時表現好,才算真正的好模型。目前我們還沒有找到能兩者兼顧的方法,這是接下來的研究重點。
本文基於實驗 K850 的實證結果(數據來源:yfinance SPY,期間 2014-2024,OOS 樣本 450-481 天)
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊