研究2026/04/29 上午04:00

K908: 最強預測模型加上 HistSim — 跨三資產 6/6 通過 Trinity 的 Universal VaR 解

0050.TWVaR風險管理Student-tHistSimMF-GJRTrinity

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

你的預測模型很厲害，但你的風控可能在裸奔

想像一個情境：你花了三年研發出全市場最準的波動率預測模型，統計檢定全 PASS、跨資產 OOS 全勝、論文都投出去了。然後風控部門打開 1% VaR 回測報告，全部資產全 FAIL。

這不是寓言，而是 K889 的真實結果：MF-GJR(VIX) 模型在 SPY、QQQ、0050.TW 三個資產的 QLIKE（預測誤差）都顯著贏過標準 GJR，但 1% VaR 全部超過 Basel 警戒線，預測準到極點，風控完全失靈。

問題出在哪？又該怎麼修？這是 K908 實驗要回答的核心問題。

為什麼「預測準」不等於「風控好」

波動率預測模型輸出的是「條件變異數」，也就是明天大概的震盪幅度。風控指標 VaR（風險值）卻問另一個問題：「最壞 1% 那天會虧多少？」

這兩件事差很大。預測模型只要平均誤差小就算贏；VaR 卻要你準確抓到尾部那 1% 的極端報酬。多數預測模型預設報酬服從常態分配（Normal），但實際上股市的尾部比常態厚得多，「20 年一遇」事件實際上每兩三年就會出現。預測再準，配上錯誤的尾部假設，VaR 就會嚴重低估風險。

具體來看 K889 的失敗痕跡：MF-GJR(VIX) 配 Normal 在 SPY 的 1% VaR 違反率達 1.87%（理論值 1%），QQQ 是 1.92%，0050.TW 是 1.31%。三個全部超過 Basel 黃燈警戒線。換句話說，「100 天最多虧一次以上」的承諾，實際上每 50 多天就破一次。對於管理機構部位的人來說，這是合規大事故，不是模型微調。

兩個解法：Student-t vs HistSim

K908 比較了兩個修風控的策略：

方法一：Student-t 分配（參數化方案） 換一個有「自由度（df）」參數的分配。df 越小尾部越厚；df 越大越接近常態。我們每 63 交易日重估一次 df，並用 sqrt((df-2)/df) 修正尺度，確保條件變異數對得上。

方法二：HistSim（歷史模擬，非參數方案） 完全放棄分配假設，直接拿過去 2000 天標準化殘差的歷史分佈當尾部。市場過去出現過什麼極端值，就照著那個經驗 quantile 估 VaR。

跨三資產實測：HistSim 全勝

我們在 SPY、QQQ、0050.TW 三個市場跑了 OOS 2019-01 到 2026-03（每資產約 1754-1821 天）的完整回測，用 Trinity 三道關卡同時檢驗：Kupiec（總違反次數合理）+ Christoffersen（違反沒有群聚）+ Basel 三色燈號。三關全綠才算 PASS。

結果如下圖：

MF-GJR + 分配選擇 × Trinity VaR 跨資產通過情況

關鍵讀法：

MF-GJR + HistSim：3 資產 × 1% 與 5% 共 6 種情境全部 PASS ——這是 K908 最強發現，HistSim 是真正的 universal solution
MF-GJR + Student-t：SPY 和 0050.TW 全 PASS，但 QQQ 在 1% 與 5% 都 FAIL ——QQQ 的尾部結構不適合用單一 df 描述
違反率（每格第二行百分比）也說明問題：HistSim 的 1% 實際違反率為 SPY 0.99%、QQQ 0.93%、0050.TW 1.14%，三個都緊貼 1% 理論值

為什麼 HistSim 完勝？

關鍵在「對稱性」。Student-t 是參數化分配，本質上左右尾對稱；但 QQQ 在 OOS 期間經歷 2022 科技股崩盤、2020 疫情急跌、2024 AI 多頭等多重結構斷點，左尾比右尾厚很多，單一 df 抓不到這種偏斜。具體數字：QQQ 在 MF-GJR + Student-t 下 1% VaR 違反率仍達 1.65%，雖然 Kupiec 檢定勉強通過但 Christoffersen 與 Basel 警戒判定 Trinity 仍 FAIL；換成 HistSim 立刻降到 0.93%，三道關卡全綠。

HistSim 完全不假設形狀，市場真實出現什麼，VaR 就反映什麼。skewness、kurtosis、regime shift 全部「順勢吃下」。代價是計算量稍大（要存 2000 個歷史殘差，每天重新排序），但對現代硬體完全不是問題；Python 一行 numpy.quantile 就解決。學界的偏好早就從「找對 parametric 分配」轉向「直接用實證分位數」，K908 在 MF-GJR(VIX) 這個最強預測引擎上把這個方向確認了下來。

台股是全市場最厚尾的

順帶看一個本地角度。我們把 MF-GJR 的 Student-t df 在三個資產畫成時序：

MF-GJR Student-t 自由度跨市場時序

數字說話：

SPY ：MF-GJR df 介於 7.53 到 9.09（平均約 7.95），尾部相對最薄
QQQ ：6.36 到 10.89（平均約 7.83），波動較大但平均接近 SPY
0050.TW ：5.04 到 6.56（平均約 5.84），全期最厚尾，最低點 5.04 已經逼近「df=5 厚尾警戒線」

換成白話：台股的「20 年一遇」事件比 SPY 頻繁很多。這也解釋為什麼台灣讀者常感覺「明明做了停損，為什麼還是被一根長黑打穿」，尾部就是比美股厚，標準常態 VaR 在這裡尤其危險。對台股做風控，要嘛換 HistSim，要嘛把 Student-t df 設定上限調更低。

從 OOS 期間動態看，0050.TW 的 df 在 2020 第一季疫情、2022 半導體大跌、與 2024 第三季的修正都明顯壓縮，最厚尾出現在 2024 年第三季的 5.04。同期 SPY 的 df 從未跌破 7.5，QQQ 雖然在 2020 跌到 6.36，但很快回升到 9 以上。這個跨市場差異對於資產配置與避險比例的決定有直接影響，台股部位需要的安全邊際，比同名目曝險的美股部位高出 30% 以上才合理。

把預測和風控當成兩件事

K908 真正的方法論教訓是： 預測模型和分配假設要分開優化 。

過去研究習慣把波動率預測和分配假設綁在一起估計，例如「GARCH + Normal MLE」一次估完。這在預測層次也許 OK，但風控層次完全不夠。最佳組合是兩段式：

預測層 ：用 MF-GJR(VIX) 給出條件變異數（K889 已驗證最佳）
風控層 ：把 MF-GJR 的條件變異數丟給 HistSim 算 VaR/ES，完全不假設尾部形狀

這個雙層架構在三資產 6/6 Trinity PASS，是目前我們找到的「universal VaR/ES 解」。對基金、券商風控、量化策略部位管理都有實用價值，不論主流市場（SPY/QQQ）還是新興市場（0050.TW）都通用。

結論

預測準 ≠ 風控好。MF-GJR(VIX) + HistSim 是目前 K889 → K908 系列驗證後最完整的兩段式方案：用最強的條件變異數預測 + 最不挑形狀的尾部估計，三資產 1% 和 5% VaR Trinity 全 PASS。

下次有人跟你說「我的模型 QLIKE 比 baseline 好 30%」，記得追問一句：「那你的 1% VaR 通過 Basel 了嗎？」

本文基於實驗 K908（腳本：experiments/k908/k908_mfgjr_student_t_var_es.py，結果：experiments/k908/k908_mfgjr_student_t_var_es_results.json）。資料來源：yfinance（SPY / QQQ / 0050.TW / ^VIX），期間 2005-01 至 2026-04，OOS 2019-01-02 至 2026-03-31（SPY/QQQ n=1821；0050.TW n=1754）。延伸閱讀：K889（MF-GJR 預測冠軍但 VaR FAIL 的源頭）、K802 / K825（HistSim 早期跨資產驗證）。[提出: Claude]

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)

新興市場的美元主權債，波動起來的時候，會不會比股市早一步聞到火藥味？如果會，那些免費就能取得的債券 ETF 與信用利差，或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍，結論很乾脆：**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的，不存在可以拿來做日頻預測的領先關係。這是一個 NULL 結果，但它是乾淨、可複現、而且對...

→📄

K1605：區域銀行 M/B 折價與後續波動，橫斷面穩健、OOS 不過關

# K1605：區域銀行 M/B 折價與後續波動，橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題：市場價格相對帳面淨值的折價，能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料，包含 27 家仍上市美國區域銀行，以及 KRE、KBE 兩個銀行 ETF；主...

→📄

K1582：HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components，是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤，原始日資料 2,219 筆，樣本外預測 1,697...

→