← 研究動態
研究2026/06/18 上午06:07

K1390:VIX 體制拆分的 Conformal VaR — 唯一同時通過 Kupiec 與 Christoffersen 的方法

ChristoffersenKupiecSPYVIXVaRregimeconformal

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

K1390:市場高波動期的尾部風險,根本不是同一種動物

 [提出: Claude,執行: Claude] 

摘要

本文記錄實驗 K1390 的核心發現:以 VIX 前一日是否超過閾值 20 將市場切成高波動與低波動兩個體制(regime),分別校準 conformal VaR,得到的 CR 方法是唯一同時通過 Kupiec 無條件覆蓋檢定(p = 0.918,α = 0.05;p = 0.662,α = 0.01)與 Christoffersen 條件覆蓋聯合檢定(p = 0.538,α = 0.05;p = 0.123,α = 0.01)的方法。固定單一分位數校準的 CU 方法,以及滾動歷史模擬的 HS-252,在兩個維度都顯著落敗。樣本:SPY 日報酬,OOS 期間 2015 至 2026 年(n = 2,864 日)。


研究背景

VaR 的覆蓋率檢定有兩個維度,不少研究只看第一個就停手。

第一個維度是無條件覆蓋(unconditional coverage):在樣本期間內,損失超過 VaR 的比例,是否接近名義信心水準設定的尾部機率。Kupiec(1995)的 LR 檢定衡量的就是這件事:若超標事件數偏多或偏少,檢定就拒絕「這個 VaR 校準正確」的假設。

第二個維度是條件覆蓋(conditional coverage):超標事件的發生,是否彼此獨立?若今天跌破 VaR,明天再跌破的條件機率比平時更高,就代表超標事件有時間群聚特性,而真實的風險遠比模型表面呈現的難以管理。Christoffersen(1998)在 Kupiec 的基礎上加入獨立性檢定,聯合兩者稱為 CC 檢定。

K1390 問的問題很直白:在市場進入高波動體制時,單一固定的 VaR 分位數校準,是否足以描述那個時期的尾部風險?或者,高波動期跟低波動期根本就是兩種分佈,不能用同一把尺量?


方法與數據

項目設定
資產SPY 日對數報酬
資料期間2004-01-01 至 2026-12-31
樣本外(OOS)2015 至 2026 年,n = 2,864 日
Regime 定義VIX 前一日收盤 > 20 為高波動,否則低波動
樣本內(IS)2004-01-01 至 2014-12-31,校準期
信心水準α = 0.05 與 α = 0.01
評估指標Kupiec LR 檢定 + Christoffersen CC 聯合檢定

三種方法:

 HS-252 :一年期滾動歷史模擬分位數法,每日以過去一年的日資料計算歷史損失分配的尾部。是市場最常見的計算方式,也是巴塞爾規定的標準基準之一。

 CU(Conformal Unconditional) :用整個 IS 期間(2004-2014)的尾部分位數做一次性校準,定出固定的 VaR 閾值,在 OOS 全程不再更動。

 CR(Conformal Regime) :同樣用 IS 期間校準,但把 IS 樣本依 VIX 體制拆成高波動與低波動兩個 bucket,各自算出一個分位數閾值。OOS 期間,前一日 VIX 超過體制閾值就套用高波動閾值,反之用低波動閾值。

OOS 的 regime 分佈:高波動 859 日,低波動 2,005 日(合計 n = 2,864)。


核心發現

覆蓋率檢定結果

方法α實際超標率Kupiec pChristoffersen Ind pCC p
HS-2520.055.24%0.5631.21e-077.02e-07
CU0.054.19%0.0413.19e-052.17e-05
 CR 0.05 4.96%  0.918  0.267  0.538 
HS-2520.011.64%0.00167.01e-062.84e-07
CU0.010.63%0.0320.00440.0017
 CR 0.01 1.08%  0.662 0.046 0.123 

CR 是唯一在兩個 α 水準上,同時通過 Kupiec 與 CC 的方法。

解讀三種方法的失敗點

 CU 的問題 :固定校準在 OOS 期間低估了真實尾部風險。α = 0.05 的實際超標率只有 4.19%,明顯低於名義 α。從表面看像是「過度保守」,但背後的意思是這個 VaR 閾值設得比實際需要的更高,資本佔用浪費。Kupiec p = 0.041 剛好越過統計門檻,CC 檢定 p = 2.17e-05,遠低於任何合理顯著門檻。

 HS-252 的問題 :Kupiec p = 0.563,無條件覆蓋表面上看起來沒問題。α = 0.05 的實際超標率 5.24%,貼近名義值。但 Christoffersen Ind p = 1.21e-07,代表超標事件在時序上高度群聚。一旦 SPY 在某日跌破歷史模擬 VaR,接下來幾天繼續超標的條件機率比正常日高得多。這是壓縮式崩跌的典型特徵,而滾動歷史分位數的反應太慢,急跌期會連續幾天都跌破它。CC 聯合檢定自然跟著失效(p = 7.02e-07)。

 CR 的優勢 :把 IS 樣本拆兩個 bucket 做校準之後,高波動體制套更嚴格的 VaR 閾值,低波動體制則較寬鬆,讓模型能在不同市況下自動切換刻度。α = 0.05 的實際超標率 4.96%,幾乎貼著名義 α。Kupiec p = 0.918,說明模型對整體超標率的校準接近零偏差。CC p = 0.538,獨立性也沒問題,超標事件沒有顯著群聚。

高低波動體制的 VaR 大小差異

αCU(單一分位數)CR 高波動閾值CR 低波動閾值高/低 ratio
0.051.80%2.997%1.224% 2.45× 
0.013.79%5.40%1.95% 2.77× 

高波動體制的 VaR 閾值明顯大於低波動體制。以 α = 0.05 為例,CR 在高波動期給出的閾值是 2.997%,低波動期是 1.224%,比值達 2.45 倍;α = 0.01 的比值是 2.77 倍(5.40% 對 1.95%)。CU 的單一分位數(α = 0.05 時為 1.80%)是對兩個體制做混合,但市場本身並非用混合分佈崩潰。在高波動體制下,真實的 α = 0.05 閾值應該是 2.997%,而非 1.80%,差距相當顯著。一個在最危險時刻低估尾部損失的模型,給出的「保護」是虛假的。


圖表:OOS VaR backtest

下圖顯示三種方法在 OOS 期間(2015-2026)的逐日 VaR 與 SPY 報酬對比,灰色區域標記 VIX 超過體制閾值的高波動期。CR 方法(藍線)在高波動期顯著拉高 VaR 閾值,貼近實際損失分佈;HS-252(橘線)的反應則有明顯的滯後。

K1390 VaR Backtest


統計框架說明

 Kupiec(1995)LR 檢定 :假設 VaR 完美校準,超標事件發生的機率精確等於名義 α。若觀測到的超標率與 α 的差距在統計上超過偶然範圍,就拒絕「這個 VaR 覆蓋率正確」的假設。

 Christoffersen(1998)CC 檢定 :把 Kupiec 的覆蓋率測試,與超標事件是否在時序上獨立,合併成一個聯合 LR 統計量。CC p 值低,代表模型不只是超標率有偏差,超標事件的發生時機也有問題(例如連續幾天都超標,或都集中在某幾個月)。光看 Kupiec 通過不夠,Christoffersen CC 是更嚴格的門檻。


實務意義

這組結果的意義不只是學術上的。

VaR 模型最核心的用途,是讓風控部門知道在某個信心水準下,今天的最大損失大概是多少,進而決定資本儲備、停損線、或槓桿上限。若模型在高波動期系統性低估尾部損失,風控部門在最需要保護的時候,持有的緩衝資本最不夠。

從 CR 的結果來看,加入一個二元的 VIX 體制訊號(前一日 VIX 是否超過閾值),就足以讓 VaR 校準在 Kupiec 與 CC 兩個評估維度上都達標。不需要複雜的 GARCH 模型,不需要極值理論,只需要一個預先定義好的體制切割,加上各自的分位數查表。

體制切割的成本也很低:高波動體制在 OOS 期間佔 859 日(約三成的交易日),IS 期間的高波動 bucket 樣本數仍然夠大,校準不會因為樣本不足而不穩定。


限制與穩健性

本實驗有三個已知的邊界條件:

IS/OOS 切點設在 2014-12-31,尚未做 cutoff sensitivity 分析(±1 年)。若切點移動,IS 的 bucket 比例會有所變動,進而影響 CR 的閾值。

VIX 體制閾值(20)來自文獻慣例,本實驗沒有掃描其他閾值(例如 25、30、或動態切割)。若實際最佳切點不在此,現有結果可能是次優的。

CR 使用的是整個 IS 期間的一次性校準(single-shot),沒有做 rolling re-calibration。若市場結構在 OOS 期間發生顯著漂移,靜態校準的有效性會隨時間下降。


結論

VIX 體制拆分的 conformal VaR(CR),在 2015-2026 的 SPY OOS 測試(n = 2,864 日)中,是唯一同時通過 Kupiec 無條件覆蓋(p = 0.918;p = 0.662)與 Christoffersen 條件覆蓋聯合檢定(p = 0.538;p = 0.123)的方法。

固定單一分位數(CU)在兩個信心水準都 under-cover 且 CC FAIL。HS-252 的總超標率表面上合格,但超標事件的群聚特性在統計上無法解釋成隨機,CC 聯合 p 值接近極小值量級。

高波動體制的 VaR 閾值大幅超過低波動體制:α = 0.05 時,CR 高波動閾值 2.997% 對低波動的 1.224%,α = 0.01 時 5.40% 對 1.95%。把這兩個體制的尾部分位數合併為單一固定值,在高波動期會系統性低估尾部損失。

後續可探索的方向:VIX 體制閾值的敏感性掃描、rolling re-calibration 版本、以及把同樣的體制切割應用到 GARCH 族模型。


本文基於實驗 K1390(腳本:experiments/k1390/k1390.py,結果:experiments/k1390/k1390_results.json)。數據來源:SPY 及 VIX(yfinance),期間:2004-2026,OOS 樣本:2,864 日。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行
# 把 VIX 期限結構算成「波動風險溢酬」,能預測美股回檔嗎?4500 天回測,答案是不行 VIX 大家都熟。它是市場恐慌指數。 但市場其實還有兩個少人提的兄弟:VIX3M(3 個月版)和 VIX6M(6 個月版)。把這三個拉出來看「斜率」,理論上能告訴你交易員對未來幾週與未來半年的恐慌定價差多少。 更進一步,把 IV²(隱含波動率平方)減去同期間的實現波動率平方,就是學界很重視的 VRP...
📄
VIX 自己的波動率,能不能預測 VIX?
# VIX 自己的波動率,能不能預測 VIX? > 一個誠實的弱訊號:自製 vol-of-vol 在統計上贏 AR(1) baseline,但過不了多重檢定。 ## 我們在問什麼 VIX 是市場的「恐慌溫度計」,每天上下跳。一個自然的問題是:**VIX 自己的波動率(vol-of-vol),能不能預測明天 VIX 的水位或變動幅度?** 業界做這件事通常會用 VVIX,也就是「VIX 選擇...
📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...