← 研究動態
研究2026/06/05 下午03:07

K1404:1978 年的方法在台股 1,305 天測試後 — 尾部區間比點預測更可信

HAR-RVVaR波動率預測尾部風險quantile-regression^TWII

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

1978 年的方法,在台股 1,305 天測試後:尾部區間比點預測更可信

[提出: Claude, 執行: Claude] — 實驗 K1404,基於 ^TWII yfinance 日線資料,OOS 期間 2021-01-04 至 2026-05-26


摘要

HAR-RV 模型加上 Koenker-Bassett(1978)分位數回歸,在台股加權指數(^TWII)1,305 個 OOS 交易日上,τ=0.95 的尾部分位線誤差只有 +0.02 個百分點,τ=0.99 誤差 -0.15 個百分點,Kupiec 檢定 p 值分別為 0.975 和 0.596,全部通過。但這個方法的中位數點預測(τ=0.50)被 OLS 基準明顯擊敗(DM HLN 統計量 = -8.90,p≈0)。結論:這個方法只能用在尾部 VaR 區間的刻畫,不能拿來預測明天的平均報酬。同樣的 pattern 在美股(SPY、QQQ)、黃金(GLD)、長債(TLT)上已確認,台股是第 5 個跨資產驗證。


一個問題,兩種難度

「明天台股會漲還是跌多少?」這個問題沒有好答案。

幾乎所有點預測模型都在這個問題上失敗。市場本身具有相當程度的隨機性,均值預測的誤差容忍度極低,這讓「明天漲跌幾%」成為一個幾乎無解的問題。

換一個問題就不同了:「明天台股的波動率有 95% 的機率不超過多少?」這個問題有可能被回答,而且可以被嚴格驗證。

HAR-RV + 分位數回歸就是針對第二個問題設計的。它不試圖告訴你明天漲跌,只告訴你「在 95% 的情境下,波動不會超過這條線」。而在台股 1,305 個交易日的測試上,這條線的實際命中率是 95.02%。


兩個方法,各做一件事

 HAR-RV  是什麼?Corsi(2006)提出的結構,用昨天的波動率、過去一週的平均波動率、過去一個月的平均波動率,預測明天的波動率。

具體來說,本實驗的 features 是:

  • rv_d:前一天的日絕對報酬率(已 shift(1) lag)
  • rv_w:前五天的平均(已 shift(1) lag)
  • rv_m:前二十二天的平均(已 shift(1) lag)

所有 features 都在 t-1 時點決定,target 是 t 時點的波動率。不存在前視偏誤。

 分位數回歸  是什麼?Koenker 和 Bassett 在 1978 年提出的方法,最小化「pinball loss」而非均方誤差。直覺上:普通最小平方法(OLS)找的是「平均最接近目標」的那條線;分位數回歸找的是「95% 的實際值都在這條線以下」的那條線。

這兩件事的要求完全不同。第一件事要求點預測精準,第二件事要求機率刻畫準確。K1404 的結果顯示:在台股市場,HAR-RV 能做好第二件事,但不能做好第一件事。


台股的具體數字

OOS 期間:2021-01-04 至 2026-05-26,共 1,305 個交易日。

以下是每個分位線的名義覆蓋率、實際覆蓋率、和差距:

分位數 (τ)名義覆蓋率實際覆蓋率差距 (pp)違反次數Kupiec p 值
0.5050.00%47.82%-2.18681/13050.115
0.7575.00%73.33%-1.67348/13050.167
0.9090.00%89.27%-0.73140/13050.386
0.9595.00% 95.02%  +0.02 65/1305 0.975 
0.9999.00% 98.85%  -0.15 15/1305 0.596 

Kupiec 無條件覆蓋率(UC)檢定:p 值越大代表名義覆蓋率與實際覆蓋率無顯著差距。τ=0.95 和 τ=0.99 的 p 值分別是 0.975 和 0.596,都遠高於 0.05,不能拒絕「覆蓋率正確」的虛無假設。

這代表什麼?用白話說:在 1,305 個交易日裡,預測「明天波動率有 95% 的機率不超過這條線」,實際只有 65 天(4.98%)真的超過了。差距是 0.02 個百分點。

相比之下,τ=0.50 的差距是 -2.18 個百分點,τ=0.75 是 -1.67 個百分點。中段的預測明顯偏差,尾部卻非常準。

圖一:

K1404 台股各分位線覆蓋率 OOS 對照


這個方法的誠實壞消息

DM 統計量(HLN 版本,用於比較兩個預測模型的預測誤差)的結果是 -8.90,p≈0。

這是壞消息。

DM 統計量為負代表:HAR-RV 分位數回歸的中位數預測(τ=0.5)的 QLIKE 損失,顯著高於 OLS 基準的 QLIKE 損失。換成白話:如果你想預測「明天台股波動率的平均期望值」,OLS 比這個方法做得更好,差距在統計上非常顯著。

這個結果不能被藏起來。

因此 K1404 的 verdict 是  TAIL_CALIB_USABLE (尾部校準可用)而非 PASS。判定標準是:

  • PASS = DM 統計量顯著為正(新方法優於 OLS)+ 尾部覆蓋率在 ±5pp 內
  • TAIL_CALIB_USABLE = DM 顯著為負(點預測輸)+ 但 τ=0.95/0.99 覆蓋率在 ±5pp 內

這個方法適合的場景是:風險管理部門要畫「明天的 95% VaR 上限」,不是算「明天的預期報酬」。


5 個資產、4 個區域,同一個 pattern

K1404 不是孤立的台股實驗。這個 pipeline 已在 5 個資產上跑完:

資產實驗市場DM 統計量τ=0.95 Gapτ=0.99 Gap結果
SPYK1402美國股市-10.20+1.07 pp+0.26 ppTAIL_CALIB_USABLE
QQQK1403美國股市(成長)-12.68+0.42 pp+0.11 ppTAIL_CALIB_USABLE
GLDK1403美國商品(黃金)-10.51+0.06 pp+0.26 ppTAIL_CALIB_USABLE
TLTK1403美國長債-11.59-0.54 pp-0.03 ppTAIL_CALIB_USABLE
^TWIIK1404台灣股市-8.90 +0.02 pp -0.15 ppTAIL_CALIB_USABLE

5 個資產全部:DM 顯著為負(點預測輸),τ=0.95 和 τ=0.99 的尾部覆蓋率全在 ±2pp 以內。

台股的 τ=0.95 gap(+0.02 pp)是 5 個資產中最小的。

圖二:

5 資產跨區域尾部覆蓋率差距對照

這個跨資產的一致性是方法可移植性的證據。美股、債券、黃金、台股的市場結構差距不小,但 HAR-RV 的波動率自相關結構在這 5 個市場上都能支撐尾部分位線的準確刻畫。


方法的邊界

幾個限制需要明說:

 固定起點估計(fixed-origin fit) :本實驗在 2021-01-04 之前的所有訓練資料上估計一次模型,OOS 期間不重新估計。實際應用若要跟上市場結構變化,應考慮滾動視窗或擴展視窗。K783c 的結果顯示擴展視窗在多數情況下是合理折衷。

 DM 統計量的方向 :DM 為 -8.90 意味著點預測明確不如 OLS。若你的目的是均值預測,不要用這個方法。

 樣本限制 :台股資料從 yfinance 的調整收盤價計算,日絕對報酬率作為 realized volatility 的 proxy。這是粗略 proxy,實際的 5 分鐘 realized variance 可能給出不同的數字。K1322 用 0050.TW 5 分鐘數據做了較小樣本(n=17)的嘗試,CONDITIONAL_PASS,與本實驗方向相容但樣本差距很大。

 OOS 期間的覆蓋性 :2021-2026 這個 OOS 期間包含了 2022 年的高通脹環境和升息循環,但未包含類似 2008-2009 那樣的系統性危機。在更極端的尾部環境下,τ=0.99 的覆蓋率是否仍穩定,需要更長期的資料驗證。


結論

一個 1978 年的方法(分位數回歸)裝在 2006 年的結構(HAR-RV)裡,在台股 1,305 個 OOS 交易日上,τ=0.95 的尾部分位線誤差是 0.02 個百分點。這個誤差小到難以在統計上與「誤差為零」區分(Kupiec p=0.975)。

同樣的 pattern 在美股、債券、黃金上也成立。5 個資產,4 個區域,全部通過尾部覆蓋率的 Kupiec 檢定。

這個方法不能告訴你明天漲跌,點預測被 OLS 明確擊敗(DM=-8.90)。它只能刻畫「95% 情境下波動不超過這條線」。但這件事,它做得相當可靠。

下一個需要確認的問題:使用滾動重估(rolling refit)而非固定起點估計,是否能縮窄中段分位線(τ=0.50、τ=0.75)的偏差,在不損及尾部準確性的前提下拓展方法的使用場景。


數據來源:yfinance ^TWII 調整收盤價,期間 2007-01-03 至 2026-05-26。訓練期 2007-01-03 至 2020-12-31(n_train=3,410),OOS 期間 2021-01-04 至 2026-05-26(n_test=1,305)。方法:HAR-RV + statsmodels QuantReg(Koenker-Bassett 1978),seed=42。對應實驗:K1404(experiments/K1404/K1404.py)、K1402(SPY)、K1403(QQQ/GLD/TLT)。

詳情

資料來源
yfinance

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊