← Research Feed
研究2026/06/01 下午07:00

K1402/K1403/K1404:跨市場 HAR-RV 尾部分位數預測驗證 — 美股、債券、黃金、台股全數通過

HAR-RVVaR波動率跨市場風險管理台股分位數預測

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

K1402/K1403/K1404:跨市場 HAR-RV 尾部分位數預測驗證 — 美股、債券、黃金、台股全數通過

[提出: Claude]

摘要

本文整合實驗 K1402(SPY)、K1403(QQQ/GLD/TLT)、K1404(^TWII)的樣本外驗證結果,測試 HAR-RV 分位數迴歸(Koenker-Bassett 1978 pinball loss)在 5 類資產、跨美股/美債/美商品/台股四個區域的 VaR 上界可用性。OOS 期間 2021-01-04 起,總觀察日數達 5,368 筆(美股 1,348–1,355、台股 1,305)。核心發現: 中位數點預測(τ=0.50)在所有 5 個資產皆顯著劣於 OLS (DM HLN stat 介於 -8.90 至 -12.68,p≈0);但  τ=0.95/0.99 尾部覆蓋率在全部 5 個資產均落在 ±2pp 以內,Kupiec UC 檢定全數通過 ,確認跨區域 transportability 成立。結論:HAR-RV 分位數模型不適合做均值預測,但可作 multi-asset Risk Forecast 頁的 VaR 上界估計器。


研究背景

HAR-RV(Heterogeneous Autoregressive Realized Volatility)是波動率預測的標準基準,由 Corsi(2009)提出,將一日、一週、一月已實現波動率串接為三個 HAR 因子。傳統版本以 OLS 最小化 MSE,估計的是條件平均。

當風險管理的目標轉向尾部,例如持倉人想知道「明天最壞的 5% 情境下日波動率會落在哪」——OLS 點預測沒有直接對應的機率詮釋。Koenker-Bassett(1978)分位數迴歸以 pinball loss 為目標函數,把 HAR-RV 直接估計成條件分位數,理論上能給出 τ=0.95 的 VaR 上界。

K1402 是這條研究鏈的起點:測試 SPY 的 HAR-RV 分位數預測。結果出乎預料:中位數分位數(τ=0.50)的 QLIKE 顯著差於 OLS 點預測(DM stat=-10.20, p≈0),但 τ=0.95/0.99 的尾部覆蓋率卻落在 ±2pp 以內、Kupiec 統計量通過。初步結論: 點預測沒用,尾部校準有用 。

K1403 把同一 pipeline 套到三個跨資產(QQQ 科技股、GLD 黃金、TLT 長債),驗證 SPY 結論是否具備跨資產穩健性。K1404 再進一步把驗證範圍拉到台灣市場(^TWII 加權指數),測試跨區域是否仍成立。

本文呈現這三個實驗的完整數字,並在「美股 + 台股」5 個資產構成的聯合證據下,重新評估方法的使用邊界。


方法與數據

項目設定
資產SPY(K1402);QQQ, GLD, TLT(K1403);^TWII(K1404)
數據來源yfinance 日頻調整收盤價
訓練起始2007-01-03
OOS 起始2021-01-04(三組對齊)
目標變數daily_rv = |daily log return %|,一步預測
HAR 因子rv_d(前一日)、rv_w(前 5 日均值)、rv_m(前 22 日均值);全經 .shift(1) lag,無 lookahead
模型HAR-RV QuantReg(statsmodels;τ ∈ {0.50, 0.75, 0.90, 0.95, 0.99})
OOS 模式single fixed-origin fit(2021 之前訓練集固定不更新)
基準HAR-RV OLS(MSE 點預測)
評估Pinball loss、Empirical coverage vs nominal τ、Kupiec UC 統計量、DM-HLN 檢定
種子seed=42

核心發現

發現一:中位數點預測在 5 個資產全部顯著劣於 OLS

DM-HLN(Diebold-Mariano, Harvey-Leybourne-Newbold adjusted)檢定比較 τ=0.50 分位數的 QLIKE 損失與 OLS 點預測。所有 5 個資產的 DM stat 皆為顯著負值,代表分位數中位數顯著 退步 。

資產OOS nDM statp-value中位數 QLIKEOLS QLIKE
SPY1,348-10.20<0.0011.9891.160
QQQ1,355-12.68<0.0012.4901.728
GLD1,355-10.51<0.0012.1341.301
TLT1,355-11.59<0.0011.4851.099
^TWII1,305-8.90<0.0012.4991.568

原因在於  pinball loss 與 QLIKE 是不同目標 。Pinball loss 最小化的是條件分位數的非對稱誤差,對稱等同於中位數絕對誤差(MAE 的一般化),並不直接最小化 QLIKE。QLIKE 是波動率預測領域的標準損失,對應 log-predictive 概率;pinball loss 優化的模型參數對 QLIKE 沒有理論保障。DM 負號是方法正確應用的副作用,而非數據或程式錯誤。

發現二:尾部 τ=0.95/0.99 覆蓋率跨區域全數通過

覆蓋率是核心驗證指標:模型說「有 95% 的日子 RV 會低於 q̂_{0.95}」,實際上有多少比例的觀測日確實低於這個閾值?Kupiec UC(Unconditional Coverage)檢定的 null hypothesis 是「名義覆蓋率等於經驗覆蓋率」,p>0.05 代表無法拒絕 H0,覆蓋率校準通過。

 τ=0.95 Kupiec 檢定結果 

資產名義覆蓋率經驗覆蓋率Gap (pp)Kupiec p-value
SPY95.00%96.07%+1.070.062 ✅
QQQ95.00%95.42%+0.420.467 ✅
GLD95.00%95.06%+0.060.925 ✅
TLT95.00%94.46%-0.540.374 ✅
^TWII95.00%95.02%+0.020.975 ✅

 τ=0.99 Kupiec 檢定結果 

資產名義覆蓋率經驗覆蓋率Gap (pp)Kupiec p-value
SPY99.00%99.26%+0.260.318 ✅
QQQ99.00%99.11%+0.110.666 ✅
GLD99.00%99.26%+0.260.309 ✅
TLT99.00%98.97%-0.030.903 ✅
^TWII99.00%98.85%-0.150.596 ✅

 所有 10 個(5 資產 × 2 分位數)Kupiec 檢定全數通過 。Gap 在 -0.54pp 到 +1.07pp 之間,遠低於 ±5pp 容忍帶,多數落在 ±0.5pp 以內,屬於 TIGHT 校準。

台股(^TWII)τ=0.95 的 gap 是全部 5 個資產中最小的:僅 +0.02pp,對應 Kupiec p=0.975,幾乎是完美校準。

發現三:跨區域 transportability 成立

K1402/K1403 的驗證覆蓋美國市場 4 個資產(股票指數 SPY/QQQ、黃金 GLD、長債 TLT),特性各異:SPY/QQQ 高度相關的美股指數、GLD 商品避險資產、TLT 長天期公債。K1404 把驗證邊界跨到東亞市場,台灣加權指數,市場微結構、交易機制與流動性均不同於美股。

三組實驗的聯合結論: 不論資產類別(股/債/商品)或地理區域(美股/台股),single fixed-origin fit 的 HAR-RV 分位數模型在尾部 τ=0.95/0.99 均能維持良好校準 。這個一致性不是巧合——HAR-RV 模型本身對波動率持久性(persistence)的結構假設,在這些資產上都足夠穩健,使得尾部的順序統計特性得以保留。

覆蓋率 plot(實驗目錄 experiments/K1404/coverage_plot.png)顯示 ^TWII 在各 τ 的實際覆蓋率曲線與名義 τ 線的貼近程度。


實務意義

 可用的場景 :

  1.  VaR 上界估計 :風險管理人可把 HAR-RV τ=0.95/0.99 分位數作為日頻 RV 的 VaR 上界,解讀為「在 95%(99%)的交易日,組合的日波動率不會超過 q̂」。Coverage 校準通過意味著這個上界不虛誇、不過保守。
  2.  Multi-asset Risk Forecast 頁 :K1402/K1403/K1404 跨 5 個資產的結果,可以匯成統一格式呈現在 VolPred 的 Risk Forecast 頁,供使用者比較各資產的尾部 RV band。
  3.  跨市場頭寸比例決策 :若投資人同時持有美股(SPY/QQQ)、黃金(GLD)、美債(TLT)與台股,可用這 5 個資產的 τ=0.95 分位數估算最壞情境下各資產的相對 RV,作為分散化依據。

 不可用的場景 :

中位數分位數(τ=0.50)顯著劣於 OLS 點預測, 不適合 做每日 RV 的均值預測或 QLIKE 最佳化目標。若研究目標是比較平均預測精度,HAR-RV QuantReg 對 OLS 沒有優勢。


限制與穩健性

  1.  Single fixed-origin fit :三組實驗皆使用 2021 年之前的訓練集固定估計,OOS 期間完全不更新參數。實際風險管理通常採用 expanding window 或 rolling window refit;固定 origin 下的長達 5 年 OOS 可能使參數漂移,特別是 2022 年聯準會升息週期改變了波動率 regime。K783c 的結果顯示 expanding window 可能縮小 gap,未來實驗可對照。
  2.  點預測顯著退步 :DM stat 最差達 -12.68(QQQ),比 OLS QLIKE 高出逾 44%。任何需要良好點預測的應用場景,HAR-RV QuantReg 皆不應作為主模型。
  3.  樣本數 :台股(^TWII)OOS n=1,305,美股 OOS n=1,348–1,355,接近但未到 Kupiec 檢定在極端分位數(τ=0.99)的漸近理想樣本數。若 τ=0.99 的名義期望違反次數(1,305 × 0.01 ≈ 13 次)發生任何 cluster,檢定可能失去效力。
  4.  缺乏 Conditional Coverage 檢定 :本系列只跑 Kupiec UC,未跑 Christoffersen(1998)CC 檢定。若違反事件有時間聚集性(violation clustering),UC PASS 不保證 CC PASS。後續可補。
  5.  目標變數定義 :daily_rv = |log return %| 是 proxy RV,不是高頻真實 RV。不同的 proxy(如 Rogers-Satchell range estimator)可能給出不同的覆蓋率數字。

結論

K1402/K1403/K1404 三組實驗橫跨美股(SPY、QQQ)、美商品(GLD)、美債(TLT)與台股(^TWII),OOS 期間 2021-01-04 起、總觀察日 5,368 筆。結果一致:

  •  HAR-RV QuantReg 中位數點預測在 5/5 個資產顯著劣於 OLS (DM p≈0);
  •  τ=0.95/0.99 尾部覆蓋率 10/10 個 Kupiec UC 全數通過 ,gap 落在 ±1.1pp 以內;
  • 跨區域 transportability(美國 → 台灣)確認成立。

方法的使用界限很清楚: 不做點預測、只做尾部 VaR 上界 。在這個定位下,HAR-RV QuantReg 提供了一個輕量、可解釋、跨市場可複製的風險估計器,不需要參數分布假設、不依賴波動率機制假設,只靠 HAR 結構的持久性與 pinball loss 的非對稱優化。

後續方向:expanding window 對照(K783c 預期能縮小中位數 gap)、Christoffersen CC 檢定、以及把三組結果整合進 Risk Forecast 頁 multi-asset 視覺化。


數據來源:yfinance(^TWII / SPY / QQQ / GLD / TLT),日頻調整收盤,2007-01-03 起。實驗 K1402(experiments/k1402/)、K1403(experiments/k1403/)、K1404(experiments/K1404/),OOS 2021-01-04 起,SPY n=1,348,QQQ/GLD/TLT n=1,355,^TWII n=1,305。

詳情

k_id
K1404
related_k
K1402, K1403
figure_path
experiments/K1404/coverage_plot.png
topic_cluster
spy
cluster_waiver
Cross-region verification research: K1402/K1403/K1404 spans US equity/bond/commodity + TW equity — primary subject is ^TWII Taiwan market transportability, not SPY alone. Distinct research contribution requiring combined reporting.
experiment_refs
K1402, K1403, K1404
topic_cluster_30d
{"cap":10,"count":34,"ratio":0.1355,"exempt":false}

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
換了更好的模型,風險計算卻沒變好多少:36 場測試告訴你,關鍵在哪裡
# 換了更好的模型,風險計算卻沒變好多少:36 場測試告訴你,關鍵在哪裡 **[提出: 用戶, 執行: Claude]** 有個問題值得想一想:如果你現在用的波動率模型不夠準,你應該換一個更好的模型,還是換一個更好的計算方式? 大多數人的直覺是「換模型」。模型更複雜、更聰明,風險估計自然更準。但 36 場跨資產測試的結果,給出了不一樣的答案。 --- ## 實驗怎麼設計的 我們跑了一個...
📄
我們把自己論文裡的兩個數字重做了一次:5.2 跟 −0.05 真的對嗎
# 我們把自己論文裡的兩個數字重做了一次:5.2 跟 −0.05 真的對嗎 [提出: Claude] 學術論文裡常常會看到這種句子:「我們估計出來的參數是 η = 5.2、λ = −0.05。」 讀者一掃就過了,因為這兩個數字看起來無傷大雅。但對研究本身來說,這兩個數字才是整個風險模型的脊椎骨,它們決定了你的尾部多厚、你的左尾多偏、最後你算出來的 VaR 到底是高估還是低估。 我們最近做了...
📄
銀行法規說用「平方根法」估一個月風險,但它真的失準了嗎?SPY 十年數據給出一個不舒服的答案
# 銀行法規說用「平方根法」估一個月風險,但它真的失準了嗎?SPY 十年數據給出一個不舒服的答案 Basel III 對銀行風險資本的計算有一條廣為人知的規定:把單日 VaR 乘以 10 的平方根,換算成 10 天的風險值。這個「平方根時間法(SRT)」理論上只在報酬彼此獨立、波動率固定的情況下成立。實務上兩個前提都不符合。市場有波動群聚,GARCH 效應隨處可見。 學界多年來的直覺是:越長期...
K1402/K1403/K1404:跨市場 HAR-RV 尾部分位數預測驗證 — 美股、債券、黃金、台股全數通過 | VolPred