研究2026/06/06 下午12:01

GJR 在三個資產上的 VaR 是壞的，A4f 補上了那個缺口——但統計門檻沒給它金牌

GARCHKupiecVaR跨資產Student-tGVZA4fPaper-9

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

GJR 在三個資產上的 VaR 是壞的，A4f 補上了那個缺口，但統計門檻沒給它金牌

數據來源 ：K1022 跨資產穩健性驗證（SPY/QQQ/GLD/EEM/TLT/0050.TW，樣本 2005-2026，OOS 2019-2026，各資產約 1,825 筆日報酬）

先把結論攤在這裡：A4f-Student-t 模型在 6 個資產上 QLIKE 預測誤差全部下降，幅度從 +1.17%（台灣 0050）到 +6.78%（SPY）。但是，沒有一個資產的 Diebold-Mariano 統計量達到 Harvey 嚴格門檻（|t| > 3.0）。QLIKE 全贏、Harvey 全敗。

真正的勝點在 VaR。GJR-t 在 SPY、QQQ、0050.TW 的 2.5% 尾端風險估計，全部 Kupiec 不合格；A4f-t 在 6/6 資產都過關。如果你算的是停損距離或期貨保證金，用 GJR-t 的話，三個主要資產的違約率會比你預期高出將近 50%。

這個實驗從哪裡來

K988 是起點。用 SPY 做完，A4f 乘法式 GARCH-X 配合普通常態分配，DM t = +4.48，Harvey 顯著。

然後 K1021 換成 Student-t 分配，讓尾部更厚，最優自由度約 8.5。這時候 SPY 的 DM t 掉下來了，QLIKE 改善幅度縮小，但 VaR 校準反而更準。

K1022 的問題是：換成 Student-t 之後，這套 A4f 邏輯跨越 6 個資產還成立嗎？GLD、TLT、新興市場 EEM、台股 0050，全部測一遍。

數字彙整：6 資產一張表

資產	GJR QLIKE	A4f QLIKE	DM t	QLIKE 改善	GJR VaR	A4f VaR
SPY	1.5133	1.4106	-2.753	+6.78%	FAIL	PASS
QQQ	1.5079	1.4202	-2.123	+5.82%	FAIL	PASS
GLD	1.5347	1.5049	-2.387	+1.94%	PASS	PASS
EEM	1.3365	1.3179	-1.609	+1.39%	PASS	PASS
TLT	1.2097	1.1694	-2.749	+3.33%	PASS	PASS
0050.TW	1.5025	1.4849	-0.517	+1.17%	FAIL	PASS

（QLIKE 越低越好。DM t 為負代表 A4f 勝；Harvey 門檻 |t| > 3.0。VaR 用 Kupiec 1995 檢定，違約機率目標 2.5%。）

為什麼 DM 沒破 3.0？

K988 用常態分配時 DM = +4.48，這次換 Student-t 後最強也只到 -2.75。差在哪？

A4f 模型的核心邏輯是用 VIX² 來捕捉市場恐懼期的波動急升。當分配本身就是厚尾（Student-t df=8），尾巴的特殊事件它自己就能處理一部分，VIX² 帶來的邊際增量就被壓縮了。Student-t 把原本 VIX 要做的工分走了一半。

A4f 的預測方向依然正確，只是改善幅度被壓縮了。K988 那次，常態分配對尾部事件毫無處理能力，VIX 的資訊量顯得格外重要，所以 DM 爆衝到 4.48。

台灣 0050 的 DM t 特別低（-0.517），還有另一個理由：實驗用的是美股 VIX，時區差了一天，0050 當天的「即時恐懼」根本進不來。如果改用台灣本土波動指數（VIXTWN），結果可能不一樣，但那是 K1023 的事。

GJR 的 VaR 到底壞多少

Kupiec 檢定的邏輯很直白：你宣稱用 2.5% 的 VaR，那就只允許 2.5% 的日子賠超過這個數字。

GJR-t 在三個資產的實際違約率：

資產	GJR 違約率	目標	Kupiec p 值
SPY	3.61%	2.5%	0.0043
QQQ	3.67%	2.5%	0.0028
0050.TW	約 3.6%	2.5%	—

每 100 天裡，GJR-t 預計有 2.5 天超出 VaR，實際卻有 3.6 天。這個差距在保證金計算或停損設計上，是每 100 個交易日多出一次非預期損失事件。A4f-t 在同一批資產，違約率落在 2.63%（SPY）到 3.01%（QQQ），都通過 Kupiec。

K1022 DM t-statistic bar chart

圖一：6 資產 DM t 統計量。紅色虛線為 Harvey |t| = 3.0 門檻，所有資產均未達到。

黃金用 GVZ 比用 VIX 好得多

GLD 有一個獨立發現值得單獨說。

黃金的 VIX 相關性很低，OOS 期間 VIX² 與黃金報酬平方的 Spearman 相關只有 0.126，意思是美股恐慌指數對黃金波動的解釋力非常有限。換成 GVZ（CBOE 黃金 ETF 波動率指數，原理跟 VIX 一樣但針對黃金）之後，QLIKE 改善從 +1.94% 跳到 +6.11%，DM t 從 -2.387 升到 -2.959，快要摸到 Harvey 門檻。

「用黃金自己的恐懼指數量黃金波動」這個直覺被數字確認了。股票市場的恐慌不會完全轉移到黃金；GVZ 才是黃金 VaR 的對應工具，VIX 只是湊合用的代理。

這個邏輯推過去：EEM 用 VIX 時改善只有 +1.39%，DM t = -1.609，是六個資產裡最弱的。新興市場有自己的本土風險結構，美股 VIX 在這裡解釋力也很有限。

債券也能用 A4f

TLT（長天期美債 ETF）的結果讓人意外：QLIKE 改善 +3.33%，DM t = -2.749，是六個資產裡第二強的信號，只比 SPY（-2.753）差一點點。

通常研究股票波動模型，很少把它拿去試債券。這個結果說明，VIX 對美債波動也有部分解釋力，A4f 在股票以外的資產類別也有改善空間。未來做跨資產配置的風險預估時，A4f 框架不必限制在股票 ETF 上。

K1022 QLIKE and VaR comparison

圖二：QLIKE 改善幅度（左軸）與 VaR 違約率對比（右軸）。GJR-t 在 SPY、QQQ、0050.TW 超出 2.5% 目標。

三種讀者，三個 take-home

散戶投資人

用 GJR 類模型算停損或調整部位，SPY、QQQ、台股的尾部風險估計會系統性偏低。遇到大跌時，你的停損單可能在比預想更差的位置觸發。A4f 的核心只是把 VIX 拉進來告訴模型「今天是高恐慌日，波動要估高一點」。

機構或量化交易

QLIKE 改善方向一致（6/6），但個別 DM t 強度沒過 Harvey 門檻（|t| > 3.0）。要換模型前應該先算統計功效。1,825 筆 OOS 資料、6 個獨立市場全部朝同方向改善，聯合檢定的力道可能遠比個別 t 值看起來更強。

如果你在做跨資產組合的 VaR 預算，A4f 的 6/6 Kupiec PASS 是比 DM t 更直接的使用理由。

研究者或量化建模者

Student-t 厚尾分配壓縮了 VIX² 的邊際貢獻，這個交互作用值得深入研究。K988（常態 innovations, DM = +4.48）對比 K1022（Student-t, DM 最強 -2.75）的落差，根源在分配假設吸走了原本 VIX 能貢獻的資訊。

Panel 或 pooled DM 是明確的下一步。把 6 個資產視為同一個系統聯合估計，統計功效應該比逐一比高。0050.TW 改用本地 VIXTWN、EEM 改用 EMVIX，也都是具體可做的後續。

這個研究的邊界

K1022 有三個明確邊界。第一，df=8 跨資產固定，最優自由度可能因類別而異，債券可能適合更低的值。第二，沒做 panel 或 pooled DM，6 個 DM t 的聯合意義目前只能定性推測。第三，0050.TW 用美股 VIX 有一天時差，GVZ 數據從 2008 年才有，這兩個資產的結果都是下界。