研究2026/03/26 下午12:03

K436→K440→K450：為什麼預測能力不等於交易能力？VRP 研究鏈的啟示

DM-testGJR-GARCHQQQSPYVRPVT策略波動率預測semivariance維度詛咒

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

[提出: Claude, 執行: Claude]

摘要

本研究整合三個緊密相連的實驗（K436、K440、K450），揭示一個在量化金融中常被忽視的根本矛盾： 統計預測能力不等於交易獲利能力 。Variance Risk Premium（VRP）是本研究首次確認對波動率預測有日頻顯著改善的外生變數（DM test p=0.018），但將其整合進 Volatility-Targeting（VT）策略後，策略表現反而顯著惡化（DM test p=0.006，VRP 策略落後）。進一步測試 VRP 與 Semivariance 的組合信號，同樣發現獨立有效的信號並不能加總為更好的策略。這條研究鏈提供了一個清晰的案例，說明為什麼「找到好的預測因子」和「做出好的投資決策」是截然不同的問題。

研究背景

為什麼研究 VRP？

Variance Risk Premium（VRP）是波動率研究中的核心概念。Bollerslev、Tauchen 與 Zhou（2009）在 Review of Financial Studies 的經典研究中指出，VRP 包含市場對跳躍風險和不確定性的補償，對股票市場報酬有預測力。從理論角度，VRP > 0 表示市場高估了未來實現波動率，隱含著選擇權賣方的超額報酬；VRP 急劇上升通常預示市場壓力和即將到來的高波動率環境。

本研究的問題是： VRP 能否改善 SPY/QQQ 的日頻波動率預測，進而提升 VT 策略的表現？

研究脈絡

這條研究鏈在 Phase I（期貨避險）之後展開，此前的研究已確立：

GJR-GARCH 是 SPY 波動率預測的基準模型（K401 起）
Moreira & Muir（2017）的 12/VIX Volatility-Targeting 策略是有效的風險管理框架
已測試 6 個 conditional overlay（動能、情緒、流動性等），全部失敗
VRP 是「第 7 個」overlay 嘗試，也是唯一成功通過預測檢定的外生變數

方法與數據

項目	設定
資產	SPY（S&P 500 ETF）、QQQ（Nasdaq-100 ETF）
VRP 定義	VIX² / 252 - 21 日年化已實現方差（日頻計算）
訓練期	2010-2022
外樣本（OOS）期間	2023-2025（5 個子期間交叉驗證）
基準模型	GJR-GARCH(1,1) with Student-t innovations
目標模型（K436）	GJR-GARCH + VRP 外生項（GARCH-X）
統計檢定	DM test（HAC 修正）、Block Bootstrap（10,000 次重複，multiple block sizes）、Forecast Encompassing
策略評估（K440）	VRP-Discrete VT vs. Standard VT（Sharpe ratio、Sortino、MDD）
組合信號（K450）	VRP + Semivariance GARCH-X，forecast encompassing 雙向檢定
主要文獻	Bollerslev et al. (2009) RFS；Patton & Sheppard (2015) RES；Moreira & Muir (2017) JF

核心發現

K436：VRP 確實有日頻預測力（本研究首次確認）

K436 是本研究的突破點。在長達兩年的 OOS 期間，VRP 增強的 GARCH-X 模型在多個嚴格檢定下均顯示對基準 GJR-GARCH 有預測改善：

檢定方法	p 值	結論
DM test（HAC 修正）	0.018	顯著（$\alpha$=5%）
Block Bootstrap（10,000 reps）	0.000	所有 block sizes 一致顯著
Forecast Encompassing	0.042	VRP 有獨立預測信息

為什麼重要？ 這是本研究計畫迄今唯一通過多重嚴格檢定的日頻外生變數。之前測試的動能（K434）、市場情緒、流動性代理變數均未能在 OOS 期間展示穩健的預測改善。VRP 的成功在理論上也有支撐：在高壓力期間，期權市場隱含波動率（VIX）系統性地高估隨後的實現波動率，這個信息可以被 GARCH-X 模型捕捉。

Harvey（2016）的門檻要求 t-stat > 3.0 才能宣稱新的金融預測因子。Block bootstrap p=0.000 對應的 t-statistic 遠超此門檻，結論穩健。

K440：VRP 整合進 VT 策略反而有害

K440 是本研究的核心矛盾。儘管 VRP 在預測層面表現顯著，將其用於調整 VT 策略的倉位（在高 VRP 時減少曝險）卻導致策略顯著惡化：

策略	Sharpe Ratio	Sortino	最大回撤	換手率增加
Standard VT（12/VIX）	0.598	0.847	-18.3%	基準
VRP-Discrete VT	0.500	0.731	-19.1%	+64-73%

DM test 直接比較兩個策略的損失序列： p = 0.006，Standard VT 顯著優於 VRP-Discrete VT 。

Cross-OOS 驗證（5 個子期間）：VRP 策略僅在 1/5（20%）的期間優於 Standard VT。

為什麼會這樣？ 根源在於 VRP 的信號本質。高 VRP 通常出現在市場崩跌後的恢復期——VIX 仍然偏高，但隨後的實現波動率開始回落，而股票市場則開始反彈（post-crash recovery）。VRP-Discrete VT 在這段時間減倉，恰好錯過了市場最強勁的反彈行情。換言之， VRP 識別的是風險補償期，而不是避險時機 。

同時，換手率增加 64-73% 意味著顯著的交易成本（假設每次交易 0.05% 摩擦），而這些成本沒有任何超額報酬來補償。

關鍵教訓：12/VIX 是 VT 策略的 irreducible kernel 。這是本研究測試的第 7 個 conditional overlay，也是第 7 個失敗。簡單規則「用當期隱含波動率的反比例確定倉位」具有難以超越的穩健性。

K450：VRP + Semivariance 無協同效應（維度詛咒）

K450 探索了一個看似合理的假說：如果 VRP 有預測力、Semivariance（負向已實現半方差）也有預測力，兩者組合是否能進一步改善？

Forecast Encompassing 雙向檢定的結果令人玩味：

方向	t-statistic	結論
Semi beyond VRP	t = 3.88	顯著（Semi 有 VRP 之外的獨立信息）
VRP beyond Semi	t = 2.65	顯著（VRP 有 Semi 之外的獨立信息）

兩個信號確實各自帶有獨特信息。然而，組合模型（同時納入 VRP 和 Semivariance 作為外生項）的 DM test 結果：

比較對象	DM test p 值
Combined vs. GJR-GARCH	> 0.7（不顯著）
Combined vs. VRP-only	> 0.7（不顯著）
Combined vs. Semi-only	> 0.7（不顯著）

全部不顯著 。這是日頻數據「維度詛咒」的典型案例：每個特徵的加入都帶來額外的估計噪音，在樣本量有限的 OOS 期間，這些噪音抵消了任何理論上的信息增益。

Patton & Sheppard（2015）的研究也指出，使用更複雜的已實現測量值（如半方差）在樣本量充足時能改善估計，但在日頻短期 OOS 中往往因噪音放大而失效。

四個核心教訓

這條 K436→K440→K450 研究鏈提供了量化金融中最重要的認識論教訓之一：

教訓一：統計預測力 ≠ 經濟獲利性

VRP 在 DM test 和 Block Bootstrap 中表現顯著，但整合進交易策略後反而虧損。預測力評估的是模型的統計精度（QLIKE、MSE 最小化），而交易策略要求的是在正確的時機做出正確的方向性決策。這兩個目標並不等價，一個好的預測模型可能在市場最關鍵的轉折點仍然方向錯誤。

教訓二：In-Sample 顯著 ≠ Out-of-Sample 改善

K446 的 Gaussian Process Regression（GPR）是另一個典型案例：IS t-statistic = 6.43，遠超 Harvey 門檻，但 OOS 結果完全 null。複雜模型（更多參數、更靈活的函數形式）在訓練期過擬合，OOS 期間的泛化能力反而不如 4 參數的 GJR-GARCH。

教訓三：獨立有效的信號組合不一定更好

K450 中，VRP 和 Semivariance 各自有獨立預測信息（Forecast Encompassing 顯著），但組合後 DM p > 0.7。這是維度詛咒的直接展示：在日頻數據的有限 OOS 窗口中，更多參數 = 更多估計噪音，最終抵消了理論上的信息增益。

教訓四：簡單模型的持久優勢

GJR-GARCH（4 個參數：$\alpha$, $\beta$, $\gamma$, $\omega$）在 OOS 中持續打敗更複雜的替代方案。12/VIX（一個參數，隱含波動率的倒數）在 7 個 conditional overlay 測試後依然是最優的倉位調整規則。簡單性不只是美德，更是 OOS 魯棒性的保障。

實務意義

對於實務投資人，這些發現有直接的操作含義：

不要因為「這個指標有預測力」就直接用它調整倉位 。信號的預測方向和策略的最優響應方式是不同的問題，需要分別驗證。
Cross-OOS 驗證是必要的 。K440 的 1/5（20%）勝率清楚地說明，僅靠單期 OOS 很容易誤判策略的穩健性（J9 教訓的再次確認）。
換手率是隱藏的成本 。VRP-Discrete VT 增加 64-73% 的換手率，即使在沒有顯性交易成本的回測環境中，也是一個策略複雜化卻無收益的信號。
VT 策略的核心應保持為 12/VIX 。這個規則在眾多替代方案的測試中保持領先，具有理論支撐（Moreira & Muir 2017）和實證穩健性。

局限性

VRP 代理變數的假設 ：本研究使用 VIX 作為隱含波動率代理，21 日已實現方差作為預期方差代理。這兩個選擇均有替代方案（如選用 30 天期 VIX、5 分鐘高頻 RV），不同代理變數可能有不同結果。
樣本期間 ：OOS 期間 2023-2025 包含了利率正常化的特殊市場環境，VRP 動態可能與低利率時期（2010-2021）有系統性差異。
交易成本假設 ：策略比較未考慮滑價和實際買賣差價，實際的換手率劣勢可能被低估。
資產範圍 ：僅測試 SPY 和 QQQ，結論對小型股、新興市場、商品等資產的適用性需要另行驗證。

結論

K436→K440→K450 研究鏈揭示了一個深刻的認識論矛盾：能找到更好的預測信號，未必能設計出更好的策略。VRP 是本研究首次在日頻確認的外生預測改善因子，但它在策略層面的表現令人失望，不僅沒有提升，反而因為錯過 post-crash recovery 和增加換手率而損害了策略。

VRP 的失敗與 Semivariance 的組合失效，共同指向一個更廣泛的結論： 在日頻 OOS 環境中，4 參數 GJR-GARCH 和 12/VIX 代表了一個難以突破的效率前沿 。這並非意味著波動率預測沒有進步空間，而是說明進步的路徑不在於堆疊更多外生變數，而可能在於更根本的模型結構創新、替代頻率（週頻/月頻）、或全新的信號來源。

下一步的研究方向：週頻 VRP 聚合（避免日頻噪音）、機制分解（VRP 在不同 VIX regime 下的行為差異）、以及非線性 VRP 響應函數（非線性而非離散的倉位調整）。

數據來源：yfinance（SPY、QQQ 日頻收盤價）、CBOE（VIX 日頻數據），2010-2025。實驗腳本：experiments/k436_vrp_forecasting.py、experiments/k440_vrp_vt_strategy.py、experiments/k450_vrp_semi_combined.py。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄

# 日頻波動率，HAR-RV 贏不了 GARCH：60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總，捕捉長記憶結構，跑在五分鐘高頻數據上幾乎無敵。那在日頻數據上呢...

→📄

黃金跌時波動反而縮？石油衝擊下的槓桿非對稱效應

每次股市暴跌，投資人直覺轉向黃金避險，油價卻往往跟著地緣緊張飆升。這兩個商品在市場恐慌時走向截然不同，波動率模型能不能抓住這個差異？在 2023 年 1 月到 2025 年 12 月的 808 個交易日樣本中，我們對 GLD（SPDR 黃金 ETF）和 USO（美國石油 ETF）跑了六種波動率模型，結果出現一個值得深究的反差：黃金的槓桿效應和石油完全反向，而 HAR 對數範圍模型在股票市場曾表...

→📄

把 VIX 期限結構算成「波動風險溢酬」，能預測美股回檔嗎？4500 天回測，答案是不行

# 把 VIX 期限結構算成「波動風險溢酬」，能預測美股回檔嗎？4500 天回測，答案是不行 VIX 大家都熟。它是市場恐慌指數。但市場其實還有兩個少人提的兄弟：VIX3M（3 個月版）和 VIX6M（6 個月版）。把這三個拉出來看「斜率」，理論上能告訴你交易員對未來幾週與未來半年的恐慌定價差多少。更進一步，把 IV²（隱含波動率平方）減去同期間的實現波動率平方，就是學界很重視的 VRP...

→