← Research Feed
研究2026/05/30 上午04:00

四種 HAR 分解都無法超越標準 HAR-RV:台灣期貨波動率預測的系統性 NULL 結果

TaiwanmethodologyHARnull-resultvolatility-predictionfutures

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

四種 HAR 分解都無法超越標準 HAR-RV:台灣期貨波動率預測的系統性 NULL 結果

直覺很合理,但答案不是

做波動率預測的研究者常有這樣的直覺:既然整體的已實現波動率(Realized Variance, RV)是「加總」出來的,那把它拆開來分別預測,應該能捕捉到更多資訊吧?

這個想法並不奇怪。把 RV 依照日盤/夜盤分開建模,可以反映不同時段的資訊;依照漲跌符號分開,可以捕捉不對稱的槓桿效應;把跳躍成分獨立出來,可以處理突發事件衝擊;用路徑加權重構特徵,則引入了更豐富的時序記憶。每一個方向,都有紮實的學術文獻支持。

然而,我們在台灣期貨市場(TAIFEX TX1)上做了四次嘗試,得到了四次相同的答案:標準 HAR-RV 模型已經足夠好了,分解版本無法通過嚴格的統計檢定門檻。

四次嘗試,四個答案

第一次:日盤與夜盤的資訊拆解(K868)

我們先前已有一篇詳細分析,記錄了台指期夜盤波動比重從 2017 年的 23.9% 逐年攀升至 2025 年的 53.9% 這個結構性變化([台指期夜盤波動率比重 9 年翻倍])。那篇文章已指出:即便夜盤佔了將近一半的總波動,把日夜盤 RV 拆開分別建模(HAR-DN),反而打不過簡單的整體 HAR-RV。

這裡簡要重述核心結論:HAR-DN 的樣本外 QLIKE 損失函數值爆炸至 33.6(HAR-RV 僅 0.119),原因在於日夜盤 RV 相關係數高達 0.491——資訊高度重疊,拆解反而帶來不穩定性。比較兩模型的統計強度僅 1.08,遠低於嚴格統計標準。

 結論 :台灣期貨夜盤雖佔波動的近一半,但對 HAR-RV 模型的預測幾乎沒有增量貢獻。

第二次:漲跌符號的不對稱分解(K1301)

財務學研究中有一個著名的「槓桿效應」現象:下跌往往比上漲帶來更大的波動。沿著這個思路,Barndorff-Nielsen、Kinnebrock 與 Shephard(2008)提出用「已實現半方差」(Realized Semivariance)將 RV 分解為正報酬成分 RS+ 和負報酬成分 RS-,分別以 5 分鐘正報酬平方和與負報酬平方和構成。如果台灣期貨也存在類似的不對稱結構,HAR-RS 模型理應比 HAR-RV 表現更好。

實驗在 2017-2026 年共 2,186 個交易日的 TX1 資料上進行。結果顯示,HAR-RS 的樣本外 MSE 為 1.450,略低於 HAR-RV 的 1.471——是的,分解版本數字確實更漂亮一點。但 DM 檢定 t 統計量為 1.29,p 值 0.197,在統計上毫無顯著性可言。

這個結果告訴我們:HAR-RS 看起來「稍微好一點點」,但這個差距完全在隨機誤差的範圍之內,根本稱不上是可信的改善。

 結論 :台灣期貨的波動率沒有呈現出可被模型利用的顯著槓桿效應,符號分解無效。

第三次:連續波動與跳躍成分的分離(K1303)

這是四個實驗中最具戲劇性的一個,因為它在兩個市場給出了截然相反的結果。

Barndorff-Nielsen 與 Shephard(2004, 2006)的連續-跳躍分解方法,將 RV 拆成「連續波動成分 CV」(由雙冪變差 BPV 估計)和「跳躍成分 J」(定義為 max(RV - BPV, 0))。Andersen、Bollerslev 與 Diebold(2007)已在美股 S&P 500 上證實,加入跳躍成分可以顯著改善 HAR-RV 的預測能力,因為跳躍代表著市場突發事件衝擊,其持續時間和均值回復特性與連續波動不同。

在台灣期貨市場(TX1)上,跳躍成分佔總 RV 的比例僅有 7.1%,而且有 41% 的交易日根本偵測不到跳躍(J=0)。HAR-CJ 模型的樣本外 MSE 反而比 HAR-RV 更差(1.489 vs 1.471),DM 統計量為 -0.91,負號代表分解版本表現更差。

然而,對美股 SPY 做同樣的分析,DM 統計量達到 3.33,通過 嚴格統計 門檻(達顯著水準(顯著性 0.007)),HAR-CJ 的 MSE 從 2.827 大幅降至 1.411。跳躍分解對美股有效!

這個對比提供了一個重要的市場機制線索:美股的跳躍成分代表性強、資訊豐富,且與連續波動的行為明顯不同;台灣期貨的跳躍則少而不規律,被 HAR-RV 的整體 RV 平均化後已無多餘資訊可挖掘。需要注意的是,SPY 的結果基於僅 12 個測試日,樣本量不足以作為決定性結論,屬探索性發現。

 結論 :跳躍分解的有效性具有市場特異性。美股跳躍多且資訊豐富,台灣期貨跳躍少且已被總體 RV 涵蓋。

第四次:路徑依賴的指數加權特徵(K1309)

這是四個方向中最新穎的一個,来自 2025 年的 arXiv 論文(arXiv:2503.00851,Liu/Fu/Hong)的「路徑依賴 HAR(HAR-PD)」方法。這個方法的核心思想是:傳統 HAR-RV 用的是過去 1 天、5 天、22 天的 RV 「簡單平均」,但市場波動的記憶其實是指數衰減的,最近的資訊比較重要,遠的資訊影響較小。HAR-PD 用指數加權核函數(kernel)重構路徑特徵 R2,用不同衰減速率的加權和取代固定窗口平均,理論上可以更靈活地捕捉波動的時序結構。

在 TX1 上(2,162 個 HAR 有效觀測日),HAR-PD 的樣本外 R² 為 0.023,低於 HAR-RV 的 0.043。DM 統計量僅 -0.35,p 值 0.729,bootstrap 95% 信賴區間也完全包含零。路徑依賴特徵不但沒有幫忙,反而讓預測能力略微下降。

 結論 :路徑依賴加權在台灣期貨上完全失效,HAR 的「固定窗口平均」並非其弱點所在。

這些圖說明了什麼?

圖一:四種 HAR 分解的 DM-HLN t 統計量對比

如圖一所示,四種方向的 TX1 DM t 統計量全部落在 嚴格統計 門檻(統計強度=3)之內:日夜分解 統計強度 1.08、符號不對稱 統計強度 1.29、跳躍分解 統計強度 -0.91、路徑依賴 統計強度 -0.35。唯一通過門檻的是 SPY 的跳躍分解(統計強度 3.33),但受限於樣本量,這個結果屬於探索性發現。

圖二:四種 HAR 分解 vs 標準 HAR-RV 的樣本外預測誤差(MSE)比較

如圖二所示,符號不對稱分解(HAR-RS)是唯一 MSE 略低於 HAR-RV 的方法(-1.4%),但差距微乎其微;跳躍分解(HAR-CJ)和路徑依賴(HAR-PD)反而讓預測誤差升高(各 +1.2% 和 +2.1%)。日夜分解(HAR-DN)的 MSE 更大幅惡化(+34.9%),完全印證了 QLIKE 分析結論。這張圖從誤差量化角度再次確認:分解不只沒幫助,有時還有害。

這張圖的訊息非常清楚:標準 HAR-RV 對台灣期貨而言,是一個「局部充分(locally sufficient)」的模型。換句話說,在 2017-2026 年的 TX1 日頻 RV 資料中,這四個方向的分解所攜帶的資訊,已經被 HAR-RV 的三個滯後期(日、週、月)充分吸收了。

為什麼分解在台灣期貨上不管用?

這不是「HAR 模型本身有問題」,也不是「台灣市場難以預測」,而是台灣期貨市場結構讓某些分解的前提條件不成立:

 日夜分解的困難 :台灣期貨夜盤雖然交易量成長,但夜盤與日盤 RV 相關係數高達 0.491,兩者反映的波動資訊高度重疊。加上夜盤流動性相對日盤仍有落差,分解後的特徵包含較多雜訊。

 符號分解的困難 :槓桿效應在台灣股市的文獻中已有記錄,但在 HAR-RS 框架下,正負半方差的係數差異並不足夠顯著,表示市場微結構或投資者結構的不同讓不對稱效應較弱。

 跳躍分解的困難 :台灣期貨的日內跳躍頻率明顯低於美股——TX1 有 41% 的交易日根本無跳躍。在跳躍稀少的市場,跳躍成分提供的預測資訊本就有限,加入跳躍特徵只是增加了參數而沒有帶來額外的預測信號。

 路徑依賴的困難 :HAR-PD 的指數加權雖然在理論上更靈活,但這種靈活性需要資料去識別最佳的衰減速率 λ。在固定 λ 值的條件下,它與 HAR-RV 的固定窗口差異有限,且樣本較小時估計不穩定,並沒有帶來淨改善。

更根本的原因是: 增加參數需要付出代價 。HAR-RV 只有 3 個預測因子,每一個分解版本都加倍到 6 個甚至更多。在固定的訓練樣本下,額外參數帶來的估計誤差,往往抵消了分解帶來的理論優勢。

對研究者與實務者的啟示

這四個 NULL 結果看起來是「沒有發現」,但對研究者和實務者而言,它們傳遞了幾個重要的正面訊息:

 標準模型的穩健性 :HAR-RV 在台灣期貨市場上是有效且穩健的基準模型,其表現很難被結構性分解方法超越。這對波動率管理、風險量化和策略設計都有直接意義,你不需要更複雜的波動率預測模型。

 市場異質性的提醒 :SPY 跳躍分解通過了統計門檻,而 TX1 沒有,這個對比說明,來自美股的研究發現不能直接移植到台灣期貨市場,必須在本地資料上驗證。這個教訓對任何跨市場應用都成立。

 下一步往「外部變數」探索 :既然 RV 內部的結構性分解已走過四條路,下一個合理方向是引入 外部資訊 ——例如 VIX(美股波動率指數)、VVIX(波動率的波動率)、選擇權隱含波動率、或總體資訊。這類外部變數攜帶的增量資訊,不在 TX1 的 RV 序列本身之內,因此分解模型也無法捕捉。我們已有多個相關實驗提供了正面的初步結果。

 NULL 結果值得發表 :波動率預測文獻長期存在「正面結果偏誤」(publication bias),只有「新方法有效」的論文容易被接受。但在可重現研究的框架下,知道「哪些方法在台灣期貨上無效」本身就是有價值的知識,避免後續研究者重複走已知的死路。

結語:局部充分性與論文基礎

這四個系統性 NULL 結果共同確立了一個重要命題: 在台灣期貨市場(TX1),標準 HAR-RV 對日頻波動率預測具有局部充分性 ——即在 RV 內部的分解方向上,HAR-RV 已無法被進一步顯著改善。

這個結論是我們後續研究工作(Paper 4)的重要基礎之一。既然波動率預測模型本身難以精進,策略層面的關鍵問題就轉向了「如何用 HAR-RV 的預測值設計穩健的倉位管理機制」,也就是波動率目標化(Volatility Targeting)的框架。HAR-RV 的局部充分性,同時也是 Volatility Targeting 策略不依賴複雜分解模型的理論依據。


 數據來源 :TAIFEX TX1 tick 資料 2017-2026(日盤 08:45-13:45,5 分鐘 K 線);SPY 5 分鐘資料(yfinance,60 天上限);實驗 K868(日夜分解)/ K1301(符號分解)/ K1303(跳躍分解)/ K1309(路徑依賴分解)。統計顯著性判準:Harvey (1997) DM-HLN 統計強度 > 3。

詳情

audience
research
experiment_refs
K868, K1301, K1303, K1309
audience_backfill
{"reason":"validator_371_historical_backfill","script":"scripts/backfill_audience.py","applied_at":"2026-05-26T16:21:47+00:00","article_id":"mile_379b51cc","previous_audience":"general"}

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊