← 研究動態
研究2026/07/03 上午03:00

K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗

HAR-RVQLIKE波動率預測模型比較台指期高頻資料HARQ

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

摘要

[提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697 筆;SPY 與 0050.TW 只有 51 與 38 筆樣本外預測,本文將它們列為 pipeline diagnostics。TX_active 上,HARQ、HARQ_full、SHARK_like 的 QLIKE 都低於 HAR,其中 SHARK_like 改善 +2.05%,HARQ 改善 +1.94%。但所有候選模型都沒有通過 results.json statistics.harvey_gate 定義的專案 gate。整體 verdict 因此維持 DIRECTIONAL_ONLY

研究背景

HAR-RV 的日、週、月 realized variance 架構來自 Corsi (2009)。Bollerslev, Patton and Quaedvlieg (2016) 的 HARQ 方向提醒我們:realized variance 本身有測量誤差,realized quarticity 可以作為測量誤差 proxy,讓 HAR 係數隨 measurement precision 調整。Buccheri and Corsi (2021) 的 SHARK-related 方向則鼓勵把 signed components、semivariance、jump-related realized measures 放進 HAR 周邊,檢查日內分解是否提供額外預測資訊。Patton and Zhang (2026) 的 bespoke realized volatility 觀點,也把 realized measure 視為設計選擇,重點在 forecast target 與 measurement-error problem 是否對齊。

K1582 的原始 backlog 假說更強:台指期夜盤 / 日盤微結構可能讓 realized measure 噪音比 SPY 更大,因此測量誤差修正應該更有幫助。本次實驗只完成可 gate 的 TX 日盤長樣本與兩個 2026 年短樣本流程檢查,尚未解決完整夜盤假說。

方法與數據

項目設定
實驗 IDK1582
核心問題RQ-based measurement-error interactions 與 signed intraday components 是否改善 HAR-RV 一步期 RV forecast
主要 targetRV_t,由五分鐘 intraday returns 計算
主要 lossPatton QLIKE,越低越好
Pairwise testvolpred.stats.model_evaluation.dm_test,h=1;負的 DM t 代表 candidate QLIKE 低於 HAR
Gate依 results.json statistics.harvey_gate:candidate 必須同時有正的 QLIKE improvement、通過嚴格 DM 門檻,且留在 MCS
MCSvolpred.stats.mcs.model_confidence_set,alpha=0.10,n_boot=1000,seed=42
隨機種子42
Lookahead policy所有 daily / weekly / monthly predictors 都由 .shift(1) 後的 series 建立;expanding OOS 每列只用 forecast row 之前的訓練列

資料面分成三個市場:

MarketSourceRaw date rangeRaw daysFeature rowsOOS forecastsGateable?
TX_active~/Dropbox/TAIFEXDATA/TAIFEXDATA/python/Daily_*TX.csv;以日盤成交量選 active contract2017-05-16 至 2026-06-292,2192,1971,697yes
SPYdata/intraday/SPY_5min_2026-*.csv2026-01-14 至 2026-06-291139151no
0050.TWdata/intraday/0050_TW_5min_2026-*.csv2026-01-20 至 2026-06-261007838no

TX_active 使用完整 TX 檔,不用 TX1,以避開近月 roll-gap 的已知問題。每個交易日篩日盤 08:45-13:45,依日盤成交量選 active contract month,再用五分鐘 last-tick bar 計算 realized measures。TX 的 median intraday return count 是 59。

模型規格

ModelFeatures
HARlog RV_d, log RV_w, log RV_m
HARQHAR + log RV_d * sqrt(RQ_d) / RV_d
HARQ_fullHAR + daily / weekly / monthly RQ measurement-error interactions
SHARK_likeHARQ + lagged semivariance shares、realized semivariance imbalance、signed jump share、absolute jump share

SHARK_like 是 scoped approximation。它用 K1582 腳本能從本地資料穩定構造的 realized measures,近似 SHARK 類型的 rich realized-measure correction;它未完整複製 Buccheri-Corsi 的 full estimator。

核心發現一:TX_active 方向性改善存在,但沒有通過嚴格 gate

K1582 QLIKE improvement vs HAR

TX_active 是唯一 gateable market。四個模型的 QLIKE 與 pairwise 統計如下:

ModelQLIKEQLIKE improvement vs HARDM t vs HARDM pHarvey pass?MCS status
HAR0.168677------baselineeliminated in MCS at p=0.058
HARQ0.165409+1.94%-2.600.0094falsemember
HARQ_full0.166079+1.54%-2.250.0248falsemember
SHARK_like0.165226+2.05%-1.770.0766falsemember

MCS 在 alpha=0.10 下排除了 HAR,保留 HARQ、HARQ_full、SHARK_like。這個結果支持「realized-measure corrections 在 TX 日盤有方向性資訊」的說法。但專案 gate 不只看 MCS membership。候選模型還要通過 pairwise Harvey-style DM 門檻;HARQ 的 pairwise t=-2.60,SHARK_like 的 pairwise t=-1.77,都沒有過線。

研究口徑因此要保守:TX_active 不是 null,但也不是 PASS。更準確的分類是 DIRECTIONAL_ONLY

核心發現二:SHARK_like 是 best QLIKE,但不是可宣稱的勝利

SHARK_like 的 QLIKE=0.165226,是 TX_active 四個模型中最低;相對 HAR 的改善是 +2.05%。若只看 point estimate,研究者很容易把這個模型寫成 winner。K1582 不這樣處理,原因有三個。

第一,pairwise DM t=-1.77,p=0.0766。方向有利,但統計強度低於 project gate。第二,HARQ 的 DM t=-2.60 比 SHARK_like 更強,雖然 QLIKE 改善略小。第三,HARQ_full 也在 MCS 內,改善 +1.54%,表示「加更多 RQ interaction」並未單調提高結果。這組 diagnostics 指向同一個結論:measurement-error correction 方向值得保留,模型層級排序還不穩。

這個結果也避免了另一種過度詮釋。SHARK_like 加入 semivariance shares 與 signed jump controls 後最佳,不能直接推論「jump 或 downside decomposition 是主要機制」。目前證據只說:把 RQ interaction 與 signed realized components 加在 HAR 周邊,TX 日盤 QLIKE 往好的方向移動。要識別機制,下一步需要 nested ablation、夜盤 / 日盤分層,並對 jump / semivariance 子項做穩健性檢查。

核心發現三:SPY 與 0050.TW 只能作流程檢查

K1582 sample gate

SPY 與 0050.TW 的 local 五分鐘資料只涵蓋 2026 年短區間,OOS forecast 數量分別是 51 與 38,低於 252 的 gateable minimum。K1582 將兩者標成 INSUFFICIENT_DATA,不把短樣本輸出當作跨市場推論。

MarketBest by QLIKEHAR QLIKEHARQ improvementHARQ DM tSHARK_like improvementSHARK_like DM tVerdict
SPYHARQ0.328711+0.58%-0.04-15.04%+0.95INSUFFICIENT_DATA
0050.TWHAR0.231824-6.04%+2.39-11.61%+1.01INSUFFICIENT_DATA

這兩組短樣本仍有工程價值。它們確認資料處理、feature construction、OOS loop、DM/MCS 評估可以跨市場跑通,也提醒後續研究不能拿短快照補足跨市場敘事。K1582 的正式結論只來自 TX_active。

Lookahead 與 reproducibility 檢查

K1582.py 的 timing 設計有三層防線。

  1. add_forecast_features() 先對 rvmers_minus_sharers_imbalancesigned_jump_shareabs_jump_share.shift(1),再建立 daily / weekly / monthly features。
  2. Weekly 與 monthly features 是 lagged series 的 rolling mean,因此 row t 的 weekly feature 是 t-5t-1,monthly feature 是 t-22t-1
  3. expanding_oos_forecasts() 對第 pos 列 forecast 時,只用 features.iloc[:pos] 訓練,再對 features.iloc[[pos]] 預測。Forecast row 的 target 不進訓練集。

本文引用的所有統計數字來自 experiments/k1582/K1582_results.json。主要圖檔由 experiments/k1582/K1582.py 產生,文章圖表則由發布流程上傳到 Supabase Storage。

實務意義

K1582 對後續研究有兩個直接用途。

第一,HARQ 類 measurement-error correction 值得保留在 TX realized-volatility pipeline。TX_active 的 HARQ 與 SHARK_like 都降低 QLIKE,MCS 也排除 baseline HAR;即使 gate 不允許 PASS,這不是完全沒有訊號的方向。

第二,研究設計必須把「模型改良」與「資料可 gate」分開。SPY 與 0050.TW 在這輪只是流程檢查,不能補強跨市場論文敘事。若要真正檢驗「台灣市場因日夜盤微結構而更需要 measurement-error correction」,至少需要可 gate 的 SPY / ETF intraday panels,並把 TX day session、night session、roll handling、active contract selection 全部分層。

對交易或風控系統而言,K1582 還不到上線訊號。比較合理的工程位置是 candidate feature family:保留 HARQ / SHARK_like variants,進入下一輪 ablation 與 longer-panel validation,而非直接替代 HAR baseline。

限制與下一步

  • TX 只使用日盤 08:45-13:45。原始 hypothesis 關心夜盤 / 日盤 microstructure,尚未被完整測試。
  • SPY 與 0050.TW local five-minute panels 太短,不能支持 publication-grade cross-market inference。
  • SHARK_like 是 approximation。若要與 Buccheri-Corsi full SHARK estimator 對話,需要重新實作更完整的 estimator 或明確改名成 realized-measure enriched HARQ。
  • MCS 使用 n_boot=1000。這是 hourly task 可接受的 runtime trade-off;paper-grade rerun 應提高 bootstrap budget。
  • 目前只使用 QLIKE / DM / MCS。後續可加入 density forecast、tail-risk loss,或檢查 forecast combination 是否比單一修正版更穩。

下一輪最有價值的實驗,是把 K1582 拆成可解釋的 ablation grid:HARQ only、HARQ_full、semivariance only、signed jump only、day/night split、roll-date exclusion,並在每個規格上保留同一套 shift(1) 與 expanding OOS gate。

延伸文獻與內部連結

  • Corsi (2009), A Simple Approximate Long-Memory Model of Realized Volatility: HAR-RV baseline。
  • Bollerslev, Patton and Quaedvlieg (2016), Exploiting the errors: HARQ 與 realized quarticity measurement-error correction。
  • Buccheri and Corsi (2021), SHARK-related realized-volatility forecasting work: rich realized measures 與 signed components。
  • Patton and Zhang (2026), Bespoke Realized Volatility: realized measure 應配合 forecast target 與 measurement-error problem 設計。
  • 一般讀者版:https://volpred.zeabur.app/v3/reports/mile_b88ee7bc

K1582 result gate


本文基於實驗 K1582(腳本:experiments/k1582/K1582.py,結果:experiments/k1582/K1582_results.json)。資料來源:TAIFEX TX active-contract 日盤 tick 檔、本機 SPY / 0050.TW five-minute snapshots。主要樣本:TX_active 2017-05-16 至 2026-06-29,OOS forecasts=1,697。所有 forecast features 均使用 t-1 與更早資訊。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
把五分鐘資料切得更細,預測真的會更準嗎?台指期給了一個保守答案
做波動率預測時,很容易想把資料切得更細。一天一筆收盤價太粗,那就看每五分鐘一筆;只看總波動太粗,那就再拆成上漲、下跌、跳動、估計噪音。直覺上,資料越細,模型應該越聰明。 這次台指期日盤實測給的答案比較冷靜:細資料有幫助,但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動,期間從 2017-05-16 到 2026-06-29,共 2219 個原始交易日。正式可判斷的樣本外...
📄
日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄
# 日頻波動率,HAR-RV 贏不了 GARCH:60 場跨資產對戰的紀錄 > 實驗 K188 | OOS 期間 2023-01-01 至 2024-12-31 | 5 資產 × 4 波動率代理 × 3 模型變體 --- HAR-RV 是過去二十年波動率預測文獻裡出現率最高的模型之一。它把波動率分解成日、週、月三個頻率的加總,捕捉長記憶結構,跑在五分鐘高頻數據上幾乎無敵。 那在日頻數據上呢...
📄
黃金跌時波動反而縮?石油衝擊下的槓桿非對稱效應
每次股市暴跌,投資人直覺轉向黃金避險,油價卻往往跟著地緣緊張飆升。這兩個商品在市場恐慌時走向截然不同,波動率模型能不能抓住這個差異? 在 2023 年 1 月到 2025 年 12 月的 808 個交易日樣本中,我們對 GLD(SPDR 黃金 ETF)和 USO(美國石油 ETF)跑了六種波動率模型,結果出現一個值得深究的反差:黃金的槓桿效應和石油完全反向,而 HAR 對數範圍模型在股票市場曾表...