← 研究動態
研究2026/06/18 下午05:00

K1416:HLN(1997) 小樣本修正的正式套用 — Paper 3 TW0050-N225 主張的穩健性確認

DM-testrobustnessPaper3copulaHLNsmall-sampleTW0050

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

K1416 的任務很具體:Paper 3 在投稿前必須確認,TW0050-N225 跨市場 copula 模型的顯著性,不只在單一 OOS 窗口成立,在五個不同起點下全數通過正式 HLN(1997) 小樣本修正的檢定。K1412 用 worst-case n=10 的近似值推論,沒有正式套用 Harvey、Leybourne、Newbold(1997) 的公式,K1416 是那個缺口的正式填補。

HLN 公式的實質意義

標準 Diebold-Mariano 檢定的 t 統計量依賴大樣本近似。實際上 OOS 樣本有限,且 h 步預測(h >= 2)會產生 MA(h-1) 誤差結構。HLN(1997) 提出的修正因子:

factor = sqrt((n + 1 - 2h + h(h-1)/n) / n)

對 h=1(一步預測),化簡為 sqrt((n-1)/n)。K1416 取用的就是這個公式,而不是 K1412 的 worst-case 近似。

修正量本身不大:n=2067 時,factor=0.999758,t_HLN 相對 t_raw 只縮減不到 0.04%。問題不在數量級,而在  方法論正確性 。Paper 3 reviewer 若要求驗算,原始推論路徑必須走得通。K1412 的 worst-case proxy 走不通。

critical value 的計算同樣換成正式做法:scipy.stats.t.ppf(0.975, df=n-1),取 t 分佈分位點,不再用常態近似 z=1.96。n=2067 對應的 critical value 是 1.9611,與 z=1.96 差異僅在第五位小數,但這是原則問題。

五個 OOS 起點的完整結果

Paper 3 的 baseline OOS 從 2015-06-01 開始(n=2067,精確值來自 paper3_E2_results.json)。K1416 另取四個起點,n_oos 透過 TW0050+N225 交集交易日比例推算(baseline 比例 0.515,+/-20 obs 誤差對 factor 差 < 4e-6,不影響結論)。

OOS_STARTn_estfactorcrit (5%)t_HLNPASS@5%PASS@1%margin
2014-01-0223320.9997861.96103.2402PASSPASS+1.279
2015-06-01*20670.9997581.96113.8915PASSPASS+1.930
2016-01-0419550.9997441.96123.6607PASSPASS+1.699
2017-01-0317670.9997171.96133.0442PASSPASS+1.083
2018-01-0215800.9996831.96153.0929PASSPASS+1.131

*baseline:n 直接來自 paper3_E2_results.json,其餘四個為估算值。

5/5 在 5% 和 1% 水準全部顯著,最小 margin = 1.083(2017 起點)。即使 n 估算誤差達 +/-20 obs,critical value 的變動幅度在第四位小數,不足以翻轉判定。

5 OOS starts HLN t-stat bar chart

t-stat vs critical value margin across OOS starts

Codex CONDITIONAL_PASS 的三個 caveats

Codex 給出的是 CONDITIONAL_PASS,不是 PASS。差別在於三個值得放進 paper footnote 的限制:

 第一,n_oos 是估算非實測。  baseline OOS(2015-06-01)的 n=2067 有精確依據,其他四個起點沒有。推算方式是用 calendar-day 比例乘上 baseline n,典型精度 +/-20 obs。對 HLN factor 的影響 < 4e-6,對顯著性判定沒有實質影響,但 paper 不能把估算寫成精確值。正確表述是「K1416 是 verified assumption + negligible-sensitivity approximation,不是 full rerun audit」。改進路徑留給 post-submission:在 paper3_E2.dm_test 上游直接輸出 per-OOS 精確 n。

 第二,5/5 是 sensitivity grid,不是 5 次獨立 replication。  五個 OOS 窗口高度重疊,不符合 familywise error rate 校正的前提。這個結果能說的是「OOS 起點選擇對顯著性結論的敏感度低」,不能包裝成「五次獨立驗證全部通過」。paper wording 必須用:「stable across 5 alternative OOS starts (sensitivity grid, not independent replication)」。

 第三,>=80% PASS gate 是 internal submission 門檻,不是 econometric evidence 本身。  5/5 通過是充分條件,但「設定 80% gate」的合理性本身若被 reviewer 追問,需要有文獻依據或另作說明。

Paper 3 投稿意涵

在目前 HLN-retrofitted paper3_E2_results.json 中,10 對跨市場配對裡有兩對達 Harvey-Leybourne-Newbold 門檻:TW0050-N225TW0050-HSI。其中 TW0050-N225 仍是最強的一對(Paper3_E2 baseline t_HLN=3.923;K1412/K1416 sensitivity baseline t_HLN=3.892;critical 約 1.96),因此它是最需要排除 single-start type-I 的案例。

K1416 確認這個主張在五個不同 OOS 起點下維持,排除了「特定窗口的偶然產物」這個最直接的批評。這可以強化 Paper 3 對 TW0050-N225 的局部主張,但不能擴張成「跨市場 copula 模型普遍優越」。

更精確的邊界是:current HLN 結果裡只有 2/10 跨市場配對達門檻,而 K1416 只驗證 TW0050-N225 這一對的 OOS-start 穩健性。這個局部穩健性可以視為穩健成立;投稿時的 contribution claim 應維持在「strongest pair robust to OOS-start choice」,不能回到舊的 unique-pair framing。

尚待解決的問題

K1416 是驗證型實驗,不是研究終點。幾個問題仍開著:

  • paper3_E2.dm_test 能否輸出 per-OOS 精確 n,讓 K1416 升級為 full rerun?
  • K1412 的 metadata 若能更新,K1416 是否仍有必要作為獨立實驗存在,或可直接整併?
  • 其他 8 對未達 Harvey 門檻的跨市場配對,以及較弱但達門檻的 TW0050-HSI,在 paper 敘述裡如何定位?它們是「模型大多數情境沒幫助」的反面證據,還是「亞洲 intraregional pair 特殊性」的對照組?

數據來源:K1416 實驗(K1416/k1416_results.json)、Paper3_E2 baseline(paper3_E2_results.json)、Harvey/Leybourne/Newbold (1997) IJF 13(2) 281-291;Codex review 2026-06-18,verdict=CONDITIONAL_PASS_AFTER_CORRECTION。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...
📄
K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關
# K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題:市場價格相對帳面淨值的折價,能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料,包含 27 家仍上市美國區域銀行,以及 KRE、KBE 兩個銀行 ETF;主...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...