K1064: 描述性 ≠ 預測性——為什麼個股 EAV 無法改善 ETF 預測？

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

摘要

[提出: Claude, 執行: Claude]

K1060 發現台股個股 T+1 EAV 顯著（ratio=1.466, p=0.034）。K1064 測試是否能將此描述性發現轉為 預測增益 ：將 EAV 訊號作為外生變數加入 A4f-0050.TW 模型。結果 全部 NULL ，揭示「描述性發現 ≠ 預測增益」的深刻教訓。

實驗設計

EAV Signal 建構（3 個版本）

對每日 t，計算「今日（盤後）公告公司的加權 EAV 預期」：

EAV_signal_t = Σᵢ weight_i × 𝟙(公司 i 在 t 當日公告)

版本	權重方案
Equal	每家公司 = 1
Sector	用 K1060 的 sector T+1 ratios（科技 1.6, 金融 1.29, 傳產 2.15, 電信 0.85）
Top-50	Top 50 市值公司代理權重

模型

Baseline A4f : τ_{t+1} = θ₀ + θ₁·VIX²_t，g_{t+1} = GJR on r/√τ
Extended A4f-EAV : τ_{t+1} = θ₀ + θ₁·VIX²_t + θ₂·EAV_signal_t
OOS 2019-2025（1,698 days），w=2000，refit 63d，27 refits
Random seed = 42

核心結果：ALL NULL

DM Test vs A4f Baseline

Variant	DM t	p-value	QLIKE Improvement
A4f_EAV_equal	+1.08	0.280	-0.205%
A4f_EAV_sector	+0.96	0.337	-0.207%
A4f_EAV_top50	+2.36	0.018	-0.419%

All positive t = A4f baseline wins 。Top-50 variant 邊際顯著但 方向錯誤 （EAV 加入反而更差）。

K1064 DM Tests + Descriptive vs Predictive

θ₂ 顯著性

所有 variant 的 θ₂ 分佈均值 ≈ 0，標準差大
p > 0.80，NS
Bootstrap 95% CI 跨越 0

Event Window 條件分析

Sector variant 在 event days: +0.55%（NS）
Non-event days: -0.62%（NS）
方向上暗示 event-specific 效應，但統計力不足

三個關鍵洞察

1. Descriptive ≠ Predictive

K1060 的 T+1 ratio=1.466 是 條件平均數 （conditional mean）— 給定「今天有公告」，明天的 r² 平均比非事件日高 46.6%。但這不保證在每日頻率下有 線性預測關係 。

個股層面的強訊號 → ETF 日頻線性模型 = 訊號流失

2. VIX 已吸收系統性成分

In-sample correlation(r², EAV_log) ≈ -0.01 。

這意味著經過 VIX 過濾後，EAV 訊號在 r² 上沒有剩餘的線性預測力。VIX 作為 forward-looking 指標，已經把所有「未來 30 天隱含波動率」的成分納入，包括即將到來的財報不確定性。

3. Diversification Dilution（與 K1062 一致）

50 檔成分股的 idiosyncratic earnings news 相互抵銷：

TSMC 公告 → 股價變動
聯發科非公告日 → 正常交易雜訊
鴻海非公告日 → 正常交易雜訊
...
50 檔加權平均 → idiosyncratic vol averaged out

對 Paper 2（Taiwan VT）的建議

EAV 故事應放在機制解釋段落

個股層面有效（K1060）
ETF 層面描述性（K1059/K1062）
但 不進入預測模型

A4f with US VIX² 仍是正確規格

K1058（A4f 直接在 0050.TW 上 DM NS 但 VaR Trinity PASS）+ K1064（EAV 無預測增益）雙重證實。Paper 2 的 Taiwan VT 應該維持 8.63/VIX 架構， 不添加 EAV 複雜度 。

後續方向（research_program 已記錄）

K1067 ：TSMC 單一個股 A4f+EAV — 個股 T+1 ratio=1.466 很強，diversification 不稀釋
K1066 ：非線性 EAV × VIX 交互 — K1064 的 NULL 可能只是「線性失敗」
Event week 高頻 refit — 5-day cadence around announcements

方法論警示

這是研究的典型陷阱： 看到強描述性效應（ratio 1.466）就假設能轉為預測信號 。實際上：

描述性是 conditional mean（平均而言）
預測性是 linear forecast contribution（邊際）
兩者在有其他 confounder（VIX）存在時可能完全脫鉤

教訓：每個新發現都該用 DM test 做 OOS 驗證，不能只停在 in-sample t-stat。

實驗腳本: experiments/k1064/k1064.py 結果數據: experiments/k1064/k1064_results.json

參考文獻 : Engle (2002); Patton (2011); Diebold & Mariano (1995); Harvey et al. (2016); 本研究 K988/K1058/K1060/K1062。