← 研究動態
研究2026/04/05 上午01:03

800+ 實驗後的誠實反思:我們到底學到了什麼?

VT策略EMH反思paradigm shift

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

800+ 實驗後的誠實反思:我們到底學到了什麼?

[提出: 用戶 (根本問題), Claude (反思整理)]

「會不會你現在的策略都不適合?」

—— 一位讀者的提問,也是我們必須面對的問題。

已確認的 NULL Results 及累積挑戰次數

800+ 實驗的知識地圖分類


一個不舒服的數字

VolPred 系統至今已執行超過 800 個實驗、產出 591 個實驗腳本、累積 1637 條知識記錄。光是今天一天,就做了 18 個實驗。

但如果誠實面對結果—— 大多數實驗的結論是 NULL 。

這不是失敗的標誌。在科學研究中,知道什麼「不行」跟知道什麼「行」一樣重要。但如果我們不停下來認真盤點,就會犯一個更大的錯: 在已經證明走不通的路上繼續投入資源 。

今天,我們做一次完全透明的覆盤。


確定失敗的方向:不要再走了

1. 日頻報酬率預測:EMH 對 SPY 確實有效

K840 的結果很明確:即使用 GARCH 條件波動率做信號,SPY 的日頻方向預測準確率只有約 55%。這個數字在扣除交易成本後無法產生穩定 alpha。

 34 次獨立驗證 都指向同一結論:沒有任何變數,包括 VIX、FRED 總經指標、情緒指數,能夠可靠預測 SPY 的每日漲跌。效率市場假說在日頻層面、對大型指數而言,是成立的。

2. 沒有模型能統計顯著打敗 GJR-GARCH

我們讓 7 種不同的機器學習模型挑戰 GJR-GARCH:KAN(Kolmogorov-Arnold Network)、GRU、GINN、Random Forest、XGBoost、LSTM,以及各種 ensemble 方法。

 結果:7 戰 7 敗。  沒有一個能在 Harvey (2016) t > 3.0 的門檻下統計顯著勝出。GJR-GARCH 在日頻波動率預測上,就是王者。它的槓桿效應項捕捉了最關鍵的不對稱性,而且只用 4 個參數。更複雜的模型帶來的只是更多的過擬合風險。

3. 沒有策略能打敗 50/50 SPY/GLD

K702 的 grid search 確認:在風險調整後,50/50 SPY/GLD 的靜態配置在 Sharpe 上沒有被任何動態策略打敗。我們測試了 10+ 種 VT(Volatility Targeting)策略的變體,調整閾值、改變頻率、加入額外信號—— 全部無法在統計上超越 這個最簡單的配置。

4. Bayesian 沒有改善 MLE

K814v2 和 K839 都明確顯示:對 GARCH 家族模型而言,Bayesian 估計並沒有比最大概似估計(MLE)產生更好的預測。先驗分配帶來的 shrinkage 效果,在大樣本下可以忽略不計。

5. 其他確認失敗的方向

  •  國會議員跟單交易 (K823v2):用真實交易數據驗證,完全沒有 alpha。政治人物的交易時機並沒有比隨機好。
  •  夜盤 momentum (K838):不但沒有正向 momentum,信號是 反向的 。
  •  期貨即時避險 (K841):GARCH 信號需要 T-2 的數據才能估計,根本不是「即時」。工具可以用,但信號太慢。

確定成立的結論:這些是真的

1. VT 是保險,不是 alpha generator

這是我們最重要的發現,也是最需要正確理解的:

  • VT 策略可以降低最大回撤(MDD) 30-50% 
  • 但代價是每年約  4% 的保費 (Sharpe ratio 略低於 Buy & Hold)
  • 原因很清楚:VIX 預測 vol magnitude(相關性 0.57),但 不預測方向 (相關性 0.04)

這不是失敗。保險本來就不是用來賺錢的。對風險厭惡係數 gamma >= 5 的投資人而言(K688),VT 在 CRRA 效用框架下確實勝出。 VT 的價值在於讓你睡得好,不是讓你賺更多。 

2. GJR-GARCH 是日頻波動率預測之王

在所有模型中(包括 EGARCH、TGARCH、各種 ML),GJR-GARCH(1,1) with Student-t innovations 一直是最穩健的選擇。它在 QLIKE loss function 上的表現跨資產一致地最好或不可區分地接近最好。

3. HistSim 和 Student-t 是 VaR 最佳實踐

K829 跨資產驗證(SPY、QQQ、EWZ、0050.TW):歷史模擬法(Historical Simulation)和 Student-t 分配在 VaR 估計上一致表現最佳。Cornish-Fisher 展開式特別適合高峰態資產如台股(K836)。

4. VRP(波動率風險溢酬)一致為正

K833 確認:市場在 78% 的時間高估恐慌。隱含波動率 > 實現波動率 是常態。這是一個結構性的收益來源,不是預測的結果。

5. VT 擁擠效應有臨界點

K827 分析了 VT 策略的市場容量:擁擠臨界點在 30-50%。目前 VT 類策略的市場滲透率 < 5%,遠低於危險水位。短期內擁擠不是問題。


範式轉向:下一步該往哪走?

當你在一個方向上做了 800+ 個實驗還是 NULL,正確的反應不是「再多試幾個」,而是 換方向 。

1. 從「預測」到「結構性收益」

我們花了太多精力試圖預測市場的下一步。但 VRP 研究(K833)告訴我們: 有些收益不需要預測,它們是市場結構的產物 。波動率賣方收取的保費、再平衡帶來的 rebalancing premium——這些是可以系統性收割的。

2. 從「日頻」到「多頻率」

EMH 在日頻對大型指數有效。但月頻呢?季頻呢?K697 顯示 VIX 不能預測每日方向,但 VIX 的 月度 regime (高/中/低)與後續月報酬有更清晰的關係。多頻率框架可能揭示不同的 alpha 結構。

3. 從「回測」到「即時系統」

K841 的教訓:歷史回測中看起來可行的策略,在即時執行中可能因為信號延遲而失效。我們需要從回測思維轉向 live infrastructure 思維,信號延遲、執行滑點、市場衝擊都必須納入考量。

4. 從「Alpha」到「風險管理」

也許我們問錯了問題。與其問「如何賺更多」,不如問「如何虧更少」。VaR 估計(K829)、Cornish-Fisher 風險調整(K836)、VT drawdown protection——這些才是大多數投資人真正需要的。

5. 從「美股」到「效率較低的市場」

SPY 太有效率了。但 K461 在台股(0050.TW)上用 SSVS 方法竟然選出了 SPY 作為最佳外生預測因子(PIP=1.000),而美股上同一方法選的是空模型。 效率較低的市場可能有更多結構性機會。 


誠實的結論

800+ 個實驗之後,我們的答案是:

 是的,對於「打敗市場」這個目標,我們的策略確實不適合。 

但對於「在承擔較少風險的前提下獲得合理回報」,我們學到了很多確定有效的方法。50/50 SPY/GLD 配置、GJR-GARCH 波動率估計、VT drawdown protection、HistSim VaR——這些不是 alpha,但它們是 真正有用的工具 。

科學研究的價值不在於每次都發現新大陸。800 個 null results 畫出了一張清晰的地圖:告訴你哪些路走不通,這本身就是極有價值的知識。

下一步,我們不會停止實驗。但我們會更聰明地選擇方向。


本文基於 VolPred 系統 800+ 實驗的綜合反思。主要引用實驗:K840(日頻預測)、K697(VIX 方向預測)、K687/K688(VT 策略 lag 修正)、K702(50/50 最佳配置)、K829(跨資產 VaR)、K833(VRP)、K836(Cornish-Fisher)、K827(VT 擁擠度)、K823v2(國會跟單)、K838(夜盤動量)、K841(期貨即時避險)、K814v2/K839(Bayesian vs MLE)。數據來源:yfinance、FRED、CBOE。

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
新興市場主權債的波動率,能提前預告 EM 股市風暴嗎?一次誠實的否定(K1621)
新興市場的美元主權債,波動起來的時候,會不會比股市早一步聞到火藥味?如果會,那些免費就能取得的債券 ETF 與信用利差,或許能當作跨資產的預警訊號。我們用 2015 到 2026 十一年的資料把這個念頭認真測了一遍,結論很乾脆:**不會**。主權信用的「波動率」和新興市場股票的波動率幾乎是同一時間一起動的,不存在可以拿來做日頻預測的領先關係。 這是一個 NULL 結果,但它是乾淨、可複現、而且對...
📄
K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關
# K1605:區域銀行 M/B 折價與後續波動,橫斷面穩健、OOS 不過關 *[提出: publication-candidates, 執行: Codex]* ## 摘要 K1605 檢驗一個銀行風險問題:市場價格相對帳面淨值的折價,能不能提前指出區域銀行後續已實現波動率上升。樣本使用 yfinance 免費資料,包含 27 家仍上市美國區域銀行,以及 KRE、KBE 兩個銀行 ETF;主...
📄
K1582:HARQ / SHARK-style 測量誤差修正 HAR-RV 的台指期日盤試驗
## 摘要 [提出: Claude, 執行: Claude] K1582 檢驗 realized quarticity 測量誤差修正與 signed intraday components,是否能改善標準 HAR-RV 的一步期 realized variance 預測。正式可判斷樣本是 TAIFEX TX active-contract 日盤,原始日資料 2,219 筆,樣本外預測 1,697...