跳過預測直接學交易？聽起來聰明但沒用

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

[提出: 用戶, 執行: Claude]

摘要

如果你跳過「預測波動率」這個步驟，直接用機器學習「學」交易動作，結果會更好嗎？我們測試了三種這樣的方法，發現它們表面上看起來「贏了」，但仔細一看，根本是鑽了多頭市場的漏洞，不是真正的擇時能力。

K798：各策略 Sharpe Ratio 比較（2006–2025）

你有沒有聽過這個說法：「預測完再行動，太慢了」

傳統的量化策略流程是這樣的：

預測明天波動率
根據波動率決定今天該持有多少股票
執行交易

這個流程有個顯而易見的批評：「你為什麼要多一個中間步驟？預測波動率只是手段， 賺錢才是目的 。為什麼不直接讓機器學習『什麼時候該持有多少』，跳過預測這一步？」

聽起來很有道理，對吧？這個概念在學術上叫做「決策導向學習（Decision-Focused Learning）」，近年在機器學習領域非常流行。我們的研究（K798）就是來測試： 在投資策略上，直接學交易動作真的比先預測再行動更好嗎？

我們測試了三種「跳過預測」的方法

方法一：直接最優化（DF-OLS） 讓模型直接計算「在過去的數據下，什麼樣的 SPY 持倉比例能最大化報酬」，然後把這個比例套用到未來。不預測波動率，直接給出數字。

方法二：特徵條件策略（FC-Policy） 更進一步，讓模型學習「當 VIX 是 X、市場動能是 Y 的時候，應該持有 Z% 的 SPY」。類似一個很小的神經網路，根據當下特徵直接輸出交易決策。

方法三：情境強盜（Contextual Bandit） 借用強化學習的概念。把持倉比例分成幾個「動作選項」（低、中、高），讓模型在不同市場情境下「試錯」，逐漸學習哪個選項最好。

三種方法各有巧思，都號稱「不預測、直接學習最優動作」。

結果看起來很亮眼，直到你仔細看

策略	Sharpe Ratio
特徵條件策略（FC-Policy）	2.26
直接最優化（DF-OLS）	2.20
BH 50/50（SPY+GLD，不動腦）	2.24
情境強盜（Bandit）	2.01
傳統 12/VIX 策略	1.51

第一眼看，FC-Policy 的 Sharpe 2.26 確實「贏了」所有對手。如果你在這裡停下來，你會說「機器學習直接決策法有效！」

但我們沒有停。我們做了一件很關鍵的事： 用嚴格的統計方法（Harvey t>3.0 門檻）檢驗這個差異是否真實存在 。

結果是： 所有三種方法都沒有通過統計顯著性檢驗。

換句話說，FC-Policy 比 BH 50/50 「贏」那一點點（2.26 vs 2.24），完全可能只是隨機運氣。不是真正的技術優勢。

「贏了」的背後：其實是在押注多頭市場

我們進一步分析 FC-Policy 的實際行為，發現了問題的根源：

這個模型在測試期間（2006–2025）平均持有 64% 的 SPY （股票比例）。

2006–2025 這段期間，美股整體是牛市，持有更多股票，自然報酬更好。FC-Policy 「學」到的不是真正的擇時技巧，而是「多頭時期多買股票」這個非常簡單的規律。

這就是所謂的 「在牛市中吃掉風險溢酬」 ，不是擇時能力。如果把這個策略放到熊市期間單獨測試，它的「優勢」會立刻消失。

真正的對手：什麼都不做的 50/50

這個測試裡最耐人尋味的結果是： BH 50/50（買入並持有 50% SPY + 50% GLD）的 Sharpe 是 2.24 ，幾乎和那個精心設計的 FC-Policy（2.26）一樣好。

而且 BH 50/50 通過了一個更嚴苛的測試—— CRRA 效用（考慮風險厭惡的情況下） ，BH 50/50 是最佳選擇。

意思是：如果你像一般投資人一樣在意下跌風險， 什麼都不調整、固定 50/50 持有，反而比那些複雜的機器學習策略更好 。

為什麼「直接學動作」在投資上特別難奏效？

這個結果呼應了我們之前的發現（K697）： VIX 能預測波動率的大小，但不能預測報酬的方向 。

「方向」才是每日賺錢的關鍵。如果你不能預測明天是漲還是跌，那不管你用什麼方法「學習交易動作」，你都沒有辦法贏得每日 alpha。

決策導向學習是個聰明的概念，在有真實預測信號的問題上（比如天氣預報改進能源調度、醫療診斷改進治療方案）很有用。但在股市裡， 問題不是「預測到行動的映射太複雜」，而是根本就沒有穩定可用的預測信號 。

聰明的方法，遇到錯誤的問題，還是沒用。

那投資人該怎麼辦？

這是我們七次確認「12/VIX 難以突破」後，最一致的建議：

波動率策略的價值在於降低風險，不是增加報酬 。當你用 VIX 調整持倉，你買的是「大跌時少虧一點」，不是「多頭時多賺一點」。
固定比例配置（50/50）是極難打敗的基準 。如果你沒有確切的理由相信某個策略真的更好（統計顯著），不如就用它。
看到漂亮的 Sharpe 數字先別衝動 。2.26 vs 2.24 的差異，在統計上根本不顯著。市場數據裡的「微小優勢」大多數都是噪音。

本文基於 K798 實驗（數據：yfinance SPY/GLD/VIX，2006-2025）