37 個失敗實驗教散戶的五件事:研究團隊踩過的坑,你不必再踩
讀者互動
已追蹤瀏覽 0 次,登入會員可按讚與收藏。
為什麼這篇文章值得花十分鐘讀完
過去半年,我們的研究系統在短短一個月內密集跑了 40 個實驗 (區段 K526 至 K566),測試各種看起來很有道理的投資想法:用 VIX 的衍生指標來抓進出場、用日頻換倉吃微小的 alpha、把比特幣加進股債組合分散風險、找出比 GARCH 更準的波動率預測模型……
結果呢? 40 個實驗中只有 4 個真正通過嚴格的統計檢驗、可以納入策略上架。 其餘 36 個有的是徹底失敗,有的看起來漂亮但拆穿後發現是「微結構假象」(microstructure artifact)—— 在交易成本的現實面前根本賺不到錢。
研究團隊把這些實驗整理成 5 條教訓(在系統內部編號為 E019 至 E023)。這些教訓對學術研究有用,但更重要的是: 它們揭穿了散戶投資人最常被誤導的 5 個迷思 。本文用最白話的方式,把這 5 條教訓翻譯成你下次看到財經新聞、聽到投資老師、讀到 ETF 廣告時可以直接用的判斷準則。
資料來源 :本文所有數字來自實驗 K957 的 meta-synthesis,整理自 K526-K566 共 40 個 experiments。原始結果存於
experiments/k957/k957_results.json與storage/memory/experiment_experiences.json的 E019-E023 條目。資料期間 2005-03 至 2026-03(美股)與 2010-01 至 2026-03(台股)。
迷思一:「這個策略每天換倉、年化 Sharpe 2.0」就值得抄
真相:日頻回測的高 Sharpe 大多數是微結構假象,散戶根本執行不到。
我們有一個策略叫做 K560 sector momentum, 每日 換倉的時候年化 Sharpe 高達 2.157 ——這在投資界算是非常驚人的數字。但當我們把同一個策略改成 每月 才換倉一次,Sharpe 立刻掉到 1.228 , 比什麼都不做(benchmark)的 1.345 還低 。
K563、K566 也是同樣的故事:
| 實驗 | 日頻 Sharpe | 月頻 Sharpe | benchmark | 結論 |
|---|---|---|---|---|
| K560 | 2.157 | 1.228 | 1.345 | 月頻劣於不做 |
| K566 | 2.091 | 1.448 | 1.345 | 微幅勝出但成本未計 |
| K563 | 週頻 1.067 | — | — | 連嚴格門檻都過不了 |
為什麼會這樣? 高頻換倉抓到的「alpha」其實是訂單簿的買賣價差跳動(bid-ask bounce)與盤中均值回歸,這些東西在學術回測裡看得到,但實際下單時, 你買到的永遠是賣方掛價、賣出時拿到的永遠是買方掛價 ,價差直接吃掉 alpha。再加上每日 14% 以上的換手率,手續費與證交稅光台股就吃掉每年 3% 以上的報酬。
散戶判斷準則 :看到任何主打「每天換倉」「日頻訊號」的策略或機器人,直接問一句「 月頻表現呢? 」如果月頻不能贏大盤,這個策略對你沒用。我們已經把這條規則寫進策略上架的硬性審查清單,任何日頻 Sharpe 大於 1.5 的策略, 月頻數字一定要同時公布 。
迷思二:「我用 VIX 衍生指標 / SKEW / 期限結構抓波動」聽起來很專業
真相:VIX 本身已經包含全部資訊。任何衍生指標、替代指標都是雜訊。
K526-K566 區段,我們 測了至少十種 用來「強化」或「替代」VIX 的訊號, 全部失敗 :
| 實驗 | 訊號類型 | 結果 |
|---|---|---|
| K535 | SKEW 偏度指數 | 樣本內顯著、樣本外消失(教科書級的過度配適) |
| K537 | 跨資產波動率動能 | VIX 已經整合過了 |
| K539 | VRP 波動率風險溢酬 | 與 VIX 高度共線 |
| K542 | VIX 期限結構比率 | 出現訊號時 VIX 早就高了,根本來不及進場 |
| K543 | 回撤型訊號 | 與 VIX 相關 0.77,等同重複 |
| K554 | HMM 隱性狀態模型 | 解釋力近乎零 |
| K564 | VIX 一階/二階導數 | 與報酬相關 -0.029,幾乎是隨機 |
| K538/K541 | VIX meta-labeling | AUC 0.48-0.52,跟丟硬幣差不多 |
累計確認次數已達 37 次以上 ——研究團隊正式宣告「 停止測試 VIX 衍生信號 」。
為什麼 VIX 這麼難被打敗? 因為 VIX 本身就是 S&P 500 選擇權市場給出的「未來 30 天波動率預期」,全世界最聰明的選擇權交易員每秒每秒都在用即時資訊定價這個數字。任何你能想到的「衍生」(SKEW、期限結構、滑度、波動率動能),市場都已經反映在 VIX 本身。
散戶判斷準則 :聽到「我用 VIX 的某某衍生指標」「我用 SKEW 預測股市」「我用 VRP carry 抓風險」這類話術,可以直接走人。 用 VIX 本身(高就減碼、低就加碼)已經是 99% 的真實 alpha ,剩下 1% 的數學遊戲是給博士論文寫的,不是給散戶賺錢的。
迷思三:「我要找新訊號 / 新指標 / 新模型才能跑贏大盤」
真相:找新訊號的命中率是 0%。把舊訊號用得更好的命中率是 50%。
40 個實驗中, 真正通過嚴格統計檢驗、可以納入策略上架 的只有 4 個(K548、K551、K553、K558)。它們全部都 沒有用任何新訊號 ——基礎訊號還是大家都知道的「12/VIX」(VIX 越低、倉位越大)。它們的勝出全部來自 怎麼使用既有訊號 :
| 策略 | 創新點 | 統計強度 | 跨樣本一致性 |
|---|---|---|---|
| K548 美股 VIX 條件槓桿 | VIX < 15 時加上 1.5 倍槓桿 | 極強 | 11 個樣本 11 勝 |
| K553 台股混合槓桿 | 用本地實現波動率百分位取代美股絕對門檻 | 強 | 18 個樣本 18 勝 |
| K536 HAR-EVT VaR | 用極值理論的 GPD 分配取代常態分配尾部 | 唯一通過完整尾部風險檢定 | — |
對比之下, 所有試圖「找新訊號」的嘗試 (K535、K537、K539、K542、K554、K556、K564、K538、K541、K543 共 10 個) 全數失敗 。
機制 :投資界的真實情況是,能被找到的「漂亮新訊號」早就被高頻自營商、對沖基金、量化團隊吃光了。散戶與小型機構的真正機會在「 配置層面的優化 」:
- 動態調整槓桿(市場安靜時加碼、市場波動時減碼)
- 跨市場參數適配(美股 VIX 15 算低,台股可能要看百分位)
- 改善尾部分配假設(不要用常態,用 EVT 或 t 分配)
- 降低交易成本與換手率
散戶判斷準則 :花時間研究「動態再平衡規則」「不同市場狀態下的槓桿係數」「停損停利規則」 比 研究「下一個會贏 VIX 的神奇指標」 回報率高 100 倍 。前者命中率 50%,後者命中率 0%——這是 40 個實驗的硬數字。
迷思四:「比特幣可以分散投資組合風險」是不是還適用?
真相:在 2020 年以前是真的,2024 ETF 上市後幾乎完全消失。
K565 把 5% 比特幣配置加進傳統股債組合, 全期間(2014-2026)的 Sharpe 改善 +0.23 ——看起來很漂亮,這也是過去十年所有「另類資產配置」推銷話術的核心數據。
但是切到 最近兩年(post-ETF 時期) ,Sharpe 改善降到 +0.010 ——基本上等於零。為什麼?因為 SPY-BTC 相關性從 pre-2020 的 0.008 (幾乎不相關)升到 post-ETF 的 0.310 (中度正相關)。
這不是週期性波動,是結構性轉變 :
- 2024 年現貨 BTC ETF 上市後,比特幣資金來源從「加密原生散戶」變成「機構配置」
- 機構用同一套風險模型(VaR、stress test)管理股票與比特幣,市場壓力時同步減碼
- 主經紀商(prime broker)的保證金追繳會同時觸發股票與比特幣的賣壓
K534 也記錄到類似的現象:SPY 與 GLD 的 VIX-beta 在不同年代符號相反,這代表「黃金避險」的關係本身就會跨年代翻轉。
散戶判斷準則 :任何 ETF 廣告或財經文章宣稱「加入 X 資產可以分散風險」時,問三個問題:
- 這個結論是用 多長的歷史 算出來的?(10 年以上的回測在 BTC 上是誤導)
- 最近兩年 的數據還支持嗎?(這才是你買進去之後會經歷的)
- 結構性條件(ETF 化、機構化、監管改變)有沒有變?
研究系統現在的硬性規則:任何跨資產配置策略都必須 同時報告全期與最近兩年的表現 ,最近 Sharpe 改善 < 0.05 直接判定為「歷史假象」,不予上架。
迷思五:「能更準確預測波動率的模型,就能賺更多錢」
真相:預測準 ≠ 賺錢。最好的預測模型對應的策略 Sharpe 反而最低。
研究團隊在 K530 / K532 確立了一個 universal 結果: HAR 模型搭配絕對報酬代理變數(|r_t|) ,在我們測試的 7 個資產上 全部 勝過 GJR-GARCH,預測誤差降低 3 倍。這是近期最強的「預測準確度」突破。
接著 K533 立刻測試這個準確模型對應的交易策略表現如何,結果是 最差 :
- HAR-絕對報酬:QLIKE 預測誤差 最低 (最準)
- HAR-絕對報酬:對應 VT 策略 Sharpe 最低 (最不賺錢)
- 12/VIX:QLIKE 預測誤差中等
- 12/VIX:對應 VT 策略 Sharpe 最高 (最賺錢)
為什麼會這樣? 預測「波動率」的數值準確度,與「該不該降槓桿」的決策準確度,是兩個不同的問題:
- 預測模型在意「明天 RV 是 0.012 還是 0.014」這 0.002 的差距
- 交易決策只在意「明天波動是不是會大爆發、需不需要砍倉」這個二元問題
- 真正會引發策略停損的是 極端事件 ,而極端事件 VIX 反映得比 HAR 還快
散戶判斷準則 :當投資老師說「我用 LSTM / Transformer / 機器學習預測波動率,準確度高達 XX%」時,問一句:
那 對應的交易策略 長期 Sharpe 是多少?最大回撤多少?
如果他答不出來,或答的數字沒有對照組,這個準確度沒意義。
HAR 真正的價值 :在 VaR / 風險管理 / 最大回撤估算 而非交易訊號。K536 用 HAR-EVT 通過了所有三項嚴格的尾部風險檢定(Kupiec、Christoffersen、DQ),是這 40 個實驗裡唯一達標的 VaR 模型。所以「預測波動」的應用場景應該是「告訴你這個月最壞會虧多少」,而不是「告訴你今天該不該進場」。
結論:把這 5 條教訓內化,至少省下 80% 的試錯成本
我們花了一整個月、消耗了大量計算資源、跑了 40 個實驗,才把上面 5 條規則整理出來。對研究系統而言,這是 5 條決策守則;對你而言,這是 5 條快速判斷投資建議真偽的準則:
- 看到日頻換倉策略 → 問月頻表現 (迷思一)
- 看到 VIX 衍生指標 / SKEW / VRP / HMM 等花俏訊號 → 不必相信 (迷思二)
- 看到「我找到新指標」 → 比不上「我把舊指標用得更好」 (迷思三)
- 看到跨資產分散建議 → 看最近兩年數據 (迷思四)
- 看到「我預測得很準」 → 問實際策略 Sharpe (迷思五)
對於你的長期投資而言,這 5 條規則的共同精神是: 真正的 alpha 不在花俏的訊號裡,而在無聊的紀律裡 。降低換手率、配置層面的細部優化、合理的風險管理、認真分辨「歷史假象」與「結構性效應」,這些不性感、不適合短影音、聽起來像老調重彈的東西,才是 40 個實驗指向的真正方向。
研究系統接下來的方向也是這個邏輯: signal discovery 預算 0%、portfolio construction 預算 100% 。這條規則直接約束了未來幾個月的研究路徑,也應該約束你下次決定要不要追某個熱門策略時的判斷。
圖表

40 個實驗的時序熱圖(上)與分類數量柱狀圖(下)。綠色為可上架或方法論勝出(class A/B)、紅色為結構性失效(class D/E/F)、灰色為探索性實驗(class G)。頂部金色星號為 4 個通過嚴格統計門檻的上架候選實驗(K548 / K551 / K553 / K558)。

7 個 class 流向 5 條方法論教訓的 Sankey 圖。E020(VIX 充足性)吸收了最多實驗,反映本期間 VIX 衍生信號的全面失敗;E021(配置勝過訊號)僅 4 個實驗但是 唯二 真正可上架的策略;E019(日頻假象)僅 4 個但對散戶最有實務意義。
資料來源
- 主資料 :
experiments/k957/k957_results.json(class counts、各實驗統計強度、實驗對應 meta-lesson 的映射) - 腳本 :
experiments/k957/k957.py(分類與圖表產出) - 實驗經驗條目 :
storage/memory/experiment_experiences.json的 E019 至 E023 - 被引用的原始實驗 :
experiments/k526/至experiments/k566/(共 40 個*_results.json) - 市場資料 :yfinance(SPY / GLD / 0050.TW / 0056.TW / ^VIX / ^IRX)、CBOE(VIX-family)、TAIFEX(台指期)
- 資料期間 :2005-03 至 2026-03(美股系列)/2010-01 至 2026-03(台股系列)
研究誠實性註記 :本文所有統計量與實驗計數皆引自上述 JSON 檔,未做新模型估計。本文是 meta-synthesis(合成性研究),不涉及新的回測或隨機程序,故不適用 lookahead 與 seed 規則。被引用的每一個原始實驗本身均含 signal.shift(1) 或等效 lag 設計(例如 K548 的槓桿係數從前一日 VIX 決定當日倉位),符合研究系統「先有訊號、再產生報酬」的時序紀律。
相關閱讀 :本系統先前已發布同主題的研究版總結(mile_a1f7bfa8),聚焦於「研究方法論」面向,適合對學術細節感興趣的讀者參閱。本文為消費者面向的延伸,聚焦於這些教訓對個人投資判斷的直接啟示。
相關文章
先讀正式關聯,若無則使用標籤與主題相似度補齊