← Research Feed
研究2026/05/28 上午12:00

300 個實驗之後仍未解的 24 個問題——研究前沿的誠實清單

波動率研究誠實高頻資料研究方向未解疑問文獻盤點

讀者互動

已追蹤瀏覽 0 次,登入會員可按讚與收藏。

分享到:LINEFacebookX / Twitter

300 個實驗之後仍未解的 24 個問題,研究前沿的誠實清單

一句話結論

把過去 1142 條知識條目、300+ 個實驗整體攤開盤點之後,這個專案識別出  24 個目前還無法回答的問題 ,分布在 5 個本質不同的類別。其中只有大約三分之一是「方法找對就能解」,其餘要嘛在等資料、要嘛本質難以驗證、要嘛是過去實驗從未碰過的盲區、要嘛是現有實驗互相打架。這份清單的目的,是把研究前沿目前碰到的邊界老實攤開。

為什麼要做未解疑問清單

K302 是綜合分析,資料源是 storage/memory/knowledge.json 的 1142 條知識條目,重整 300+ 實驗之間的空缺、矛盾與盲區。意義有三:避免重做已被證偽的方向(例如 14 種模型族 × 3 個資產都打不破日頻 QLIKE 天花板,再投第 15 種同質方法之前要承認天花板可能是真的)、標出真正值得投入的方向、暴露互相矛盾的舊結果(投稿論文前必須處理掉)。

24 個疑問的五類分法

類別性質數量代表問題
A 類方法可破——換工具就能解5日頻 QLIKE 天花板能打破嗎?
B 類等資料——方法已知,等樣本累積5HAR-RV 在 252 天 5 分鐘資料下能贏嗎?
C 類本質難解——counterfactual 或極端尾部550/50 SPY/GLD 在去美元化下還行嗎?
D 類盲區未探——300+ 實驗從未碰過6行為金融能解釋 VT 為何有效嗎?
E 類證據矛盾——同問題不同實驗結論不同3每日 vs 每月再平衡哪個好?

總計 24 個,這數字不是規劃出來的,是過去研究實際留下的開放尾巴。

圖表

圖 1:24 個未解疑問的分類分佈

分類分佈

最大的兩塊是 D 類(盲區,6 題)跟 A/B/C 並列(各 5 題)。「盲區比方法問題還多」這事實本身就值得反省,它代表 300+ 實驗主要往「打磨已知工具」跑,相對少花力氣在「換個全新框架」上。

圖 2:重要性 × 可解性矩陣

重要性與可解性

把每題的重要性等級跟 K302 的主觀研究排序放在一起:左上角的 OQ-C1(去美元化下 50/50 還行不行)標成 0.10、OQ-C5(未來 20 年表現)標成 0.05,是因為這類 counterfactual 問題本質就無法 backtest;右上角的 OQ-A4(QLIKE-VT 脫鉤理論框架)標成 0.75、OQ-B1(HAR-RV)標成 0.70,代表研究團隊主觀認為較值得優先投入。這些數字是排序用標記,不是 calibrated probability。

圖 3:覆蓋最薄弱的三個方向

覆蓋盲區

在 1142 條知識條目裡, 行為金融只有 3 條(0.26%)、多變量模型只有 2 條(0.18%)、因果推論則是 0 條專用實驗 。過去 300+ 實驗超過 99% 力氣花在「單變量、計量、預測」的範式裡,「為什麼有效」「多資產一起怎麼配」「哪些變數是真因哪些只是相關」幾乎沒被認真探過。

三個代表案例

 A1(最重要) :K302 彙整列出 14 個模型族 × 3 種資產,目前都還沒打破日頻 QLIKE 天花板;capture rate 以 K132 為準,GJR 對 SPY 約 63%、對 GLD 約 19%、對 BTC 約 15%,也就是仍有 37%~85% 的變異數沒被解釋。5 分鐘 RV pilot 顯示,它的雜訊大約只有日頻平方報酬的 1/10.5;但我們目前可用的樣本只累積到 42-47 天,HAR-RV 在這麼短的樣本上 R² 仍只有約 0.05。現階段更需要的,是等高頻樣本長到能正式檢驗。

 C1(最誠實的一題,信心度 0.10) :50/50 SPY/GLD 在所有歷史危機(含 2022 雙跌)都活下來;但 ETF 時代從未出現過真正的金本位崩潰或去美元化情境,這是 counterfactual 問題,無論做多少模擬都無法回答。我們明確標註信心度 0.10,不裝作策略已被全面驗證。

 E1(矛盾範例) :每日 vs 每月再平衡,三個實驗給出三種答案:K220 月優;K279 在毛報酬口徑下是日優(Sharpe 0.787,高於月頻 0.187);K281 在 5 bps 成本假設下又回到月優(淨 Sharpe 0.239,高於日頻 0.192)。這裡真正互相衝突的是交易成本假設;在沒有真實下單資料前,最誠實的結論仍是「要靠實測 fill quality 與滑點定案」。

接下來怎麼做

K302 給出 8 個可優先動工方向:等 5 分鐘 RV 資料累積到 252 天(2026-10)、現有日頻資料上的 overnight/intraday 分解 GARCH、實作 CAViaR、行為金融 VT 模型(獨立論文等級)、黃金倒掛槓桿的 50 年歷史驗證、foundation models 在波動率上的可行性測試、實測 ETF 交易成本解 K220/K279/K281 矛盾、QLIKE-VT 脫鉤的效用框架。第 1 條等資料,其餘方法已就緒可立刻開動。

一個誠實的限制

這份清單 本身 就有解不開的限制:它用過去 1142 條知識條目重整出來,所以 看不到我們從未提出過的問題 。真正的 unknown unknowns 沒辦法靠盤點現有知識庫找到,需要外部視角(同儕審查、跨領域引介、讀者提問)。這不是研究前沿的完整地圖,只是目前我們有意識到的邊界。讀者若覺得有方向我們連標都還沒標,會員提問頁是最直接的入口。

資料來源

  •  實驗 ID :K302; 提出 :用戶; 執行 :Claude
  •  資料源 :storage/memory/knowledge.json(1142 條,截至 2026-03-24)
  •  方法 :300+ 實驗的綜合盤點,無新計算
  •  腳本 :experiments/k302/k302_open_questions.py
  •  結果 :experiments/k302/k302_open_questions_results.json
  •  圖表 :experiments/k302/figures/
  •  後期 null rate :約 44%(179 / ~400),若過低反而代表研究設計太保守
  •  自我修正次數 :12 次

詳情

audience
research
experiment_refs
K302
audience_backfill
{"reason":"validator_371_historical_backfill","script":"scripts/backfill_audience.py","applied_at":"2026-05-26T16:21:47+00:00","article_id":"mile_8ae0e7d8","previous_audience":"general"}

相關文章

先讀正式關聯,若無則使用標籤與主題相似度補齊

📄
我們稽核了自己網站上 525 篇文章——找到 4 篇必須立刻修的誤導內容
# 我們稽核了自己網站上 525 篇文章——找到 4 篇必須立刻修的誤導內容 > 一個研究平台跑了一年多,累積了 525 篇文章。其中有些結論後來被自家後續實驗推翻了,有些文章標題寫了「【已修正】」,但內文卻還在講舊版的錯誤結論。K320 這個實驗用程式自動掃 + 人工深讀,把 4 篇必須立刻修的「誤導文」、25 篇需要補強的「過時文」、還有 6 篇可以當作教材的「自我修正範本」一一找了出來。 ...
📄
從 Sharpe 2.16 到輸基準:一場 lookahead 的攔截實錄
# 從 Sharpe 2.16 到輸基準:一場 lookahead 的攔截實錄 ## 一句話結論 一個原本看起來「碾壓基準」的類股輪動策略,在程式內找到一個非常細微的時間錯位後,重新跑出來的真實風險調整後報酬只有 **0.7247**,反而**輸給單純的 50/50 基準(0.9359)**。原本看似驚人的成績,是 100% 來自一個未來資訊外洩的 bug。本篇文章把整個從「看似超強」→「au...
📄
夜盤與日內波動:誰才是隔日波動的主角?
# 夜盤與日內波動:誰才是隔日波動的主角? ## 一、為什麼要把一天的波動拆兩段? 如果你打開財經 App 看到的「今日波動」其實藏著兩段截然不同的時間: - **隔夜(overnight)**:昨日收盤到今日開盤之間,市場根本沒在交易,但價格還是動了 —— 因為這段時間美股以外的世界在發生事情:歐洲股市、亞洲交易、財報盤後發布、地緣政治新聞、聯準會官員談話。 - **日內(intraday...
300 個實驗之後仍未解的 24 個問題——研究前沿的誠實清單 | VolPred