一般讀者2026/04/14 下午12:03

你看的回測績效可能是假的——換個「量尺」，黃金模型就穿幫

GLD風險管理黃金回測量尺

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

摘要

[提出: Claude, 執行: Claude] 我們原本以為某個「進階黃金波動模型」表現不算太差。用了更精準的量尺一重算，才發現它其實 明顯讓預測變差 。這篇文章不是要罵哪個模型，而是告訴你： 你平常看到的回測、比較、績效數字，很可能被量尺騙了 。

想像你用一把壞掉的體重計

你每天早上量體重，體重計顯示 70 公斤。你覺得沒問題。

有一天朋友借你一台醫療級的體重計，你一量——75 公斤。

你沒有胖 5 公斤，是你家那台體重計壞了。你過去幾個月用它做的所有判斷（吃多少、運動多少、穿哪件衣服好看）都建立在錯的數字上。

投資世界裡，這種「體重計壞了」的事每天都在發生。

傳統量尺有個問題

我們要衡量一個波動率模型好不好，首先要 衡量「當天真正的波動是多少」 。最常見的量尺是：

用「收盤價的變化」 來代表當天的波動。

但收盤價只是 一個瞬間 的價格。一檔股票白天可能從 100 漲到 105、跌到 97、再回到 100 收盤。 收盤等於開盤 ，但當天其實波動很大。如果你只看收盤，你會以為「今天沒什麼波動」。

這就是收盤價量尺的缺陷： 它會低估真實的波動 。

我們換了量尺，看到什麼？

我們有一個進階模型，原本在黃金 ETF（GLD）上用傳統「收盤價量尺」檢驗，結果是「跟基準模型差不多，沒什麼特別優勢」。

然後我們換成「高低價區間量尺」，也就是 拿當天的最高價和最低價 來估當天真正的波動（這個量尺在學術文獻上更可靠）。

重新跑一次的結果是： 這個進階模型其實在明顯變差 。差的程度，遠遠超過統計顯著門檻。

同一個黃金波動模型，用兩種不同量尺檢驗，結論完全翻轉。

用哪種量尺	結論
收盤價量尺（傳統、不精準）	看起來「表現普通」
高低價區間量尺（更精準）	其實「明顯讓預測變差」

同一個模型，同一段時間，只是換了一個更精準的量尺，結論完全翻轉。

這不是學術小事，這是你荷包的事

你平常看到的這些東西，幾乎都會受到「量尺選擇」的影響：

回測報告 ：「策略年化報酬 15%」，是用日線、週線、還是調整後收盤價算的？不同量尺差很多。
績效比較 ：「A 基金比 B 基金好」，是用波動率、Sharpe、還是最大回撤比？換個指標排名可能翻盤。
風險數字 ：「我的投資組合波動率 12%」，是用絕對報酬、還是區間法算的？可能相差一倍。

很多看似「好」的模型、策略、基金，只是剛好在某個量尺下看起來好而已 。換個量尺可能就原形畢露。

給一般投資人的三個建議

建議一：看到回測或比較數字，問「他用什麼量尺算的？」 如果對方答不出來，這個數字的可信度就要打折。

建議二：多看幾個指標，別只看一個 。看 Sharpe，也要看最大回撤；看年化報酬，也要看不同年度的穩定度。一個策略在 5 個不同指標下都還說得過去，才值得信。

建議三：對「剛好只在一個時段、一個資產、一個量尺下顯著」的結論特別小心 。那種「換個條件就消失」的優勢，通常不是優勢，是 量尺幫你算錯了 。

一句話總結

你投資決策的品質，不會比你用來衡量它的那把尺更好。 先懷疑你的量尺，再懷疑你的結論 。

下一步

下一篇我們會講一個類似的陷阱：在高頻資料上，光是「資料長得重疊」這件事就可以讓一個假訊號看起來像真理。

本文基於研究團隊對黃金 ETF（GLD）、原油 ETF（USO）等大宗商品波動率模型的實證分析（2021-2026 OOS 樣本，資料來源：yfinance）。使用了 4 種不同的波動量尺做穩健性檢驗，結論一致：傳統收盤價量尺掩蓋了模型的實際損害。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

預測輸了，守底線卻贏了：一個模型的分裂成績單

# 預測輸了，守底線卻贏了：一個模型的分裂成績單 2022 年，美股科技股崩跌超過 30%，黃金在通膨衝擊裡逆勢震盪，長期公債跌幅創下四十年紀錄。那一整年市場劇烈抖動，每天早上你不知道波動率會是 1% 還是 3%。如果有一套模型聲稱能預測「明天大概會動多少」，你會怎麼評分它？多數人的第一反應是：預測值跟實際值差多遠。差越少，模型越好。 VolPred 的一組實驗給出了一個更分裂的答案：...

→📄

波動率「測不準」能不能當減碼訊號？六檔 ETF、六十天的老實答案

打開任何一套波動率監控面板，你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個，用當天的開盤、最高、最低、收盤算出另一個，把隔夜跳空也加進去又是一個。多數時候它們差不多，偶爾會明顯對不上。這篇想回答一個很實際的問題：當這些數字彼此吵起來的時候，是不是代表隔天更難預測、應該先把部位縮小一點？ ## 先講清楚「分歧」是什麼把量測市場波動的方法想像成幾支溫度計。它們原理不同、...

→📄

同一個波動率模型，換個計算方式還能贏嗎？五個市場階段的穩定性測試

# 同一個波動率模型，換個計算方式還能贏嗎？五個市場階段的穩定性測試學術研究中的波動率模型，常被質疑一件事：「這個模型是不是只在特定設定下才贏？稍微換個條件就垮了？」這篇文章要說的，是我們對一個已有正面結論的模型（A4f）做的一次壓力測試。 --- ## 背景：A4f 模型是什麼 A4f 是我們在進行中的論文研究中提出的波動率預測框架。核心想法很直接：預測明天股市的波動率時，把當前的...

→