一般讀者2026/06/18 下午05:00

五個不同起點都過關，這個跨市場模型不是剛好猜中一次

波動率跨市場風險管理台股穩健性日本股市

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

五個不同起點都過關，這個跨市場模型不是剛好猜中一次

做量化研究最怕的一種情況，是模型只在某一段時間剛好贏。

前一版 Paper 3 的結果裡，TW0050 和日本 N225 這一組，是跨市場配對裡最強、也最需要做起點敏感度壓力測試的案例。問題也正出在這裡： 如果最亮眼的那一組只在單一起點成立，會不會只是剛好挑到一段對它有利的樣本？

這次做的事很單純，就是把外樣本起點往前往後挪，從 2014、2015、2016、2017、2018 各跑一次，檢查同一個結論會不會一換起點就垮掉。

答案沒有模糊空間： 五個起點全部過關。

2014 起跑：統計值 3.24
2015 起跑：3.89
2016 起跑：3.66
2017 起跑：3.04
2018 起跑：3.09

這五個數字不只都高過 5% 門檻，連 1% 門檻也全部跨過。換句話說， 你把起跑線挪了五次，結果都還在同一邊。

HLN-adjusted t-statistics across five alternative OOS starts

更重要的是，這五次不是勉強貼著門檻過。

最弱的一次是 2017 起跑，統計值 3.04，離 5% 臨界值還多出大約 1.08。最強的一次是 2015 起跑，距離門檻更高出 1.93。這代表結果離翻盤還有一段距離。即使挑到最不利的那個起點，還是留有安全空間。

Distance from each OOS-start t-statistic to the 5% cutoff

這件事對一般讀者真正有用的地方，在於一個更基本的判斷標準：

一個研究結果如果只在單一樣本起點成立，你要先懷疑；如果換了五個起點還成立，可信度就高很多。

當然，這也不代表可以把它講成「已經被證明五次」。這五個外樣本區間彼此有重疊，所以它比較像 同一個發現的五次壓力測試 ，不是五個完全獨立的新實驗。比較精確的說法是：這個優勢對外樣本起點的選擇， 目前看起來相當穩 。

所以，這次最值得記住的地方是：

它不是只在一個剛好的起點贏。

這對 Paper 3 很重要，因為這一組是主要顯著案例中最醒目的一個；最容易被挑戰的地方，就是「會不會只是樣本起點運氣」。現在至少在起點敏感度這一關，這個質疑沒有被數據支持。

本文基於實驗 K1416（腳本：experiments/k1416/k1416.py，結果：experiments/k1416/k1416_results.json），並引用前一步敏感度實驗 K1412。資料來源：TW0050 與 N225 跨市場配對之外樣本比較；基準外樣本起點 2015-06-01，另檢查 2014/2016/2017/2018 四個替代起點；基準有效樣本約 2,067 個交易日。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

波動率「測不準」能不能當減碼訊號？六檔 ETF、六十天的老實答案

打開任何一套波動率監控面板，你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個，用當天的開盤、最高、最低、收盤算出另一個，把隔夜跳空也加進去又是一個。多數時候它們差不多，偶爾會明顯對不上。這篇想回答一個很實際的問題：當這些數字彼此吵起來的時候，是不是代表隔天更難預測、應該先把部位縮小一點？ ## 先講清楚「分歧」是什麼把量測市場波動的方法想像成幾支溫度計。它們原理不同、...

→📄

創新高然後急殺，網路上那套「短彈可搶、抱一年會死」是真的嗎？我把它丟進 bootstrap

端午連假前後，台股先是創了歷史新高，收假第一天又往上衝，然後連著幾天往下倒。群組裡的情緒從「這次不一樣」變成「我是不是賣在地板」。差不多同時，網路上開始流傳一個聽起來很有道理的說法：把 1999 年到現在的大盤翻出來，只挑一種情況，指數剛創一年新高，三四天內就急殺，最近三天的跌幅排進過去一年最慘的前 2%。據說這種情況歷史上出現過 10 次，急殺後三個月有 88% 收紅、中位數 +4.7%；但...

→📄

預測輸了，守底線卻贏了：一個模型的分裂成績單

# 預測輸了，守底線卻贏了：一個模型的分裂成績單 2022 年，美股科技股崩跌超過 30%，黃金在通膨衝擊裡逆勢震盪，長期公債跌幅創下四十年紀錄。那一整年市場劇烈抖動，每天早上你不知道波動率會是 1% 還是 3%。如果有一套模型聲稱能預測「明天大概會動多少」，你會怎麼評分它？多數人的第一反應是：預測值跟實際值差多遠。差越少，模型越好。 VolPred 的一組實驗給出了一個更分裂的答案：...

→

讀者互動

五個不同起點都過關，這個跨市場模型不是剛好猜中一次

相關文章