一般讀者2026/06/15 下午06:10

台海風險當然重要，但沒有這一欄資料，我們不能假裝自己量得到

台灣市場0050研究誠實美元台幣地緣政治風險

讀者互動

已追蹤瀏覽 0 次，登入會員可按讚與收藏。

分享到：LINE Facebook X / Twitter

台海風險當然重要，但沒有這一欄資料，我們不能假裝自己量得到

很多人直覺上都會同意一句話：台海緊張升溫，台股和台幣的波動應該會先反應。

這個直覺不奇怪。真正麻煩的地方在下一步。

如果你想把這句話變成一個可以驗證的研究命題，你需要的不只是幾段新聞截圖，也不只是事後回頭看 2022 年 8 月或 2024 年 1 月的盤勢。你需要一條可以被對齊、可以被 lag、可以明確知道「當時市場看不看得到」的風險序列。

K1481 沒有直接跑回歸。它先把一個更基本的問題擺到前面：

在目前這個 repo 裡，我們到底有沒有資格誠實地研究「台海風險能不能預測台股波動」？

答案是： 還沒有。

我們手上其實已經有兩塊重要資料

第一塊是市場價格。

K1481 已具備的市場資料

本地資料裡已經有：

0050.TW 歷史價格，從 2009-01-02 到 2026-03-17，共 4,208 筆交易日
USD/TWD 歷史價格，從 2004-03-24 到 2026-03-17，共 5,288 筆交易日

這代表兩件事已經能做：

算 0050.TW 的 realized volatility
算 USD/TWD 的波動，外加 2022 年 8 月與 2024 年 1 月這兩個事件窗的描述統計

換句話說， 因變數不是問題 。如果今天只是要看「那兩次事件之後，市場有沒有比較震」，repo 內部資料其實撐得住。

缺的不是圖，是那條核心自變數

K1481 研究 gate 狀態

卡住的地方有兩個，而且都不能假裝沒看到：

沒有 canonical 的 Taiwan country-GPR 月頻序列
沒有這條序列對應的 publication_date

這兩個欄位一缺，很多看起來像研究的東西其實都不合法。

最常見的偷跑方式是這樣：

先在事後整理好的月資料裡看到某個月份台灣地緣政治風險很高
再回頭拿同一個月份的 0050 或 USD/TWD 波動來配
然後寫一句「地緣政治風險可以解釋同月市場波動」

問題是，如果那條風險指標其實是月底才整理完，甚至是次月才發布，你就等於用市場當時看不到的資訊去解釋市場當時的反應。這不是小瑕疵，這是標準的 lookahead bias。

這篇研究最重要的結論，其實是一個停手

很多人看到「BLOCKED_ON_DATA」會覺得這是沒有做完。

我反而會說，這正是 K1481 有價值的地方。

因為它把一個很容易被硬寫成內容、很容易被硬湊成回歸、很容易在社群上講得頭頭是道的題目，先踩了煞車。

K1481 的誠實版本是：

我們已經有台灣市場的價格資料
我們也知道兩個很自然的事件窗
但我們沒有一條能代表「台灣 country-GPR」且帶有發布時點的標準化序列

所以目前最多只能說：

這題值得做，但現在不能算完成。

這種結論聽起來不熱血，可是它比一篇充滿回歸表、實際上 timing 不合法的文章有用得多。

為什麼不能直接拿別的 GPR proxy 先頂著用

repo 裡不是完全沒有 GPR 相關研究。K1481 明確回顧了兩個既有經驗：

K100：generic geopolitical proxy 對波動率的增量資訊很弱
K446：broad GPR 指數在一般美股波動測試裡也偏弱，甚至有 reversed-causality 的味道

這代表你不能只是把一條「跟地緣政治有關」的 proxy 換個標題，然後說它現在就代表台海風險。

如果這題要成立，重點不是「找得到任何 geopolitics 指標」，而是 找得到真正台灣特定、而且發布時點清楚的風險衡量 。

下一步很無聊，但這才是研究真正的起點

要把這個題目從「不能做」推進到「可以做」，至少要先有一份像下面這樣的檔案：

taiwan_country_gpr_monthly.csv

欄位至少要有：

period
country
gpr_value
source_url
publication_date

有了它之後，後面的月頻回歸才有意義：

GPR_t 到底能不能預測 t+1 的 0050.TW 波動
USD/TWD 的波動有沒有同步訊號
2022 年 8 月和 2024 年 1 月能不能當成事件窗附錄，而不是拿來替代核心風險序列

少了這一層，任何漂亮故事都只是把直覺講得更大聲，不是把研究做得更嚴謹。

這篇文章真正想提醒的事

市場研究裡最危險的，往往不是模型太差。題目太合理的時候，人會自動忘記先問一句：資料能不能支撐它？

台海風險影響台股波動，這件事可能是真的。

但在 K1481 的狀態下，我們頂多知道它 值得被測 ，還不知道它 已經被證明 。

這兩句話差很多。

資料來源

實驗編號：K1481
腳本：experiments/k1481/k1481.py
結果：experiments/k1481/k1481_results.json
價格資料：storage/macro/yf_0050.TW.csv、storage/macro/yf_TWDX.csv
樣本期間：0050.TW 為 2009-01-02 至 2026-03-17；USD/TWD 為 2004-03-24 至 2026-03-17
樣本數：0050.TW 4,208 筆交易日；USD/TWD 5,288 筆交易日

本文基於實驗 K1481（腳本：experiments/k1481/k1481.py，結果：experiments/k1481/k1481_results.json）。數據來源：yfinance 本地快取 0050.TW 與 TWDX；本文結論為 feasibility audit，不宣稱已完成台灣 country-GPR 對波動率的正式預測檢定。

先讀正式關聯，若無則使用標籤與主題相似度補齊

📄

波動率「測不準」能不能當減碼訊號？六檔 ETF、六十天的老實答案

打開任何一套波動率監控面板，你會發現同一天的「市場有多晃」其實不只一個數字。用 5 分鐘資料算出一個，用當天的開盤、最高、最低、收盤算出另一個，把隔夜跳空也加進去又是一個。多數時候它們差不多，偶爾會明顯對不上。這篇想回答一個很實際的問題：當這些數字彼此吵起來的時候，是不是代表隔天更難預測、應該先把部位縮小一點？ ## 先講清楚「分歧」是什麼把量測市場波動的方法想像成幾支溫度計。它們原理不同、...

→📄

把五分鐘資料切得更細，預測真的會更準嗎？台指期給了一個保守答案

做波動率預測時，很容易想把資料切得更細。一天一筆收盤價太粗，那就看每五分鐘一筆；只看總波動太粗，那就再拆成上漲、下跌、跳動、估計噪音。直覺上，資料越細，模型應該越聰明。這次台指期日盤實測給的答案比較冷靜：細資料有幫助，但幫助還不夠硬。 VolPred 把台指期日盤的五分鐘資料整理成每日波動，期間從 2017-05-16 到 2026-06-29，共 2219 個原始交易日。正式可判斷的樣本外...

→📄

你花錢升級了預測模型，對帳單卻更難看：一個關於「準」與「賺」的實測

# 你花錢升級了預測模型，對帳單卻更難看：一個關於「準」與「賺」的實測假設你在用一支波動率預測模型幫股票倉位做動態調整。有天你發現一個新版本，統計上證明得明明白白：它比舊版本準，預測誤差檢定的 t 值高達 4.48，遠遠超過學界公認的顯著門檻。你把它換上線，跑了 13 年的歷史資料回測。結果對帳單攤開一看，扣掉手續費之後，新模型的 Sharpe 值反而比舊的、簡陋到不能再簡陋的規則還低。這...

→