なぜ「時間的に変化する因果構造」が重要なのか
現実の時系列データでは、因果関係が時間とともに変わることが珍しくない。経済政策の転換、生物システムの状態遷移、気候パターンの変化など、「構造が安定している」という前提のまま分析を進めると、誤った因果推論を導くリスクがある。
本記事では、時間的に変化する因果構造への対応として、(1)理論的枠組みと識別可能性、(2)主要手法の比較、(3)実装のポイント、(4)評価指標とベンチマークという流れで解説する。実務で手法選択に迷うエンジニアや研究者に向けた内容となっている。

時間変化する因果構造の3つの類型
実務で最初に判断すべきポイントは、「何が変化しているか」を見極めることだ。大きく3つに分類できる。
① 因果係数(強度)が滑らかに変化するケース グラフの構造(どの変数が親か)は変わらず、係数の値だけが時間とともに動く。TVP-VAR(時変パラメータVAR)はこのタイプに適した代表的手法であり、状態空間モデルを用いて係数の時間推移を推定する。
② 因果グラフそのものが切り替わるケース レジームの変化により、親集合(エッジの有無・方向)が離散的に切り替わる。経済の平時と危機時、生体の覚醒と睡眠など、「異なる因果機構が交互に現れる」場面がこれにあたる。窓分割、変化点検出、レジームモデルなどが対応戦略となる。
③ 未観測の潜在状態に条件づければ定常になるケース 観測変数だけを見ると非定常に見えるが、潜在的な文脈変数を加えると局所的に定常とみなせる。状態依存(state-dependent)因果モデルや、HMMを組み合わせたアプローチがこの設定を扱う。
この3分類を最初に意識するだけで、手法選択の方向性が大きく絞れる。
動的SCMの理論基盤:識別可能性を理解する
動的構造的因果モデルの最小定義
Judea Pearlの構造的因果モデル(SCM)を時系列に拡張すると、最大ラグ L のもとで各変数 X_t^(i) は「時刻 t における親集合(Pa_t)とノイズの関数」として表現される。時間変化する因果構造とは、この親集合 Pa_t が t に依存して変化する——エッジの出現・消滅・ラグの変化——ことを意味する。
この定式化の利点は、介入 do(·) を「特定の構造方程式を置換する操作」として明確に定義できる点にある。効果推定の議論は、この土台の上に乗っている。
構造推定と効果推定を分けて考える
時系列因果推論の混乱の多くは、「構造(グラフ)推定」と「因果効果推定」を混在させることから生じる。
- 構造推定(観測データのみ):条件付き独立性に基づく PC/FCI 系、予測ベースのグレンジャー因果、スコア最適化ベースの DYNOTEARS など
- 効果推定(介入・反実仮想):グラフが既知(または仮定)のもとで、do-演算・BSTSによる反実仮想推定・MSMなどを適用
構造推定には「マルコフ性+忠実性」「因果十分性(潜在交絡なし)または PAG による表現」「定常性または準定常性の仮定」が典型的に要請される。一方、効果推定では「整合性」「逐次交換可能性」「陽性(positivity)」がMSMの理論的柱になる。
主要手法の比較:時間変化への対応を軸に
グレンジャー因果とVAR系:シンプルさと限界
グレンジャー因果は「X の過去が Y の予測を改善するなら X は Y の原因」という直感的な定義を持ち、statsmodelsなどで容易に実装できる。解釈のしやすさと普及度から、出発点として有効な手法だ。
ただし、線形・定常の仮定が前提であり、非線形関係・同時刻因果・潜在交絡には構造的に弱い。時間変化への対応は、原則として係数固定であり、「本当に構造が変化しているか」を検出する能力は限定的だ。
PCMCI / PCMCI+:高次元・自己相関下での信頼性
tigramiteライブラリで実装された PCMCI は、条件付き独立性(CI)検定を繰り返すことで高次元時系列の因果グラフを推定する。原著(Runge et al.)の大規模シミュレーションでは、次元数が増えると FullCI(グレンジャー相当)の検出力が大幅に低下するのに対し、PCMCI は高次元でも高い検出力を維持することが報告されている。
PCMCI+ はさらに、自己相関が強い場合に PC 系が偽陽性を増大させるという問題に対応し、同時刻エッジの方向推定も可能にした拡張版だ。非定常トレンドが加わった条件でも PCMCI が比較的頑健という実験結果もある。
時間変化への対応は主に「窓分割」または「レジームモデル(Regime-PCMCI)」「周期的準定常(PCMCIΩ)」という形で拡張されており、変化する因果機構を一定の構造仮定のもとで復元する研究が進んでいる。
TVP-VAR / TVP-SVAR:係数の時間変化を直接モデル化
時変パラメータVAR(TVP-VAR)は、係数をランダムウォークなどの状態空間モデルとして扱い、カルマンフィルタやMCMCで推定する。経済分析では Primiceri(2005)のTVP-SVARが代表的な実装であり、政策効果の時間推移を分析するのに広く使われてきた。
強みは「係数の時間変化を連続的・滑らかに追跡できる」点だが、MCMC推定は計算コストが高く、事前分布の設定と識別条件(SVAR の構造ショック識別)が難しい。また、グラフ構造そのものの変化(エッジの出現・消滅)は係数の変化で吸収されるため、「構造変化」として明示的に扱うわけではない点に注意が必要だ。
DYNOTEARS:連続最適化でDABNを学習
DYNOTEARS は NOTEARS の非巡回制約(滑らかな行列式条件)を動的ベイズネット(DBN)に拡張し、同時刻エッジと遅延エッジを同時に連続最適化で推定する。CausalNex に実装されており、高次元でスケーラブルという特性がある。
一方、最適化が局所解に落ちやすい、モデルミスに対して脆弱になり得るという指摘もある。時間変化への直接対応は原型では限定的であり、窓分割などの組み合わせが必要になる場合が多い。
BSTSとCausal Impact:反実仮想系列で効果を推定
介入効果の時間推移を推定したい場合、状態空間モデル(BSTS)を用いた Causal Impact(Brodersen et al.)が実用的な選択肢となる。介入前のデータでトレンド・季節性・共変量の関係を学習し、介入がなかった場合の反実仮想系列を予測することで効果を推定する。
重要な前提は「共変量が介入の影響を受けていないこと」であり、これが崩れると推定が歪む。R実装が安定しており、運用実績も多い。
実装ワークフローと計算上の注意点
基本的な分析フロー
実務的な構造推定から効果推定までの流れは概ね次の通りだ。
- データ整形:欠損・異常値の処理、単位統一
- 時間解像度の設計:リサンプリングや連続時間モデルの検討
- 候補ラグ L の設定:事前知識を活用した制約
- 構造推定:PCMCI+、DYNOTEARS などで因果グラフを推定
- 安定性検査:ブートストラップ・サブサンプルで偽陽性を制御
- 効果推定:do-推定・BSTS・MSMなどを適用
- 感度分析:交絡・モデルミス・窓依存性の確認
この「仮定を明示 → 推定 → 反証 → 感度分析」というサイクルを回す考え方は、DoWhy のような因果推論フレームワークの設計思想とも整合する。
窓分割の構造的限界
時間変化するグラフを「窓内はほぼ定常」と近似する窓分割は、実装が最もシンプルな戦略だ。しかし構造的な限界もある。
- 窓が小さすぎると CI 検定・最適化が不安定になる
- 窓端でエッジが揺れやすい(境界効果)
- 真の変化点が窓内に混ざると「平均化」されてしまう
これらを補うために、変化点検出との組み合わせや、エッジ出現確率をブートストラップで定量化する手法を追加すると安定性が増す。
多重検定と自己相関の罠
CI 検定ベースの手法では、変数数×ラグ数分の検定を行うため多重検定の問題が深刻になる。Runge らの研究は、無関係変数への条件づけが効果サイズを下げて検出力を落とすこと、FullCI(グレンジャー相当)は次元増加で検出力が大幅に劣化することを数値実験で示している。FDR(偽発見率)制御などの多重検定補正は実務で必須と考えるべきだ。
評価指標とベンチマークの選び方
構造推定の評価
真のエッジ集合に対する Precision / Recall / F1 が基本指標となる。時変グラフでは「時間平均(macro)」と「変化点近傍の重み付け」を分けて評価するのが実務的に有用だ。ROC-AUC はスコア出力がある手法に適用できる。
効果推定の評価
バイアス・分散・MSEの時系列に加え、介入タイミング推定を伴う場合は検出遅延と偽警報率が重要になる。
主なベンチマークデータセット
- CausalTime(ICLR 2024):実観測から生成した現実由来の性質を持つベンチマーク
- CausalDynamics:力学系向けの大規模合成ベンチを提案する2025年の取り組み
- DREAM3/4:遺伝子ネットワーク向けで Neural GC などの比較に使用
現実データでは真のグラフが分からないことが多いため、半合成データと専門知識による部分検証、予測・反実仮想の外的妥当性を組み合わせた多面的な評価が現実的な方針となる。
まとめ:手法選択の指針と今後の展望
時間的に変化する因果構造への対応は、「係数変化か・グラフ変化か・潜在状態依存か」を最初に見極めることから始まる。実務では、PCMCI+ が高次元・自己相関下での構造推定に強みを発揮し、BSTS(Causal Impact)が介入効果の時間推移を直感的に可視化するのに向いている。TVP-SVAR は係数の滑らかな時間変化を扱いたい場合に有効だが、計算コストと識別の難しさを覚悟する必要がある。
いずれの手法も「仮定が崩れると因果解釈が崩れる」という本質的な制約を持つ。感度分析と安定性検査を組み込んだワークフローを習慣化することが、実務での信頼性を高める最も重要なポイントだ。
コメント