予測符号化が注目される理由
私たちの脳は、外界の情報をただ受け取るだけの装置ではない。むしろ「次に何が起こるか」を絶えず予測し、その予測と実際の入力とのズレ——予測誤差——を手がかりに内部モデルを更新し続けている。この考え方を体系化したのが**予測符号化(Predictive Coding)**である。
Rao & Ballard(1999)が視覚皮質を対象に提唱したこの枠組みは、その後Fristonらの自由エネルギー原理へと拡張され、知覚・注意・学習・行動を統一的に説明する理論候補として広く研究されている。本記事では、理論的基盤から数学的定式化、神経科学的エビデンス、そして批判と今後の課題までを整理する。
予測符号化の理論的基盤と歴史的背景
ヘルムホルツの無意識推論からRao & Ballardへ
予測符号化の源流は、19世紀のヘルムホルツによる「無意識推論」の概念にまで遡る。知覚とは感覚データそのものではなく、脳が構築した仮説であるという発想だ。20世紀にはBarlow(1961)が「効率的符号化」として冗長性削減の原理を提唱し、情報理論的な視点から脳の符号化戦略を論じた。
これらの流れを統合する形で、Rao & Ballard(1999, Nature Neuroscience)は視覚皮質の階層構造に着目したモデルを発表した。高次領域が低次領域へ予測信号をフィードバックとして送り、低次領域は予測と実入力との差分を誤差信号としてフィードフォワードに返す。この双方向の情報循環が予測符号化の基本構造である。
自由エネルギー原理への一般化
Friston(2005, 2010)らはこの枠組みを大幅に拡張し、自由エネルギー原理として定式化した。生物システムは変分自由エネルギーを最小化するように振る舞うという原理であり、予測符号化はその神経実装の一形態として位置づけられる。Friston & Kiebel(2009, Phil Trans B)は階層動的生成モデルの逆問題として脳の推論過程を記述し、一般化座標のもとでの変分ベイズ推論が予測誤差の抑制と等価であることを示した。
Clark(2016)やHohwy(2013)はこうした神経科学的知見を哲学・認知科学と橋渡しする総説を執筆し、社会的認知や精神症状への応用にまで議論を広げている。
数学的定式化:階層ベイズ推論とカルマンフィルタの関係
状態空間モデルによる階層的表現
予測符号化の数学的骨格は、状態空間モデルの階層的拡張である。各レベル i の隠れ状態 x^(i) は上位の原因変数 x^(i+1) に依存し、最下層では感覚入力 y が生成される。動的モデルでは状態方程式と観測方程式を仮定し、プロセスノイズと観測ノイズを含む確率的枠組みで推論を行う。
変分ベイズによる近似では、各階層の認識密度を事後平均 μ(状態推定ユニットの活動に対応)と、精度重み付き誤差 ε(誤差ユニットの活動に対応)の二つの変数で表現する。Fristonらはラプラス近似のもとで変分自由エネルギーを最小化する連続時間勾配法を導出し、固定点において予測誤差が抑制される条件を明示した。
線形ガウス系とカルマンフィルタの等価性
理論の見通しがよくなるのは線形ガウス系に限定した場合である。隠れ状態が線形遷移で時間発展するとき、予測符号化の更新則はカルマンフィルタと数学的に同等になる。予測ステップで上位からの予測を生成し、補正ステップでカルマンゲインを用いて観測との誤差を反映する。この対応関係は、予測符号化が最適推論のアルゴリズムとして合理的な基盤を持つことを示している。
変分ベイズの観点では、自由エネルギーは負の対数モデルエビデンスの上界に相当し、その最小化は予測誤差の抑制と同義である。つまり脳が自由エネルギーを下げる営みは、世界の内部モデルを精緻化することにほかならない。
計算モデルの構造:予測ユニットと誤差ユニット
ネットワークアーキテクチャ
予測符号化ネットワークは、各層に状態ユニット(予測を保持)と誤差ユニット(予測と実入力の差分を表現)を配置する。状態ユニットは上位からの信号に基づいて内部状態を更新し、誤差ユニットは現在の予測と観測のズレを精度で重み付けして上位に伝播する。
Friston(2009)の連続時間微分方程式では、状態ユニットの時間変化が予測誤差の受信と自己回帰項で決まり、誤差ユニットの時間変化が予測と観測の残差および精度行列で決まる形式が示されている。精度パラメータは注意や不確実性の調節に対応すると解釈され、注意がゲインコントロールとして予測誤差の影響度を変調するメカニズムを自然に説明する。
学習則と近似計算
モデルの生成重みも誤差に基づく勾配降下で更新できる。Rao & Ballardのモデルでは多層パーセプトロン的な誤差逆伝播と類似の学習が用いられ、Wacongne(2012)のスパイキングネットワークモデルではスパイクタイミング依存可塑性(STDP)による局所的学習則が採用された。近似計算としては拡張カルマンフィルタや粒子フィルタ、変分ベイズ(ラプラス近似)などが状況に応じて使い分けられる。
Millidge et al.(2024)は時間的予測符号化ネットワークを提案し、シンプルな局所計算のみでカルマンフィルタに匹敵する予測性能が達成されることを示した。線形系でのカルマンフィルタとの一致だけでなく、複雑な自然動画像の処理ではGabor型受容野が自動獲得されるなど、生物学的に妥当な特徴抽出が生まれることも報告されている。
神経科学的エビデンス:予測と誤差の信号分離
層別fMRIによる深層・浅層の機能分離
予測符号化が予測する「深層に予測信号、浅層に誤差信号」という対応を直接検証する試みが進んでいる。Kokらは7T fMRIを用いてカニッツァ三角形の錯視を呈示し、錯視として「予測される」部分ではV1深層に活性化増強を、実際の刺激が存在する部位では浅層に抑制を観察した。この結果は予測符号化モデルの層別予測と整合する。
Ekman et al.(2017)はドット運動の予測課題で、V1に予測的な事前活動(前方再生, preplay)が見られることを報告し、時間的予測の神経基盤を示唆した。
聴覚野の予測誤差信号とミスマッチ陰性電位
ミスマッチ陰性電位(MMN)は予測符号化の文脈で最も頻繁に引用される神経指標である。予測された刺激が提示されなかったときに生じる強い陰性電位は、予測誤差信号として解釈される。Wacongne et al.(2012)はスパイキングネットワークでMMNの諸特徴を再現し、STDP学習による予測連鎖の獲得を実証した。
最近のYaron et al.(2025)はラットの一次聴覚野で、予測外の音の省略に反応するニューロン群を同定した。その活動強度が予測の確信度に比例する点は、単純な適応では説明しにくく、予測誤差信号としての解釈を支持する。
リズム変調と階層的信号交換
局所回路レベルでは、予測と誤差の信号がガンマ波やベータ波の変調として分離される報告が増えている。Chao et al.(2018)はサルの聴覚領域で「local-global」違反課題を用い、低次と高次の予測誤差信号がガンマ帯域で異なるパターンを示すことを明らかにした。前頭前野では予測更新に関連するベータ帯域の活動も観測されており、階層的な予測—誤差交換の神経振動的基盤が徐々に見えてきている。
批判と限界:予測符号化はどこまで検証可能か
反証可能性への懸念
Bowers & Davis(2009)らは、予測符号化理論が柔軟すぎるために事後的にどのような実験結果にも適合できてしまう危険性を指摘した。理論が反証不能であれば科学的仮説としての価値が問われる。
Bowman et al.(2023)はより具体的に、「期待された刺激に対して応答が増大する」実験結果が基本的な予測符号化モデルでは説明困難であることを論じた。精度重み付けの強化という拡張仮説で説明可能だが、その場合でも応答の立ち上がり潜時や周波数成分によって仮説間の弁別が可能であると述べている。
生物学的実装の未解明点と代替理論
脳が実際に共分散行列や精度の逆行列を計算しているかどうかは依然として不明であり、計算コストの観点からも疑問が呈されている。反復抑制のように、神経適応だけで説明可能な現象を予測符号化の証拠と見なすべきかも議論が分かれる。
代替理論としては、効率的符号化、Gibsonの直接知覚論、そして予測符号化を包含しつつ行動による誤差低減を強調する能動推論などが挙げられる。能動推論は知覚と行動を同一の自由エネルギー最小化原理で統合する点で、予測符号化の自然な拡張と見なされている。
まとめと今後の展望
予測符号化は、脳が階層的な生成モデルを用いて感覚入力を予測し、その誤差を最小化するという魅力的な統一理論である。数学的にはカルマンフィルタや変分ベイズと接続し、計算モデルとしても局所学習則で複雑な系列予測を実現できることが示されている。神経科学的には、層別fMRIやMMN、リズム変調の研究が理論の予測と整合する結果を蓄積しつつある。
一方で、反証可能性や生物学的妥当性の面では課題が残る。今後は、層別計測技術の高度化、予測と誤差信号を独立に操作可能な実験パラダイムの開発、そして深層学習や強化学習との体系的比較を通じて、予測符号化モデルの具体的予測を厳密に検証していく方向が求められる。
コメント