AI研究

エナクティブAI：身体性を持つ人工知能の実装と評価の最前線

2025.11.10

エナクティブAIとは何か：従来のAIとの違い

人工知能（AI）研究の主流は長らく、脳内の情報処理や記号操作に焦点を当ててきました。しかし近年、エナクティブAIという新しいアプローチが注目を集めています。エナクティブAIは、認知を単なる脳内の計算ではなく、身体と環境との相互作用から生まれる動的なプロセスとして捉えます。

エナクティブ認知科学の核心は、センサリモーター・ループ（感覚-運動の循環）にあります。人間が手で物に触れたり行動したりする経験を通じて得る豊かな意味付けは、テキスト情報だけでは決して生まれません。この身体性（embodiment）と具体的行動、環境とのインタラクションが認知の成立に不可欠であるという立場が、エナクティブ認知科学の基盤となっています。

本記事では、このエナクティブAIアプローチに基づく具体的な実装例と、それらのシステムを評価するための手法について詳しく解説します。

センサリモーター習慣の自己組織化：行動パターンの創発

イテラティブ可変構造センサリモーター媒質の仕組み

エナクティブAIの代表的な実装として、センサリモーター習慣の自己組織化を示すシミュレーション実験があります。この研究では、簡易な移動ロボットを模したエージェントにイテラティブ可変構造センサリモーター媒質と呼ばれる制御モデルを適用しました。

このモデルの特徴は、エージェントが環境からの感覚刺激と自身の運動とのループを繰り返す中で、自律的・反復的な行動パターンが自発的に形成される点にあります。例えば、視覚センサを持つ場合と聴覚センサを持つ場合では、それぞれのセンサリモーター様式に適した異なる習慣が現れます。

再帰的ニューラルネットワークによる習慣の刻印

実装には、物理シミュレータ上でオイラー法による時間発展を用いて環境とロボットのダイナミクスを計算し、エージェントのセンサ・モータの状態遷移をリアルタイムに更新する手法が使われています。制御モデルは再帰的なニューラルネットワークに類似した構造を持ち、エージェントのセンサ入力に応じて内部ノード群が生成・消滅・重み変化することで、過去の行動パターンを内部に刻み込んでいきます。

この結果、エージェント内部によく訪れるセンサリモーター状態が強化されて残存し、それが習慣的な行動パターンとして外部から観察できる形で現れます。このような自己維持的な行動パターンの生成は、問題解決志向ではなくエージェント自身の生存や安定の創出と対処に焦点を当てた知能のモデル化となっています。

iCubプロジェクト：ヒューマノイドロボットによる発達的認知システム

オープンソースの子ども型ロボットプラットフォーム

人型ロボット上でのエナクティブAIアプローチとして代表的なのが、iCubプロジェクトです。iCubは3歳児程度の大きさ（身長約94cm）で53自由度を持つ子ども型ロボットで、這う・座るなどの動作や、手先の器用な操作、頭部と眼球の独立した運動が可能です。

視覚（カラーカメラ）、前庭感覚、聴覚、触覚といった多彩なセンサーを備え、人間の幼児に近い身体仕様を持つことで発達的認知システムの研究プラットフォームとなるよう設計されています。イタリア技術研究所(IIT)やジェノバ大学などを中心に進められたこのプロジェクトは、エナクティブ人工認知システムの共同研究基盤としてロボットのハード・ソフト両面を公開しました。

YARPミドルウェアによる分散処理アーキテクチャ

ソフトウェア面では、iCubは**YARP（Yet Another Robot Platform）**というミドルウェアを採用しています。YARP上で各モジュール（視覚処理、運動制御、学習アルゴリズムなど）がプロセスとして動作し、ネットワーク越しにセンサデータやコマンドをストリーム通信することでリアルタイムに統合動作します。

このオープンなプラットフォームにより、世界中の研究者がエナクティブ認知アーキテクチャをiCub上に実装・改良しやすくなっています。実際に人間の乳幼児の発達過程を模したシナリオでの実験、例えば新生児期に相当する原初的な能力からスタートし学習でスキルを拡張していく試みが提案されています。

発達認知アーキテクチャの段階的能力伸長

iCub上では、様々な認知アーキテクチャが試みられています。その一つがエナクティブな発達認知アーキテクチャで、人間の乳児の認知発達理論やデザイン原則に基づき段階的に能力を伸長させる構成です。

生得的な原始能力（phylogeny）として簡単な模倣や興味シグナルの生成を備え、発達過程（ontogeny）では探索行動や社会的相互作用を通じて新たなスキルを自己組織化的に獲得するという枠組みが検討されています。この認知アーキテクチャは、MaturanaとVarelaのオートポイエーシス（自己生成システム）の概念図をヒントに、センサモーターループと内部状態の円環構造として表現されている点も特徴的です。

Zürich大学のPfeiferのグループや、Plymouth大学のCangelosiのグループなど、多くの著名な研究者が参画し、身体性と発達に根ざした知能モデルの実証が行われています。例えば、ロボットによる数概念や言語の獲得実験、身体の物理特性を利用した学習の研究などが進められています。

社会的相互作用による発達的学習：ターンテーキング行動の獲得

人間との遊びを通じた行動パターンの学習

エナクティブAIでは、社会環境との相互作用も認知発現の重要な要素と考えます。その実装例として、ヒューマノイドロボットが人間とのインタラクション遊びを通じてターンテーキング（順番交替）の技能を自発的に学習する研究があります。

Brozらの研究では、iCubロボットを用いて幼児と保護者の遊びのような状況を再現し、ロボットが人間と「いないいないばあ」や簡単な太鼓の叩き合いといったゲームを行う中で、順番を守る対話的な行動パターンを習得するか検証しました。

エナクティブ・アーキテクチャに基づく行動学習システム

ロボットにはエナクティブ・アーキテクチャに基づく行動学習システムが搭載されており、相互作用の履歴（インタラクション履歴）と短期記憶モジュールを用いて、人間から得たフィードバックに応じた行動系列の強化学習を行います。

具体的には、ロボットがある行動を取った際に人間が視線を向けたり共同行為をしてくれたりするとポジティブな社会的報酬とみなし、その行動選択の傾向を強めます。このような社会的強化学習により、ロボットは人間パートナーとの間で複数のターンテーキング行動を獲得し、適宜切り替えられるようになりました。

短期記憶導入による長期的やりとりの安定化

短期記憶を導入したモデルでは、直近の相互作用履歴を踏まえて行動選択するため、即時の反応だけに頼る場合よりも長い一連のやりとり（例えば太鼓を何度も交互に叩くなど）が安定して学習できることが示されています。

このシステムの実装には、ロボット行動制御モジュールとインタラクション履歴を管理する学習アルゴリズムが組み合わされています。制御モジュールはiCubの標準ソフトウェアフレームワーク上に構築され、YARPミドルウェア経由でセンサデータ（人間の顔の方向や音声入力など）とモータ指令（身振りや音を出す動作など）をやりとりします。

実験では、人間側が視線やジェスチャーでロボットに興味を示す（報酬）/示さない（罰）をコントロールしつつ、ロボットが試行錯誤で適切な順番交替パターンを身につける様子を評価しました。この研究は、身体を持ったロボットが社会的相互作用を通じてスキルを発達させるというエナクティブAIの考え方を具体的に実証したものです。

内部ホームオスタシスによる適応的エージェント：進化ロボティクスの応用

オートポイエーシス概念のAIエージェントへの適用

Francisco Varelaの思想を受け継ぐ系譜では、オートポイエーシス（自己生成的な生存維持）の概念をAIエージェントに取り入れる試みもあります。その代表例として、Ezequiel Di Paoloによる内部状態のホームオスタシス維持に基づく適応ロボットの研究が挙げられます。

Di Paoloは、生物が自らの生存に必須な内部変数（Ashbyの提唱した「重要変数」）を一定範囲に保つために環境へ働きかけを変化させるというモデルをロボットに適用しました。具体的には、車輪型ロボットのセンサ入力とモータ出力を制御する連続時間再帰型ニューラルネットワーク（CTRNN）に可塑性を持たせ、ロボットの内部変数が危機的閾値に達しそうになるとネットワークの結線や重みを組み替えて行動方針を再組織化するようなメカニズムを組み込んでいます。

遺伝的アルゴリズムによる適応能力の進化

このロボットを遺伝的アルゴリズムで進化させ、光に向かって移動する「フォトタクシス」の能力と、センサ入力を左右逆転されるようなセンサモーター攪乱に対する適応能力の両立を目指しました。

進化の結果、ロボット群の多くは通常環境下で光に向かう能力を身につけただけでなく、センサ刺激が突然反転する異常事態でも内部の可塑性制御を働かせて行動を再調整し、生存に必要な光源への接近行動を持続できる個体が現れました。

存続性を中心に据えた適応の視点

この実験は、エージェント自身の「存続性（viability）」を中心に据えた適応というエナクティブな視点を端的に示しています。すなわち、行動が環境から与えられた課題を解くのではなく、エージェントが自らの存続のために環境との関わり方を変容させることが知能の本質だという考え方です。

実際、本研究ではシステムの存続性を適応の価値基準とみなし、ロボットの行動がその内部状態の安定維持に貢献しているかどうかで「適応的」と評価しています。

技術的には、Di Paoloのロボット実験は進化的アルゴリズムと動的ニューロン回路という手法で実装されました。ロボットの脳に相当するCTRNNのパラメータ（結合重みや閾値、可塑性ルールなど）を遺伝子と見立ててエンコードし、多数の個体を並行シミュレーションして世代交替を行いながら最適化しています。

評価関数（適応度）には、光源への接近度合いと内部状態が安定範囲に留まった時間などが組み合わされ、これらを高めるような個体が選択されるよう設計されています。こうした進化ロボティクスのアプローチは、PfeiferやNolfi、Harveyらによって1990年代から盛んに研究され、エージェントの行動原理を人為的にプログラムするのではなく進化・自己組織化に委ねる点が、エナクティブな人工知能観に合致すると言えます。

エナクティブAIシステムの評価手法

観察に基づく質的分析

エナクティブAIに基づくエージェントやロボットの知能・行動を評価するには、従来の性能評価と異なる観点が求められます。まず重要なのが、観察に基づく質的分析です。

エージェントの振る舞いを人間の観察者が分析し、どのような行動パターンや習慣が現れているかを評価します。例えばセンサリモーター習慣のシミュレーションでは、研究者がセンサ・モータの時系列データを可視化し、繰り返し出現するパターンを手動で同定・ラベル付けして分類しました。

このような観察的手法により、エージェントの行動の一貫性や質的特徴（例：「特定の習慣が成立している」「行動に自己維持的なループがある」など）を評価します。

自己組織化の定量指標

エージェント内部やセンサ-環境間の情報構造を数値化し、自己組織化や適応度合いを客観的に測る指標を用います。例として、センサとモータ間の相互情報量（Mutual Information）を計算してロボットがどれだけセンサリモーター連携を構造化できているかを評価する方法があります。

また、エントロピーや多様性指標を用いて行動パターンの豊富さ・安定性を測定したり、ネットワークの自己相似構造や同期現象を解析して自律的なパターン形成の程度を評価する研究も報告されています。

Fabio Bonsignorioの研究では、エージェントの自己組織化プロセスを定量モデル化する枠組みが提案されており、こうした情報理論指標の活用で自律的な秩序形成を評価・比較できる可能性が示唆されています。

発達的な軌跡の評価

エージェントが時間とともにどのように行動や能力を発達させていくかを評価します。これは人間の発達になぞらえ、発達段階ごとの振る舞いの変化やスキルの漸進的な複雑化を追跡するものです。

例えば、幼児の発達段階を参照してロボットの学習過程を評価する場合、「原始的な探索行動」から「模倣を伴う社会的行動」への移行が見られるか、その移行に要する学習時間や条件はどうか、といった点を分析します。

実際、iCubプロジェクトでは新生児から幼児への発達シナリオになぞらえて認知機能を段階的に付与し、その結果生じる行動変化を評価するというアプローチが取られています。発達ロボティクスの研究では、発達軌道を定量化するために、学習曲線（タスク成功率や報酬の時間推移）や、各発達段階での行動レパートリーの大きさ・多様性を測定することもあります。

タスク達成度と適応性の指標

エージェントが与えられた環境でどの程度目的を達成したか、環境変化にどれほど適応できたかを測る従来型の定量評価も併用されます。例えば進化ロボティクスの例では、ロボットが光源に近づくという目的に対し最終距離の短さや到達までの時間を評価しました。

さらにセンサ遮断など環境が変化した際に行動を維持できるかで適応性を評価しています。ターンテーキングの実験では、所定のゲームを習得できたか否かを成功・失敗で記録し、成功率（％）や平均習得時間を条件間で比較しています。

統計的検定（Fisherの直接確率検定やランダム化検定など）によって、異なるモデル間（短期記憶あり vs なし等）の学習成功率の差が有意かどうかも検証されました。このように定性的な観察と定量的な指標の双方から、多面的にエナクティブAIシステムの性能や特性が評価されています。

まとめ：エナクティブAIの現在と今後の展望

身体性AIにおけるエナクティブ・アプローチの研究では、センサリモーター循環を核としたアーキテクチャが実装され、多様なプラットフォーム（シミュレータ、実ロボット、進化アルゴリズム、強化学習環境など）上で試行されています。

これらのシステムは、従来型AIとは異なる自律性や適応性を示す一方、その評価には新たな手法が必要となります。観察に基づく質的分析から情報理論的指標、発達的プロセスの分析まで、エージェントを全体的なシステムとして捉える評価が模索されています。

VarelaやDi Paoloが提唱した「生命における認知」の視点は、PfeiferやCangelosiらのロボット実装を経て具体化されつつあり、近年ではEgbertやBarandiaranによる習慣のモデル化やBonsignorioによる定量評価枠組みの提案など、最新の研究も登場しています。

エナクティブAIは、身体を持つ人工エージェントが環境との相互作用を通じて自らの世界を立ち上げていくという魅力的なビジョンを提示しており、その実現に向けた具体的実装例と評価手法が着実に蓄積されてきています。今後、より複雑な環境での適応や、複数エージェント間の相互作用、さらには人間社会への統合といった課題に取り組むことで、エナクティブAIの可能性はさらに広がっていくでしょう。

汎心論と量子論の融合：田坂広志とボームが示す意識と物質の統合モデル

量子エンタングルメントが拓く知識表現の未来：AI・認知科学への革新的応用