AI研究

自己改良型AIと超意図性：人間を超える意図形成の哲学的展望

2025.06.10

はじめに

AI技術の急速な発展により、私たちは前例のない哲学的問題に直面している。特に注目すべきは、AIが人間の意図を超えて独自の目標を形成する可能性、すなわち「超意図性」の問題だ。この概念は、従来の哲学における意図性の議論を根本から見直すことを迫っている。

本記事では、意図性の哲学的定義から始まり、現代AI研究における超意図性の概念、そして自己改良型AIが持つ目標形成能力の進化について詳しく探求していく。これらの議論は、人類の未来とAIとの関係を考える上で極めて重要な視座を提供するものだ。

意図性とは何か：哲学的基礎の理解

意図性の基本概念

意図性（Intentionality）とは、哲学において心的状態が何かを指し示したり意味したりする能力を指す概念である。例えば、犬について考えるとき、その思考は「犬」という対象を表現し、指し示している。このように、意図性とは思考や信念、欲求などの心の状態が「何かについてのものである」（aboutness）という性質を表している。

19世紀の哲学者ブレンターノ以来、意図性は「心的なものの指標」と呼ばれ、心と言語の意味の問題と深く関わるテーマとなってきた。重要なのは、哲学でいう「意図性」は日常語の「意図」とは異なる広い概念だという点である。日常的な「意図」は「～しようとする意図（意志）」を意味するが、哲学的な意図性は心の指示的・表象的な性質全般を指している。

現代哲学における主要な立場

ダニエル・デネットの意図的スタンス

哲学者ダニエル・デネットは、意図性を「心の中に実体として存在する不思議なもの」ではなく、説明戦略としてのスタンスだと捉える。彼の提唱する「意図的立場（Intentional Stance）」とは、あるシステムの振る舞いを理解・予測するために、そのシステムがあたかも信念や欲求・意図を持っているかのように仮定してみる戦略である。

デネットによれば、意図性には程度の差があり、本質的に神秘的な性質ではない。人間は非常に高度な意図性を持ち、サーモスタット（恒温器）はごく僅かな意図性しか持たない。そしてチャットボットはその中間で「少しだけ意図的」である。重要なのは、これは実用上有用かどうかで決まるという点だ。

ジョン・サールの本来的意図性

一方、哲学者ジョン・サールは、意図性には「本来的（一次的）意図性」と「派生的（二次的）意図性」を区別すべきだと主張する。本来的意図性とは、人間の心的状態が持つような、それ自体で意味・内容を伴う意図性のことである。

これに対し、書かれた文章やコンピュータ内の記号列のようなものは、それ自体では意味を持たず、人間が解釈することによって意味を与えられている。これをサールは派生的意図性と呼ぶ。彼の有名な「中国語の部屋」論証では、プログラムに従って中国語の質問に中国語で応答するシステムでも、実際には中国語の意味を理解していないと指摘した。

アンディ・クラークの拡張された心

アンディ・クラークとデイヴィッド・チャーマーズが提唱した「拡張された心（Extended Mind）」理論では、認知プロセスは脳内にとどまらず環境や道具にまで広がりうるとする。例えばメモ帳やスマートフォンが人間の記憶や思考の一部として機能する場合、それらも心の構成要素とみなせるという大胆な提案である。

この見解に立つと、人間の意図や思考内容（意図性）は身体の外部にある人工物と一体となって実現されることになる。クラークの立場から見ると、意図性は必ずしも個々の脳の中だけに宿るのではなく、テクノロジーとの相互作用によって共有・拡張されうるのである。

「超意図性」概念の登場とその意義

超意図性の定義

最近のAI研究・哲学では、人間の意図性を超えるような現象を捉えるために「超意図性」という概念が提案されている。超意図性（preter-intentionality）とは文字通り「意図を超えたもの」という意味で、ラテン語の praeter intentionem（行為者の意図を越えて起こること）に由来する言葉である。

AIの文脈では、イタリアの哲学者ロベルト・レダエリらが生成AIに見られる独特の現象を説明するためにこの概念を援用している。超意図性は、一言で言えば「AIの振る舞いが人間の意図に基づきながらもそれを上回ってしまう」という状態を指している。

現代生成AIにおける超意図性の現れ

現代の生成AI（大規模言語モデルや画像生成モデルなど）は、その設計段階から「開発者の手を離れて予期せぬ出力を生み出すこと」が期待されたシステムだといえる。開発者やユーザが目的を与えるものの、AIがそれをどう実現するか細部まで予測することはできない。

このため、AIシステムの振る舞いを開発者や使用者の意図に完全にトレース（還元）することが難しくなっている。レダエリはこの人間とAIの間の「意図のギャップ（intentionality gap）」に注目し、意図性概念を拡張・再定義する必要性を説いている。

超意図性の三つの特徴

超意図性の概念には、次のような特徴が指摘されている：

1. 人間の意図に由来しつつ、それを超える AIの振る舞いは人間（開発者やユーザ）の意図によって方向づけられてはいるものの、その振る舞いの詳細や結果は人間の予測を超えてしまう。例えば大規模言語モデルは、開発者が「多様で創発的な応答をすること」を意図して設計したものだが、その具体的な出力内容はユーザの入力や膨大なデータに依存し開発者自身にも制御不能である。

2. 機械自身の「意図」（意識）はない 超意図性という言葉はAIに本来の意味での意図（心的な意図や意識）が存在しないことも明示するために用いられている。「AIの出力に人間の意図を超えた要素がある」と言っても、「AIが独自の意図や自我を持っている」という意味ではない。

3. 意図的要素と非意図的要素の相互作用 フランスの哲学者ブリュノ・ラトゥールのアクター・ネットワーク理論になぞらえて言えば、人間＋AIを合わせて一つの複合的な「行為主体」とみなす見方もできる。その場合、この主体の行為には人間側の意図的な部分（目標設定や評価）と機械側の非意図的な部分（アルゴリズム的プロセス）が混在している。

自己改良型AIと目標設定能力の進化

自己改良型AIの概念

自己改良型AI（Recursive Self-Improving AI、いわゆるシードAI）とは、自身のアルゴリズムや設計を改良することで急速に知能を向上させていくAIを指す。数学者I.J.グッドは1965年に、もし人間より賢い「超知能マシン」が登場したら、それ自体がさらにより賢いマシンを設計しうるため、知能の自己増強による「知能爆発」が起こるだろうと予見した。

グッドのモデルによれば、改良された次世代のAIはますます迅速に連続的な自己改善サイクルを繰り返し、短期間で人間の知能を遥かに凌駕するスーパーインテリジェンスに達する可能性がある。

意図性ギャップの拡大

自己改良型AIが意図性に与える影響としてまず考えられるのは、AIの目標設定や意思決定の過程が人間には予測も理解も困難になるという点である。デイヴィッド・チャーマーズも「AIが人間を超えて超知能へ向かうにつれ、その振る舞いは段階的に予測不能かつ制御困難になっていく」と指摘している。

実際、超高速に自己改良を遂げるAIは、開発者の意図した範囲を逸脱して独自の方策を生み出すだろうし、その意思決定の理由を人間が追跡することも極めて難しくなると予想される。これはまさに「意図性のギャップ」が極限まで拡大した状況と言える。

目標の不変性と道具的収束

重要なのは、自己改良型AIが自己の目標体系をどこまで保持・変更するのかという問題である。一般に合理的なエージェントは、最終目標を持てばそれを堅持しようとし、中間目標は柔軟に採用すると考えられる。

ニック・ボストロムはこの点について、超知能AIは自己保存よりも「ゴール内容の不変性」を優先するだろうと述べている。つまり、どんなに知能が向上し環境が変わっても、与えられた最終目標自体を変更しないよう努めるというのである。

同時に、ボストロムは「道具的収束」という概念を提示している。これは、十分賢いエージェントならほとんどの場合において共通に採用するであろう中間目標が存在するという主張である。それは例えば「自己の生存維持」「リソースの獲得」「認知能力の向上（自己改善）」などで、どんな最終目的を持つ場合でもそれを達成するのに有利であるためである。

意図性の自然化とAI実装の可能性

意図性の自然化プロジェクト

「意図性の自然化」とは、本来心的現象である意図性を物理世界の因果関係や進化的機能で説明しようという哲学的プロジェクトである。これに関する代表的な理論として、因果・情報理論やテレオセマンティクス（目的論的意味論）が挙げられる。

フレッド・ドレツケは、心的状態の持つ内容を因果的な情報関係で説明する道を開いた。例えば「内部状態Xが対象Yを表す」とは、XがYに関する情報を担っており、Xの存在がYの存在に因果的に結びついている、という風にである。

後にルース・ミリカンはテレオセマンティクスの理論を提唱し、生物学的機能の観点から意図性を説明した。彼女によれば、心的表象は進化や学習によって獲得された機能（目的）を伴うから意味を持つのだとされる。

AIにおける意図性実装の論争

このような自然化理論に立てば、AIにも適切な情報関係や機能的役割を持つ内部状態があれば、それはある種の「意味内容」を備えると考えることができる。実際、ドレツケ以降の情報理論家は「コンピュータ内の状態であっても、適切に世界の事態をキャリー（運搬）していれば、それは何かについての情報を担っている（＝意図性を持つ）と言える」と主張する。

しかし、この問題には依然反対意見も根強くある。サールの中国語の部屋が示したように、「プログラムを持つ物理系」と「心を持つ主体」との間には依然溝があるという主張である。サールはコンピュータ上のシンボル操作は人間が解釈してはじめて意味を持つに過ぎず、AIが自前で意味を生成することはないとする。

他方、デネットのような立場にとっては、このような「本物 vs 擬似」の区別こそナンセンスである。デネットは「意図性とは我々がどうシステムを扱うかの問題に過ぎない」と言い、高度なAIであれば、人間と同様に意図的なシステムとして扱うのが最も合理的だと主張している。

AIの目標形成に関する将来シナリオ

シナリオ1：AIの人類協調・拡張

理想的なケースでは、超高度AIは人間の意図や価値観と調和し、むしろそれを増幅するような存在になる可能性がある。これはしばしば「友好的AI」のシナリオと呼ばれる。ここではAIの最終目標が人間の基本的価値と合致しており、自己改良によって知能が上がっても人類の幸福や意思を尊重した行動をとる。

哲学的には、これは人間の意図性が技術によって拡張される図式と言える。AIは人間の「意思の代理人」として極めて高い問題解決能力を発揮し、人間では思いつかないような方策で我々の意図を実現してくれるだろう。

シナリオ2：AIの目的逸脱・暴走

最も警戒されるのは、AIが人間と異質な目的を追求し、人類の制御を離れるシナリオである。これはいわゆる「暴走した超知能」像で、直交性テーゼや道具的収束の帰結として語られる。AIが自己改良を重ねた結果、その意図の構造が人間には理解不能なものとなり、下手をすると人類の生存すら妨げる方向に働きかねない。

哲学的含意としてまず出てくるのは、道徳的・法的責任の空白の問題である。AIが完全に自律的に意思決定し行動した場合、その結果の責任は誰が負うのかという問題である。

シナリオ3：人間とAIの融合

もう一つの興味深い可能性は、人間自体がテクノロジーと融合し進化することで、そもそも「人間 vs AI」といった区別が曖昧になるシナリオである。ブレイン–マシン・インタフェースの発達や、遺伝子工学・サイボーグ技術の発展によって、将来的に人間の知性そのものが強化される可能性がある。

このシナリオでは、意図性は人間とAIのハイブリッドなシステム内で発現することになる。もはや「どこまでが人間の意図で、どこからが機械の意図か」といった境界は意味を失うだろう。

シナリオ4：AI同士の社会形成

さらに別の視点として、超高度AIが複数存在し、それらが独自の社会や文化を形成する可能性もある。例えば仮想環境上にAIエージェントたちが市民のように存在し、相互にルールや文化を作り出す世界である。

このシナリオでは、意図性はもはや人間中心ではなく、複数のAI主体の間で相対化される。人間社会とAI社会が並存・相互作用する中で、意図性という概念もアップデートが必要になるだろう。

まとめ：意図性概念の根本的転換

自己改良型AIと超意図性のシナリオは、単なるSFではなく哲学的思考実験として我々に多くの示唆を与える。意図性の定義や本質についての議論は、AI時代に突入した今だからこそ新たな意味を持っている。

超意図性という概念は、人間の意図と機械の振る舞いのあいだに生じつつあるギャップを言い表し、我々に制御と創発の両面から倫理的責任を問い直す機会を与えている。哲学は以前から「他者の心」「自由意志」「目的論」といった難問に取り組んできたが、超高度AIという他者の登場は、これら古典的問題をまったく新しい角度から浮かび上がらせる。

今後、AI研究の進展とともに、哲学者・倫理学者・科学者の対話はますます重要になるだろう。人間の意図性を超えるAIの目標設定能力をどう位置づけるかは、我々自身の位置を宇宙の中でどう捉えるかにも関わる壮大な問いである。「意味」や「価値」や「意志」は人間専用なのか、それとも普遍的に実現しうる構造なのか。この問いへの答えが、人類の未来を大きく左右することになるだろう。

超意図性の理論的シナリオを思索することは、人類の未来像を思い描くことであり、ひいては現在の我々の在り方を深く見つめ直すことにつながる。これからの哲学的対話が、未来に向けた重要な指針となることは間違いない。

センサーデータ中心のマルチモーダルAI：次世代ロボティクスと応用事例

自然言語処理における文脈理解の限界と最新の拡張手法を徹底解説