ChatGPTやClaude、Geminiのようなチャットモデルに質問すると、まるで「知っている」かのような答えが返ってくる。しかし、これは比喩なのか、それとも哲学的に正当化できる主張なのか。本記事では、自然主義的認識論という哲学の枠組みを使い、LLMの「信念」「正当化」「知識」という三つの概念を、観察可能な指標に結びつけて整理する。擬人化に流されず、しかし過度に懐疑的にもならず、現実的な評価軸を提示することが本記事の目的である。

なぜ「LLMは知っているのか」が重要な問いなのか
LLMをビジネスや医療、教育の現場で使う機会が増えるほど、その出力をどこまで信頼してよいかという判断が重要になる。出力が流暢であることと、その内容が正当化された知識であることは別の問題である。この区別を曖昧にしたまま運用すると、誤った情報を「モデルが知っている事実」として受け取ってしまうリスクが生まれる。だからこそ、信念・正当化・知識という認識論の伝統的概念を、LLMという新しい対象にどう適用するかを丁寧に検討する必要がある。
自然主義的認識論とは何か
自然主義的認識論は、哲学的な認識論を自然科学的な手法と連続させて捉えようとする立場の総称である。単一の理論ではなく、複数の立場の集合体であり、何を「自然的事実」とみなし、それが知識や正当化をどこまで支えるとみなすかによって、いくつかの系統に分かれる。本記事では、この伝統的区分をLLM評価に使いやすい形に再構成し、科学的自然主義、メタ認識論的自然主義、機能主義的自然主義、説明的自然主義、記述的自然主義という五つの作業類型として扱う。
科学的自然主義
科学的自然主義は、認識論的な問いを経験的なテストで検証できる対象として扱う立場である。LLM評価においては、ベンチマークでの正答率や汎化性能、長文に対する処理精度などが主な観察対象になる。実証しやすく比較もしやすい一方で、高い性能をそのまま「知っている」という結論に飛躍させてしまう危うさがある。
メタ認識論的自然主義
正当化や知識といった規範的な性質も、ある程度は自然的な性質に依存しうるとみる立場である。LLMに当てはめると、回答の確信度がどれだけ適切に調整されているか、誤りをどれだけ自信満々に主張してしまうか、といった点が評価対象になる。性能の高さだけでなく、わからないことを「わからない」と言えるかどうかという視点を加える点に意義がある。
機能主義的自然主義
心的状態を、その内部構造よりも因果的・予測的な役割によって特徴づける考え方である。LLMの「信念らしきもの」を、人間の内面を前提にせず、応答の一貫性や、言い換えに対する安定性、反事実的な状況での振る舞いの持続性として捉える。これにより、過度な擬人化を避けつつ、操作可能な形で信念状態を議論できる。
説明的自然主義
評価の中心を、出力がどのような因果的プロセスで生成されたかという説明に置く立場である。モデル内部の表象を特定し、それを操作したときに出力がどう変化するかを検証する、いわゆる機械論的解釈可能性の研究がこれに対応する。なぜ正解したのか、なぜ誤ったのかを説明できる点が強みだが、内部構造へのアクセスが制限されたモデルには適用しにくい。
記述的自然主義
規範的な評価に先立ち、モデルが実際にどう振る舞うかをまず記述する立場である。対話の継続によって応答がどう変化するか、拒否や保留、迎合的な振る舞いがどの程度生じるかを観察する。先入観を持ち込みにくい一方、それだけでは「良い信念形成とは何か」という規範を語りにくい。
これら五つの立場は互いに排他的ではなく、補完関係にある。性能だけを見る評価では「当たっているかどうか」しかわからず、説明だけを見る評価では「なぜそう出たか」はわかっても実用上の信頼性が測れない。実務的には、これらを段階的に組み合わせて使うのが妥当だろう。
LLMに「信念」を帰属できるのか
人間の信念のような厚い心的状態をLLMに帰属するのは難しい。そこで、信念をいくつかの薄い操作概念に分解して扱う方法が提案されている。
第一に、ある命題に対して他の選択肢よりも高い確信度を示す「信頼度ベースの信念」がある。これはモデルの出力確率や校正度から観察できる。第二に、ある命題を支持するなら、その論理的帰結も一貫して支持し、矛盾を避けるという「整合的信念」がある。言い換え表現に対する応答の一貫性などから検証できる。第三に、ある命題に対応する内部表象が存在し、それを操作的に変更すると出力が系統的に変わるという「因果的信念」がある。これは内部構造への介入実験によって確認されうる。
重要なのは、確信度が高いことだけをもって「信じている」と即断しないことである。確率的に生成された文章が高い確信度を示すことと、その内容に対する持続的な関与とは別の問題であり、両者を区別する視点が欠かせない。
LLMにとっての「正当化」とは何か
人間の認識論において正当化は、理由の内省的な提示と結びつけられがちである。しかしLLMの場合、内省的な理由提示をそのまま信頼することには危うさがある。そこで、正当化を自然主義的な条件へ分解する方が現実的である。
ひとつは、回答が外部の文書や検索結果、与えられた文脈にどれだけ接地しているかという「外的証拠による正当化」である。引用機能や根拠提示の仕組みは、この条件を技術的に近似する試みといえる。もうひとつは、信念を形成するプロセス自体がどれだけ真理志向的であるかという「信頼性に基づく正当化」である。誤りの少なさや、わからないことを適切に保留する能力がここに関わる。さらに、推論過程がどれだけ検証可能な形で示されているかという「手続き的正当化」もある。ただし、モデルが提示する推論の説明文が、実際の内部処理を忠実に反映しているとは限らない点には注意が必要である。説明文と内部状態が乖離する可能性は、複数の研究で指摘されている。
LLMに「知識」を帰属する難しさ
知識の帰属は最も慎重さが求められる領域である。哲学的な整理では、知識概念を複数の候補に分岐させて検討するアプローチが提案されている。たとえば、真であることと高い確信度を満たす程度の弱い知識概念から、真理性に加えて整合性や部分的な解釈可能性を要求する知識概念、真理志向的な能力の存在を要求する知識概念、関連する推論課題での成功確率に基づく知識概念まで、要求水準の異なる複数の定義が存在する。
これらのうち、内部に何らかの情報が保持されているという事実だけをもって知識を認める、もっとも弱い知識概念は支持されにくい傾向にある。出力できることや、内部に記憶のようなものが見つかることだけでは、知識という強い概念を支えるには不十分とみなされやすいからである。これに対して、真理性に加えて整合性や信頼性、ある程度の理由づけを要求する知識概念のほうが、現状の研究蓄積とも整合的であり、より受け入れられやすい。
主要モデルから見える傾向
公開されている技術報告や研究からは、いくつかの一般的傾向が読み取れる。高性能なモデルほど多様な課題で高い正答率を示す一方、事実に基づかない内容を生成してしまう現象は依然として残っている。また、後続の調整によって事実性が改善される一方で、確信度の調整自体は必ずしも同時に改善するとは限らないという報告もある。これは、「能力が上がること」と「自分の限界を正しく把握すること」が別の軸であることを示唆している。
自己評価に関する研究では、モデルが自分の回答の正しさをある程度予測できることや、ある問いに対して自分が答えを知っているかどうかをある程度推定できることが報告されている。ただし、見慣れない種類の課題に対する自己評価の精度は十分ではなく、自己についての知識が万全であるとは言えない。
また、与えられた長い文書から必要な情報を取り出す能力が大きく向上しているという報告もある。これは、モデル内部に記憶された知識だけに頼るのではなく、外部の証拠にしっかり接地する形で正当化を強化する方向性を示している。ただし、長い文書を正確に参照できることと、最新の情報や前提の誤りを的確に見抜けることは別の能力であり、両者を混同しないことが重要である。
機械論的解釈可能性の研究では、特定の事実関係に対応する内部構造を特定し、それを編集することで出力を変化させられることが示されている。これは、LLMの知識の少なくとも一部が、操作可能な因果構造として扱えることを意味する。ただし、特定の事実関連付けの局在が確認できることと、論理的・空間的な推論を含む幅広い「信念」全体を説明できることとは別であり、この結果から信念の存在を一般化して結論づけるのは早計である。
評価における注意点
LLMの評価において最も陥りやすい落とし穴は擬人化である。「モデルが信じている」「知っている」という表現を使うとき、それが比喩なのか、機能的な役割の記述なのかを明確に区別しないと、誤ったメンタルモデルを読者に与えてしまう。
また、モデルが提示する説明文をそのまま内部処理の証拠とみなすことにも注意が必要である。複数の研究が、モデルの推論過程の説明と実際の内部処理との間に乖離が生じうることを示しており、説明文は透明な窓ではなく、評価対象のひとつとして扱うべきである。
さらに、知識という概念が持つ「真でなければならない」という性質を、モデル自身がどこまで適切に理解しているかという問題もある。信念と事実を十分に区別できない場合、特に医療や法律のような高ステークスな領域での利用には慎重さが求められる。
まとめと評価の方向性
LLMの「信念」「正当化」「知識」を評価するうえで有望なのは、単一の立場に頼るのではなく、性能評価、確信度の校正、応答の一貫性、内部構造の説明可能性という複数の観点を組み合わせた多層的な評価である。最も無理のない知識の帰属は、外部の証拠にしっかり接地し、十分に確信度が調整され、安定した推論の成功を示す範囲に限定したものであり、「人間と同じように知っている」という強い主張ではない。
LLMを評価する際は、性能だけで判断せず、確信度の妥当性、応答の安定性、説明の忠実性をあわせて確認する姿勢が求められる。この姿勢は、ビジネス活用や教育、医療といった現場でモデルの出力をどう扱うべきかを考えるうえでも、実践的な指針になるはずである。
コメント