AI研究

ベイトソンの学習の階層理論（Learning I・II・III）とは？意味創出プロセスを徹底解説

2026.04.01

はじめに：なぜ「学習の階層」を理解する必要があるのか

「勉強しているのに成長が止まった気がする」「組織で研修を繰り返しても行動が変わらない」——そんな経験をしたことはないだろうか。その背景には、学習そのものに「深さの違い」があるという事実が潜んでいる。

グレゴリー・ベイトソンが提唱した「学習の階層理論（Learning I・II・III）」は、このような問いに対して根本的な答えを与える理論的枠組みだ。ベイトソンは人類学・生態学・サイバネティクスを横断した思想家であり、『Steps to an Ecology of Mind（精神の生態学へ）』において学習を「誤り訂正の論理階型」として体系化した。

本記事では、この理論を「意味（meaning）がどのように再構成されるか」という視点から読み解く。Learning I〜IIIそれぞれで何が変わるのかを明確にし、教育・AI・組織学習における実践的含意まで掘り下げる。

ベイトソンの「学習の階層理論」とは何か

学習を「誤り訂正の型」として捉える

ベイトソンの出発点は、サイバネティクスの概念にある。学習とは単に情報を蓄積することではなく、フィードバック回路での誤り訂正として機能する。そして重要なのは、「何を誤りとして認識し、どのレベルで訂正するか」が学習の本質的な違いを生む、という点だ。

ここで「論理階型（logical types）」という概念が登場する。ラッセルの論理学に着想を得たこの枠組みは、「集合の要素」と「集合そのもの」が異なる論理的レベルにある、という考えに基づく。ベイトソンはこれを学習に適用し、Learning I・II・IIIという階層を設定した。

さらに、ベイトソンは「情報（information）とは、後続の出来事に差異を生む差異（difference that makes a difference）である」と定義した。つまり意味とは差異作用のことであり、何が「意味のある差異」として認識されるかが、学習のレベルによって変わってくる。

Learning I：固定された選択肢の中での意味更新

定義：同じ枠組みの中での誤り訂正

Learning Iは、「固定された選択肢集合（set of alternatives）の内部で、誤りを訂正し、反応の特異性を変える」プロセスだ。これは最も基本的な学習であり、日常的な技能習得や条件づけがこれに該当する。

たとえば、新しいキーボード配列を覚える場面を想像してほしい。どのキーを押すかという「選択肢集合」は最初から定まっており、学習者はその中で打ち間違いをフィードバックとして受け取り、正確な打鍵へと修正していく。選択肢の枠組み自体は変わらない。

意味再構成のメカニズム

この水準では、意味は「刺激→反応→結果」という機能的な対応関係として更新される。記号論的に言えば、「この記号（刺激）に対してどの行為が適切か」という解釈項が、強化と誤差訂正によって調整される。

認知科学の「予測処理（predictive coding）」に写像すれば、上位のモデル構造は固定されたまま、パラメータ（重みづけ）が微調整される段階に相当する。AIで言えば、強化学習や教師あり学習における通常のパラメータ更新に近い。

重要なのは、Learning Iが成立するためには「同じ文脈の反復」が前提とされることだ。同じ状況として再同定できなければ、学習は”ゼロ学習”（変化なし）に回収されてしまう、とベイトソンは論じる。

Learning II：「文脈の切り方」が変わる意味の転回

定義：学習の過程そのものの変化

Learning IIは、「Learning Iの過程の変化」として定義される。具体的には、(a)選択肢集合が修正される、または(b)経験列をどう**分節（punctuation）**するかが変わる、という変化だ。

この水準では、刺激そのものではなく、「刺激を何として数えるか」を指定する**メタ水準の信号（metamessage）**が焦点になる。ベイトソンは「文脈指標（context markers）」という概念を導入し、状況の識別がこれらの指標によって行われることを示した。

同じ発話が「叱責」にも「指導」にもなる理由

具体的な例で考えてみよう。上司が「ここ違うよ」と言う場面を想像してほしい。この発話（一次メッセージ）が、ある職場では”叱責”として、別の職場では”改善支援”として受け取られる。この差を生むのは、発話の内容ではなく**「これは評価面談か、それとも日常の共同改善か」という文脈指標**だ。

Learning IIが「経験列の分節の変化」「文脈指標の使用の変化」であるという定義が、まさにここに当てはまる。学習者は「どんな状況がここで展開されているか」というメタレベルの理解を更新している。

プラグマティクスとの接続

この水準の意味は、言語哲学の「プラグマティクス」とも接続できる。会話の含意（implicature）とは、字義通りの意味を超えて「どんな協調原理のもとで言われたか」を推論することで成立する。これはまさに、”文脈の文法”を学習し、その文法に従って意味を再構成する過程だ。

ベイトソンは、Learning IIによって獲得された前提が自己妥当化（self-validating）しやすく、多くは無意識的で除去が困難であることを強調する。一度形成された「この状況はこういうものだ」という解釈枠は、容易には書き換えられない。これが、組織や個人の変化が難しい理由の一端を説明している。

Learning III：「枠の枠」が揺らぐ認識論的転換

定義：文脈の文脈（contexts of contexts）の学習

Learning IIIは、「Learning IIの過程の変化」として定義される。Learning IIが「Learning Iの文脈の学習」であるなら、Learning IIIは「それら文脈の文脈（contexts of contexts）の学習」だ。

この水準での意味再構成は、単なる枠の置換ではない。枠を生成し、自己を定位する仕方そのものが揺らぎ、再編される。ベイトソンは、Learning IIの水準では「自己」が「性格＝文脈内での行為・知覚習慣の総体」として成立すると述べる。しかしLearning IIIが起きると、その自己概念が結節点として機能しなくなる。

組織のダブルバインドが駆動力になる

Learning IIIはしばしば、Learning IIの内部矛盾（contraries）によって引き起こされる。典型的な例が組織のダブルバインドだ。

「各人は成果で競争せよ（個別最適）」と「部門横断で協働せよ（全体最適）」を同時に強く求める組織では、Learning IIで形成された行為前提——どの状況で何が正しいか——が内部矛盾を起こす。Learning IIの水準での「運用ルールの変更」では解決できず、「成果とは何か」「協働とはどういう目的のためにあるのか」という上位前提そのものを再定義する必要が生じる。これがLearning IIIだ。

稀であり、かつ危険なプロセス

ベイトソン自身が明言しているのは、Learning IIIが「試みるだけでも危険であり、脱落者も出る」という点だ。精神医学的にはpsychoticとラベルされることもある、と述べられている。

これは組織変革論への重要な警告でもある。「より高次の学習＝より良い」という単純な規範化は危険であり、Learning IIIは条件と支援を慎重に整えた上で初めて、建設的な転換につながりうる。

三層の学習を横断する比較：まとめ表

レベル	変化する対象	意味再構成の中心	典型例
Learning I	行為選択・連合強度（固定の選択肢集合内）	刺激→反応の機能的対応の更新	技能の反復練習、条件づけ
Learning II	枠組み・経験の分節（punctuation）	解釈枠・前提・文脈指標の変更	役割形成、暗黙のルール獲得
Learning III	枠組み生成規則・自己・認識論的前提	意味づけ装置そのものの再定義	価値観・世界観の転回、稀で高リスク

教育・AI・組織学習への応用

教育設計への含意

教育実践の設計では、三つの層を明確に区別することが重要だ。Learning Iは「技能習得（反復とフィードバック）」、Learning IIは「学び方を学ぶ（文脈理解・学習セット）」、Learning IIIは「準拠枠の変容（自己や目的の再定義）」として、それぞれ異なる評価と支援が必要になる。

たとえばルーブリックによる評価は、「何を”できた”と数えるか」という文脈指標を明示化し、学習者が自身のLearning Iの過程をLearning II的に点検する足場になりうる。ただし、ルーブリックの固定化が枠組みを硬直させる逆効果を生む可能性も無視できない。

AI・機械学習への写像

AI・機械学習の観点からは、Learning Iは「通常のパラメータ更新」、Learning IIは「学習を学習するメタ学習（meta-learning）」、Learning IIIは「どのモデルクラス・目的関数・価値体系で世界を切り出すか」というメタ前提の更新として捉えられる。

階層的強化学習（HRL）が複数の時間・抽象度レベルで方策を組むことで探索を改善するという整理は、ベイトソンが述べた「誤り訂正の経済性と階層化」の現代的再記述として読むこともできる。ただし、ベイトソン理論の核心は「意味＝文脈指標＝メタメッセージ」というコミュニケーション論的構造にある。単なる最適化階層として回収すると、Learning II・IIIの「意味の病理（自己妥当化・硬直・ダブルバインド）」が抜け落ちることに注意が必要だ。

組織学習：ダブルループを超えて

組織学習研究では、アージリスとショーンが提唱した「ダブルループ学習」——目標・価値・前提そのものを問い直す学習——がLearning II〜IIIと強い連続性を持つ。「現在使っている論理の妥当性を検討し、妥当性を失えば置き換えるプロセス」として定義されるダブルループは、枠の枠を点検するLearning III的な営みと重なる。

エンゲストロームの活動理論の立場からは、Learning IIIは「矛盾により生起する稀な出来事」であり、異なる活動システム間の矛盾やジレンマがダブルバインドとして現れ、目的が拡張され新しい目的が生成されるという循環として論じられる。意味創出の単位が個体からシステムへと広がるこの視点は、組織変革の実践にとって重要な示唆を与える。

まとめ：学習の深さを知ることが変革への第一歩

ベイトソンの学習の階層理論は、「なぜ同じことを繰り返しても変わらないのか」「どうすれば本質的な変容が起きるのか」という問いに、理論的な答えを提供する。

Learning I：固定された枠の中でパラメータを更新する。意味は「機能的対応」として更新される。
Learning II：枠組み・分節・文脈指標が変わる。意味は「解釈枠・前提」として再組織化される。
Learning III：枠を生成する仕組みそのものが再編される。意味は「認識論的前提・自己」の再定義として現れる。

三層を意識することで、教育・AI・組織学習のいずれにおいても、どのレベルの介入が必要かを見極める解像度が高まる。ベイトソンが警告するように、Learning IIIは強制できるものではなく、内部矛盾が臨界に達したときに初めて生じる稀な転換だ。だからこそ、その条件を丁寧に整えることが実践者の責任となる。

散逸構造・シナジェティクス・オートポイエーシスを比較——自己組織化理論の全体像

AI時代の自然観：計算論的メタファーと生態学的思考はどう衝突し、どう統合されるか