AI研究

身体化AIへの過信と擬人化はなぜ起きる？HRIにおける信頼較正と測定設計の最前線

2026.05.25

なぜいま「過信」と「擬人化」の測定が重要なのか

人とロボットが同じ空間で協働する場面は、製造現場や医療支援、生活介助など、急速に広がっています。こうした状況で見落とされがちなのが、ユーザーがロボットの実際の能力を上回る信頼を寄せてしまう「過信」と、ロボットに意図や感情を帰属させる「擬人化」という二つの認知的バイアスです。

過信は誤った提案への追従、介入の遅れ、安全上のリスクを生みます。擬人化は単に「かわいい」と感じる話ではなく、ロボットの能力限界を見誤る遠因になることが近年の研究で示されつつあります。さらに、透明性を高めるための「説明」が、逆にロボットをより人間らしく見せ、過信を誘発する副作用を持つ可能性も指摘されています。

本記事では、身体化AI・HRI（Human-Robot Interaction）研究における過信・擬人化の定義から、測定バッテリーの組み方、実験デザイン、分析計画まで、研究者・開発者が実装可能なレベルで整理します。

過信と擬人化の定義：「高信頼」とは何が違うのか

過信は「依存行動が実能力を超えた状態」として定義する

信頼研究において注意すべきは、「過信」を単なる「高い信頼感」と混同しないことです。信頼較正（trust calibration）の文脈では、較正された信頼とは「知覚されたシステム能力が真の能力と一致している状態」を指します。過信はその逆、すなわちユーザーの依存行動がロボットの実際の能力や信頼性の境界を上回る状態です。

この定義が重要な理由は、主観評定だけでは過信を捉えきれないからです。近年の研究では「trust（信頼）」と「reliance（依存）」を明確に区別し、特に自動化システムとの協働では、誤った推奨への追従率、正しい推奨の棄却率、介入タイミングの遅れといった行動指標のほうが、較正の実態を正確に反映すると考えられています。

身体化ロボットでこの区別がさらに重要になる理由は、物理的な存在感や対話が「純粋な機械への依存」から「相手への社会的信頼」へと認知を移行させやすいからです。この移行自体が、過信リスクを高める構造的要因となります。

擬人化は多成分概念として扱う必要がある

擬人化については、HRI研究内部で概念の不統一が大きく問題視されています。あるスコーピングレビューでは、57件の研究・43種類のロボット・約2,900名の参加者を対象に、擬人化に7種類の異なる定義と多数の改変尺度が使用されており、研究間の比較可能性が著しく損なわれていることが報告されています。

擬人化は「見た目が人間らしい」という外見的特徴にとどまらず、心的状態の帰属、人格帰属、社会的意図の帰属、温かさ・有能さの知覚を含む多成分概念として扱うべきです。日本語圏の研究では、ロボットの人間らしさがポジティブ因子とネガティブ因子に分かれる可能性が1,200名規模の調査で示されており、欧米の尺度を単純翻訳して使う危険性も指摘されています。

HRI信頼研究の現状と課題

質問紙中心の研究から行動・生理指標へ

2025年に発表された100本規模のHRI信頼研究レビューによると、この分野の測定は依然として質問紙（自己報告）が中心であり、センサベースの行動指標や生理指標を用いた研究はごく少数です。これは測定の妥当性という観点から大きな課題です。主観評定は状態の一側面は捉えますが、実際の依存行動の較正度合いを直接反映するわけではありません。

説明可能HRI（Explainable HRI）についても、58件のユーザ研究を整理した2025年のレビューは、理解可能性の操作化と測定が標準化されておらず、特にin-the-wild研究、縦断研究、多次元的な理解可能性評価が不足していると報告しています。

こうした現状から、過信・擬人化を適切に測定するには、行動指標を主、主観指標を補、生理指標を探索的に置く多方法設計が求められます。

説明が擬人化を高める副作用

先行研究から見えてきた重要な知見のひとつが、説明（explanation）の副作用です。ある実験では、ロボットの行動説明が知覚能力や安全性を変えなかった一方で、ロボットをより生き生きと人間らしく見せる効果を持つことが示されました。

つまり、説明可能性の介入は信頼較正の改善を目的としながら、同時に擬人化を促進してしまう可能性があります。過信抑制のための説明が「このロボットは気持ちや意図を持っている」という印象を増幅するなら、短期的には依存行動が改善されても、別の文脈での過信を誘発するリスクが生まれます。

能動的・予測的説明（故障を事前に予告するタイプ）が事後説明より信頼・理解可能性・タイミング評価を改善する傾向は示されています。一方で、信頼修復全体としての効果量は小さいというメタ分析結果もあり、設計は慎重であるべきです。

代表的尺度の選び方と比較

Trust in Automation スケール

12項目からなるこの尺度は、自動化一般への信頼を測るものとして広く使われています。短く比較研究に向いていますが、HRI特異性が低く、近年の研究では肯定方向への反応バイアスが批判されています。

Godspeed スケール

擬人化・生気・好ましさ・知性・安全性の5因子・24項目で構成される、社会ロボット印象評価の標準的な尺度です。日本語版もback-translationで整備されており、比較研究に強みがあります。ただし、擬人化と生気の概念的重複や、因子構造の妥当性報告が不十分であることが繰り返し指摘されています。

RoSAS（Robot Social Attributes Scale）

温かさ・有能さ・不快感の3因子・18項目で構成され、4件の研究で開発・検証されています。正の社会的評価だけでなく、不快感という負の評価まで捉えられる点で、過信・擬人化研究との親和性が高い尺度です。短縮版（6項目）も存在し、時間制約の強い実験での反復測定に適しています。

Trust Perception Scale-HRI

HRI文脈に特化した40項目（短縮版14項目）の尺度です。HRIの文脈に即した詳細な測定が可能ですが、理論定義と因子構造の透明性の弱さが指摘されています。

日本語環境での注意点

日本語研究では、状態擬人化（特定のロボットとの相互作用後に感じる擬人化）と特性擬人化傾向（個人が持つ一般的な擬人化傾向）を分けて測ることが推奨されます。IDAQ-Jは後者の測定に向いており、共変量として組み込むと群比較が安定します。尺度の運用に際しては、単純な翻訳ではなく、認知インタビューやパイロットテストによる項目理解の確認が欠かせません。

推奨する測定バッテリーの構成

三層構造で設計する

単一尺度に依存することは避け、以下の三層構造が推奨されます。

主評価：行動較正指標

依存率（ロボット提案の採択割合）
過信率（誤提案採択数 ÷ 誤提案機会数）
過少信頼率（正提案棄却数 ÷ 正提案機会数）
介入頻度と介入遅延
委任率と手動復帰率
安全関連の近接違反・緊急停止・衝突回避行動

副評価：主観指標

ブロックごとの状態信頼（Trust in Automation または TPS-HRI 短縮版）
社会的知覚（RoSAS を基軸、必要に応じてGodspeed一部下位尺度）
理解可能性の主観評定と客観理解テストを分けて計測

探索的評価：生理・質的指標

EDA（皮膚電気活動）のtonic/phasic成分
HRV（心拍変動）のRMSSDまたはSDNN
視線のロボット注視比率と瞳孔径
クリティカルイベント直後のマイクロ質問と終了後の刺激再生型インタビュー

生理指標はストレスや認知負荷の代理であることも多く、単独解釈には注意が必要です。あくまで補助的・探索的に位置づけ、後続研究での検証を想定した導入が適切です。

実験デザインの設計指針

有効な操作因子の組み合わせ

信頼較正介入として有効な要因には、性能表示・不確実性表示・失敗率の事前教示・誤差注記があります。説明可能性要因としては、因果説明・対話型Q&A・グラフィカル可視化・提示タイミング（能動的事前説明 vs. 事後説明 vs. 要求時説明）が挙げられます。

これに擬人化フレーミング（中立表現 vs. 人間的名称・声・自己言及）を加えると、「説明が理解可能性を通じて較正を改善したか」と同時に「説明が擬人化を高めて過信を誘発していないか」という二つの問いを一つの設計で検証できます。

タスク候補の選び方

産業HRC（Human-Robot Collaboration）文脈では、廃棄物分別・部品受け渡し・簡易組立・移動体回避が行動指標を取りやすく、過信の行動化に適しています。ナビゲーション・移動支援文脈では、経路提案の採択率・手動修正・介入遅延が取りやすく、信頼較正の定義と整合的です。いずれの場合も、正答率の高い試行と低い試行を混在させることで、依存の方向と精度を同時に評価できます。

サンプルサイズの目安

両側検定・有意水準.05・検出力.80を前提とした場合の目安です。

独立二群比較（Cohen’s d = 0.40想定）：各群約99名、合計約198名
四群比較（Cohen’s f = 0.25想定）：総数約178名（保守的にf=0.20なら約277名）
被験者内反復測定（d = 0.35想定）：約66名

センサ欠損や途中離脱を10〜20%見込み、実募集では上乗せが必要です。説明研究では効果量のばらつきが大きいため、確認的比較は保守的に設定することが推奨されます。

倫理設計と日本の規制対応

誤導と同意設計

本テーマでは、性能表示の意図的変更、失敗頻度の人工的操作、説明生成の自動性の誇張といった部分的な誤導が生じやすいです。これを許容するには、代替手段が乏しいこと、参加者リスクが低いこと、終了後に完全デブリーフィングを行うこと、データ削除の選択肢を与えることが必要です。

個人情報保護法と生体データ

日本の個人情報保護法の下では、顔・音声・視線・歩容・生理信号など認証に利用できるデータは個人識別符号に該当しうるものがあります。こうしたデータを取得する研究では、取得目的の明確化、利用範囲の限定、保管期間の明示、再識別防止、削除手続きを同意書に明記することが必要です。実務上は、特徴量抽出後に原データを可能な限り削除し、生データの保存期間を短期に限定することが望まれます。

まとめ：較正された依存行動を主軸に置く研究設計へ

本記事の要点を整理します。

身体化AIへの過信は「高い信頼感」ではなく「依存行動が実能力を超えた状態」として定義し、行動指標を主評価に置くことが重要です。擬人化は多成分概念であり、外見・動作・心的状態帰属を分けて測る必要があります。説明可能性の介入は理解可能性を高める一方で、擬人化を促進するという副作用を持ちうることを設計段階から考慮しなければなりません。

尺度選択では、RoSASを擬人化・社会知覚の基軸に置き、Trust in AutomationやGodspeedと組み合わせる構成が現実的です。日本語環境では単純翻訳ではなく、認知インタビューとパイロット検証を経た文化適応が不可欠です。

主観的信頼を主エンドポイントにする研究デザインから、較正された依存行動を中心に置き、主観・生理・質的データで補完する三層設計へのシフトが、この分野の次のステップとなります。

ハイパーオブジェクトはOOOの「例外」か「顕在化」か――種概念的位置づけと理論的整合性を読み解く

フラット存在論とAI民主主義──アクタント認定が変える政治参加の未来