東京大学ニューロインテリジェンス国際研究機構特任教授 長井志江氏に聞く
第2回 予測情報処理というグランド・セオリー
人はどのように世界を理解し、他者と関わるのか──長井志江特任教授は、脳が、知識や経験に基づく予測信号と感覚器からの信号の誤差を最小化することで知能を獲得するという「予測情報処理」理論に基づいて、認知や行動の発達についてロボットを使って理解する研究に取り組んでいる。視覚や聴覚だけでなく心拍や呼吸などの“内受容感覚”にも注目し、自閉スペクトラム症(ASD:Autism Spectrum Disorder)などの発達の違いを読み解く手がかりを探るアプローチは、工学と人間科学をつなぐ新たな地平を開いている。

長井 志江(ながい ゆきえ)
東京大学国際高等研究所ニューロインテリジェンス国際研究機構特任教授。博士(工学)。構成的アプローチから人間の社会的認知機能の発達原理を探る認知発達ロボティクス研究に従事。自他認知や模倣、他者の意図・情動推定、利他的行動などの認知機能が環境との相互作用を通した感覚・運動信号の予測学習に基づき発達するという仮説を提唱し、計算論的神経回路モデルの設計とそれを実装したロボットの実験によって評価。さらに自閉スペクトラム症(ASD)などの発達障害者のための自己理解支援システムを開発。ASD 視覚体験シミュレータは発達障害者の未知の世界を解明するものとして高い注目を集める。Analytics Insight “World’s 50 Most Renowned Women in Robotics”(2020)、IEEE IROS “35 Women in Robotics Engineering and Science”(2022)、Forbes JAPAN “Women In Tech 30”(2024)などに選出。2016 年より CREST「認知ミラーリング」、2021 年より CREST「認知フィーリング」の研究代表者。
目次
人はトップダウンとボトムアップの界面で世界を認知する
都築 正明(以下――)先生はどのような経緯で予測情報処理の研究をされているのでしょう。
長井 志江氏(以下、長井)子どもがどのように発達するのか、また発達障害 1などの多様性がどのように現れるのかについて興味がありました。予測情報処理は、神経科学者のカール・フリストンにより提唱された理論で、脳が自由エネルギー原理に基づいて感覚入力を予測し、予測誤差を最小化するように働いているとする考えです。フリストンの論文はとても難解なものでしたが、当時、京都大学の乾敏郎先生がわかりやすく解説をしてくださって、私はこの予測情報処理が発達のさまざまな現象を説明できる、共通の原理になりうると考えて研究をはじめました。
「予測符号化モデル」について教えてください。
長井 原理としては、脳が環境を認識する際に、視覚や聴覚、触覚などの感覚器から信号を受け取るのですが、ただ受動的に信号を受け取るだけではなく、脳が持っている過去の知識や経験から成る内部モデルに基づいて予測をして、トップダウンな予測信号とボトムアップな感覚信号の間の予測誤差を最小化するように、知覚を生成するというものです。この原理に基づくと、学習は予測誤差を小さくするように、内部モデルをアップデートすることとして捉えられます。また、予測誤差を最小化するように環境に働きかけることで、行動が生成されます。
アクションを起こすことも、このモデルから説明できるということでしょうか。
長井 これは「アクティブ・インファレンス(active inference:能動的推論)」と呼ばれるものです。例えば目の前に置いてある本の表紙から裏表紙はどうなのかを推測するとします。実際には見てみなければわかりませんから、実際に裏返してみたりするわけです。このように、行動も予測誤差を最小化するモチベーションのもとに生成されるという、知覚と同様の統一原理のもとで考えられるところが画期的だと思います。
学習の結果については、再帰的に積み重なっていくことになりますね。
長井 そうですね。予測情報処理では、ボトムアップに入ってくる感覚器からの信号(図1:Sensation)と、脳からの予測信号(図1:Prediction)が、それぞれ曖昧性を持っていると想定します。図1右のガウス分布の分散が、信号の精度の高さを表しています。未知な環境であれば予測が未熟なので、感覚器から入ってくる信号に強く依存して環境を認識しますし、よく知っている場所であれば、脳の内部モデルを用いて予測信号に従って行動することができます。成人の脳では、予測信号と感覚信号がバランスよく、適応的に使われているのです。しかし、乳幼児の発達の過程や、そこから派生した発達障害については、予測信号と感覚信号のバランスが偏っていると説明されるに留まっています。よく知られている仮説は、予測信号の分散が大きいことによって過去の経験をあまり利用することができず、入力される信号を新規なものとして、常に学習しようとするというものです。発達障害のある方は、少しでも新しい環境や予測しにくい環境に行くと、感覚過敏になりやすくなります。

予測情報処理:脳の一般原理(長井先生提供)
感覚過敏の症状のある方が、耳や目をふさいでしゃがみこんだり、大声をあげたりするのには、そうした意味があると考えられるのですね。
長井 視覚過敏や聴覚過敏は、まさにそうしたところに端を発しているのだと思います。予測ができる感覚入力には「センサリー・アテニュエーション(sensory attenuation:感覚減衰)」というものが働きます。たとえば自分で身体をくすぐっても、くすぐったくありませんよね。これは自分の手の動きを自分で生成しているので、どういう感覚刺激が来るか予測ができるからです。相手からされてくすぐったいのは、予測できないからです。自分で運動を生成するときは予測が働いているので、感覚信号が減衰されて知覚されるわけです。発達障害の方において予測がうまく機能しないとすると、入ってくる信号がすべて新規なものになるわけです。ですから、とても疲れてしまったり、感覚過敏が起きやすい――ここまでが、もとからあった仮説です。
先生は、脳の予測情報処理から身体性予測情報処理へと研究を広げられています。
長井 私は、発達障害と定型発達の差異が予測情報処理理論で説明できるのであれば、発達の段階で変化していくことも、同様に説明できるのではないかと考えました。そこで脳の予測情報処理を拡張して、身体の重要性を強調した「身体性予測情報処理」理論を提案し、この新しい理論に基づいて発達を説明することを試みています。ポイントは、身体が持っている感覚や運動機能の発達が、脳の発達と同期して起きるという点です。たとえば乳幼児は、生まれたばかりのころ歩くことができず、運動の制約があります。また視力についても、生後まもなくはとてもぼんやりとしか見えていません。それは、脳の処理の未熟さとともに、筋肉やレンズの調節機能など、感覚や運動機能に未熟さがあるからです。脳が未熟なだけでなく、運動機能も感覚機能も未熟な状態から始まり、両者が同期して成熟することが重要です。

身体性予測情報処理:認知発達の統一原理(長井先生提供)
発達心理学では、赤ちゃんにはまず原始反射やジェネラル・ムーブメント2があって、そこから認知機能を獲得するといわれますね。
長井 脳が成熟して身体が未熟でもよくありませんし、身体だけが成熟して脳が未熟でもよくありません。実際に身体を動かしたり環境を観察しながら、感覚運動機能と脳がセットになって発達することが定型的な発達を導き、このバランスが不均衡になることで発達障害に近い多様性が起きうるのかもしれません。また従来のロボット研究における身体性は、視覚や聴覚などの外受容感覚や姿勢や動作などの固有感覚が中心で、心拍や呼吸のような内受容感覚についての視点が完全に欠けていますので、そこを含んだロボティクス研究を進めています。
AIと外界のセンサリングだけでは、人の持っている身体性が獲得できないということですね。
長井 はい。外界だけではなく、身体の内部に関する知覚も必要で、そうした観点から研究を進めています。
発達障害当事者との共同研究でみえてくること
先生は発達障害の当事者研究の方々とも共同研究をされていますが、そこでの発見も多いのでしょうか。
長井 発達障害を研究されている方々、特にご自身も発達障害を抱える当事者研究者のお話を聞くと、数多くの新しい知見が得られます。例えば、自分の内臓の感覚として、お腹が空いたという感覚がわからないという報告があります。当事者の方からすると、空腹に関係ある感覚信号というのは、頭が痒かったり手足がしびれたり冷たかったりという多くの信号のなかの、わずかなものでしかないそうです。お腹が空いたという感覚を取得するためには、多くの信号から重要度に応じて情報を取捨選択するプロセスが必要です。うまく取捨選択されてひとまとまりになり、かつその情報が文脈に合致することで、はじめてお腹が空いたことが理解できるわけです。
多くの情報からスコープすることと、お腹が満たされたという経験が積み重なることで、お腹が空いたということを理解するのですね。
長井 そういうことです。そう聞くと、赤ちゃんがむずかるのもそういう状態なのかと考えられます。身体がモヤモヤしたり、イライラしたり、よくわからないけれど不快感を感じてしまう。そうすると、養育者はお腹が空いているのかな? おむつを替えたいのかな? と慮って食事を与えたりする。赤ちゃんはその対応関係がわかっていないものの、食事を与えられることで、自分の身体のモヤモヤ感やイライラが収まるというように。そうした対応関係が繰り返されるうちに、自分の身体のこういう状態は、食事を得ることで満たされることだということがわかって、その状態に空腹というラベルをつけることになるのではないでしょうか。
発達段階としてはもっと後になりますが、言語発達も同じようにラベルをつけるプロセスだと考えられますね。
長井 まさにそうだと思います。ですから発達障害の方が抱えている難しさは、最初は少なからずすべての人にあるはずです。社会からの意味づけによって、うまく形づくられていけば、いわゆる定型的な発達曲線をたどります。発達障害のある方は、そこがうまく形づけられていないのだと考えられます。もし脳のネットワーク形成や感覚運動経験からモデルを獲得できないと、お腹が空いたかどうかがわからない状態が大人になっても続くのではないかと考えられます。当事者の方は、当人にとっては内受容感覚の知覚や制御こそがクリティカルな問題だとおっしゃいます。発達障害の方について、視線を反らしていてアイコンタクトがとれなかったり、相手が話しているのを遮ったりしてターンテーキングができなかったりと、いわゆる“空気が読めない”ことがよく指摘されますが、そういうことに困っているのは、実は発達障害のある方々ではなく、周囲の定型発達者側なんです。
発達障害の方は理由があって多様な行動をしているのに、定型発達者が自分たちのコミュニケーション作法に従っていないと捉えてしまう。
長井 そうなんです。定型発達者側に暗黙的なコミュニケーションのルールがあるだけで、当事者の方は、そうしたコミュニケーションの違いにはあまり困っていないそうです。その違いを周りが認めればよいのだと思います。
桐原永叔 IT批評編集長 いまの話は、発達障害の人と定型発達の人で情報処理のズレがあるとして、仮に相手も自分と同じようなズレを持っていて一致すれば、それは何の苦痛でもないということですよね。
長井 そういうことです。そうしたコミュニケーションの齟齬は、双方が違う内部モデルを持っているから起こるのであって、両者が同じモデルを持っていれば問題は起きません。そうした当事者の方々のお話を聞いていくと、コアな困難というのは、心拍や呼吸といった身体の内部にあるのだと思います。体温が上がったときにそれを下げることができなかったり、空腹を認識できずになにも食べなくて倒れてしまったりということは、健康や生命に関わることですから。心拍や呼吸などの内受容感覚が重要だということは、東京大学大学院情報理工学系研究科の國吉康夫先生が領域代表を務められた新学術領域研究」構成論的発達科学 1」でも議論されていました。それが2012年に発足していますから、10年ぐらい経て、心拍や呼吸などを計測して内受容感覚をモデル化する現在の私たちの研究に繋がっています。