京都大学情報学研究科教授 谷口忠大氏に聞く
第3回 グランドセオリーとしての集合的予測符号化(CPC)理論
谷口氏は、自由エネルギー原理と能動的推論の枠組みを拡張し、個体と社会のあいだに新たな視座をもたらす「集合的予測符号化(CPC:Collective Predictive Coding)」という仮説を提唱している。この理論は、複数の個体が分散的に予測と更新を行うことで、社会全体がひとつの推論システムとして機能するというものだ。CPCは、人間・AI・社会の知的営為を統一的に説明しうる“グランドセオリー”として、学際的な議論を生み出している。インタビュー第3回では、CPCとこの仮説がもたらす学術融合の議論について聞いた。
谷口 忠大(たにぐち ただひろ)
1978年京都生まれ。京都大学大学院情報学研究科教授。博士(工学・京都大学)。2006年京都大学大学院工学研究科博士課程修了。立命館大学情報理工学部助教、准教授、教授を経て2024年より現職。その間、Imperial College London客員准教授などを歴任。現在、パナソニックホールディングス株式会社シニアテクニカルアドバイザーを兼務し、AI研究開発にも従事。また、一般社団法人Tomorrow Never Knows理事、一般社団法人ビブリオバトル協会代表理事、一般社団法人AIロボット協会(AIRoA)理事、株式会社ABEJA技術顧問、IEEE Cognitive and Developmental Systems Technical CommitteeのChair。専門は人工知能、創発システム、認知発達口ポティクス、コミュニケーション場のメカニズムデザイン。システム制御情報学会論文賞、Advanced Robotics Best Survey Paper Awardなど受賞多数。『コミュニケーションするロボットは創れるか』(NTT出版)、『記号創発ロボティクス』(講談社)、『心を知るための人工知能』(共立出版)、『イラストで学ぶ人工知能概論』(講談社)、『賀茂川コミュニケーション塾――ビブリオバトルから人工知能まで』(世界思想社)、『記号創発システム論ー来るべきAI共生社会の「意味」理解にむけて(ワードマップ)』(新曜社)など編著書多数。
目次
自由エネルギー理論と集合的予測符号化仮説
都築 正明(IT批評編集部、以下――)カール・フリストン1の提唱する能動的推論(アクティブ・インファレンス)2では、知覚は感覚入力に合わせて内部モデルを更新し、行動は環境を変えて予測が成り立つようにするというように、認知と行動とが世界のモデルを保つよう予測誤差を最小化するという枠組みで考えられています。
谷口 はい。予測符号化に基づくアクティブ・インファレンスでは、ベイズ推論の枠組みの中で、個体がどのように自らの世界モデルを形成し、更新していくか、そして予測と突き合わせながら知覚を行い、またそのために行動するかを説明することができます。僕が提案している「集合的予測符号化(CPC:Collective Predictive Coding)」は、この個体レベルの予測符号化を社会的・集団的な文脈に拡張した理論です。つまり、複数の個体がそれぞれの立場で環境の情報を予測し、自らのモデルを更新するとともに、社会で共有する記号システムを更新し合うことで、社会全体として身体を通した世界を符号化した創発的記号システムがたち現れるという考え方です。それが社会とし「分散的なベイズ推論」として行われる。これはまたいわゆる言語ゲームによって支えられる。そこに記号創発のメカニズムが存在するのではないか、という考え方です。
アクティブ・インファレンスの表現能力も万能ではありませんが、とても柔軟です。人間の知的行動には、環境を探索するような能動性が多く含まれますし、また自らにとって得られる価値の高い行動をとろうとする動きも含まれます。これらを統合的に扱うことができます。さらに、しばしば「感情と理性の対立」という議論があるように、意思決定において「感情」は重要な要素です。実は予測符号化の枠組みで整理可能です。情動の社会構成と心理構成両方を取り込んだバレットらの「構成主義的情動理論」がありますが、フリストンのコミュニティからは、感情を内受容感覚3の予測符号化として説明する枠組みが提案されています。つまり、情動さえも予測と更新のプロセスとして理解できるのです。このように、アクティブ・インファレンスの枠組みは、人間の知覚・行動・情動といった多くの現象を一つの数理的構造の上で統合できます。そこにCPCという集合的な観点を導入することで、記号創発システム論へと橋をかけ、これまで断片的だった問題意識を一つの理論的地平の上で語ることができるのではないかと考えています。
先生が学生のころから追究されていたことが、理論として結実しそうだということですね。
谷口 実を結ぶかどうかは、これからの研究次第ですが、ひとつのメルクマールになると期待しています。
自由エネルギー原理4について、フリストンは生命のグランドセオリーだとしていますが、先生はどうご覧になっているでしょう。
谷口 そうですね。自由エネルギー原理をどう定義するか、そしてどこまでの含意をそこに認めるかによって評価は変わると思いますが、根本的にはとてもシンプルなことを言っていると感じます。要するに、「生物や知能は、予測と観測のずれ——予測誤差——を最小化しようとする」という原理です。ただし「予測誤差最小化」という言葉には少し粗いところもあります。誤差というのは距離や量のように単位をもつ概念ですが、僕たちは実際には視覚・聴覚・触覚といった多様な情報を統合して知覚しています。そのとき、物理的な単位に依存してしまうと整合的に扱えない。そこで登場するのが確率モデルです。確率的に表現すれば、情報は無次元化され、異なるモダリティのデータも統合可能になります。そして、この確率モデルの更新を数学的に定式化すると、自然に変分推論の枠組み、すなわち自由エネルギー最小化の形になるわけです。平たく言えば、自由エネルギー原理とは「世界を統計的に学習し、予測を改善していく過程」を表したものです。脳が統計学習を行うシステムだとすれば、それはほぼ自由エネルギー原理と同じ構造をもっています。僕が進めてきた記号創発ロボティクスでも、確率的生成モデルに基づく教師なし学習として記述することができ、予測と統合のメカニズムを同じく説明できます。フリストンがこの理論を打ち出したのは、ちょうど僕が博士号を取得した2006年頃のことでした。記号創発システム論と同時代的にこの理論が立ち上がってきていたことに、後から気づいて興味深く思いました。
CPCを多分野で議論される“学融”理論に
グランド・セオリーがあると、さまざまな学術分野を横断できるとメリットもありますね。
谷口 そうですね。自由エネルギー原理に関しては、その学際的な柔軟さが非常に有効でした。言葉としての「自由エネルギー原理」には、物理学・神経科学・心理学・AI研究など、異なる分野の研究者がそれぞれの文脈で理解し、議論に取り込めるジェネラリティ(一般性)があります。その結果、分野を越えて多様な研究者とつながり、理論を媒介としたネットワークを築くことができたのだと思います。
先生は「学際」ではなく「学融」という言葉を使われています。
谷口 はい。「学際」という言葉は、異なる分野が“接する”というイメージですが、僕が目指しているのはそれをもう一歩進めて、相互に浸透しあい、新しい知の枠組みが生まれる状態です。立命館大学時代にR-GIRO(立命館グローバル・イノベーション研究機構)という新学術領域プロジェクトに採択されました。このプロジェクトには、文化心理学の立場から記号論を研究されているサトウタツヤ先生にも参加していただき、僕の側の「記号創発システム論」とサトウ先生らの「文化心理学的記号論」を融合させる試みをも行っています。そのサトウ先生が、複数分野が単に並列的に協働する「学際」ではなく、それぞれの分野が深く混ざり合い、相互に変容していく「学融」こそが真の学問的進化だという強い信念をお持ちでした。その考え方に大いに影響を受けて、僕自身も「学術融合(学融)」という言葉を意識的に使うようになりました。
記号創発システム論や認知発達ロボティクスも発達心理に近く、いっしょに研究する意義は高そうですし、新しい研究成果が生まれそうです。
谷口 そう思います。僕は、学問の歴史は方法論の歴史でもあると考えています。つまり、何を研究するかという「対象」だけでなく、それをどう捉え、どんな枠組みで理解しようとするのか――その方法の発展こそが、学問を進化させてきたのだと思うのです。CPC(集合的予測符号化)は、まさにその方法論的な共有基盤になりうると考えています。予測符号化の考え方は、脳科学の分野では神経回路の活動を、心理学では認知や情動のダイナミクスを、そしてロボティクスでは身体と環境の相互作用を、それぞれ統一的なモデルで扱うことができます。これらをCPCの視点から結び直せば、人間や社会の知的な営みを、単一の原理のもとに理解することが可能になる。そうした“学融”的”な展開が、今後ますます重要になると思っています。
たとえば教育心理の分野では、発達理論の後は教授法などの各論が中心になります。記号創発システム論のお話を伺うと、人の発達を定量的に説明できることで、認知心理の分野も大きく拓けるのではないかと感じます。文系/理系の別を超えてコラボレートされると、特に文系サイドの人たちに大きな発見があるのではないかと思います。
谷口 ちょうど先週、チェコのプラハで開催されたICDL(International Conference on Development and Learning)という国際会議に参加してきました。これは浅田稔先生たちが開拓された認知発達ロボティクスの分野を中心とした学会で、来年度は京都で開催され、僕がGeneral Chair(学会委員長)を務めます。こうした場では、まさに“学術融合”や“学際的連携”の難しさを日々感じます。特に重要なのは、どの程度の結合で分野同士をつなぐかというマネジメントです。すなわち「強結合」にするのか、それとも「緩い結合」にするのか。文系/理系の別もそうですが、人文社会や教育・心理の研究者にロボットの実装を一緒にやろうといってももちろんうまくいきませんし、逆に工学の研究者が子どもの実験に関わるのも大きな負担になります。だからこそ、それぞれが自分の強みを持ち寄って接続することが大切なんです。コラボレーションにも段階があって、ツールを提供しあう、インスピレーションを与えあう、あるいは作業レベルで共同する——といった多様な関わり方があります。僕自身、いろいろと考える中で、記号創発ロボティクスの研究においては、現在はお互いにインスピレーションを与え合い、理解を共有する「緩い結合」の方をイメージしてきました。「強い結合」が逆に研究を停滞させてしまうことさえあることは、意識されてもいいかもしれません。
1900年代半ばにサイバネティクスについて話し合われたメイシー会議のように、多分野の研究者が一堂に会する機会があると議論が活発になりそうです。ノーバート・ウィナーやフォン・ノイマンのような数学者のほか、クロード・シャノンのような情報学者やローマン・ヤコブソンのような言語学者がいて、文化人類学から臨床心理学に転じたグレゴリー・ベイトソンがいたりするような。ベイトソンについていうと「情報とは差異を生む差異である」という考えかたなどは、先生の研究と響き合うものがありそうです。また、条件づけとしての学習Ⅰからメタラーニングである学習Ⅱ、学習の枠組みを変容する学習Ⅲに至る学習段階も、先生の定義されるシステム0からシステム3までと重ね合わせて考えると面白そうです。
谷口 1940年代から1950年代にかけて、AIが立ち上がったころに学際性とロマンを持って問われたことについては、ほとんどLLMや生成AIにおいて回収できたのではないかと考えています。当時の大きなクエスチョンだったことについてはある程度実装することはできていて、次のフェーズに入ってきていると思います。これから必要なのは、LLMや生成AIの能力そのものを競うことを超えて、知能の本質に再び立ち返るための学術融合的な対話だと思います。「人間とは何か」「知とはどのように社会と結びつくのか」といった根本的な問いを、工学・哲学・心理学・人文学がともに共有し、そのうえで「よりよい人間理解」と「よりよい社会設計」を構想していく必要があります。
僕としては、このCPC理論がグランドセオリーになるということに賭けています。この春には、さまざまなプロジェクト予算を投入してCPCと記号創発システム論を集中的に議論するCPCスプリングキャンプという研究合宿を開催しました。結果的にはシニアの研究者もいらっしゃいましたが、偉い先生を旗頭にするのではなく若手の研究者や学生など前向きにこの議論に乗ってくれる人ばかりを集めて、2泊3日の白熱した議論を行いました。外部予算獲得ではなく新しいムーブメントのための催しで、このキャンプからさまざまな展開が広がっています。それこそが、かつてのメイシー会議に通じる、「21世紀の知のルネサンス」を生み出す第一歩になるのではないでしょうか。