京都大学情報学研究科教授 谷口忠大氏に聞く
第2回 ロボティクスが接地させる動的な認知情報

FEATUREおすすめ
聞き手 都築正明
IT批評編集部

1990年代から2000年代にかけて、複雑系やカオス理論が人気を博する時代のなかで学生時代をすごしてきた谷口氏は、身体と環境との相互作用を軸に知能をとらえなおす研究を少しずつ展開していった。身体を持つロボットを通じて、実世界との相互作用から意味や記号がどのように生まれるのか――その生成過程を動的にモデル化する“記号創発ロボティクス”。それは、知能や心を理解するための構成論的アプローチであり、知と身体、環境のあいだに生じる「意味のダイナミクス」を記述しようとする試みである。

谷口 忠大(たにぐち ただひろ) 氏

谷口 忠大(たにぐち ただひろ)

1978年京都生まれ。京都大学大学院情報学研究科教授。博士(工学・京都大学)。2006年京都大学大学院工学研究科博士課程修了。立命館大学情報理工学部助教、准教授、教授を経て2024年より現職。その間、Imperial College London客員准教授などを歴任。現在、パナソニックホールディングス株式会社シニアテクニカルアドバイザーを兼務し、AI研究開発にも従事。また、一般社団法人Tomorrow Never Knows理事、一般社団法人ビブリオバトル協会代表理事、一般社団法人AIロボット協会(AIRoA)理事、株式会社ABEJA技術顧問、IEEE Cognitive and Developmental Systems Technical CommitteeのChair。専門は人工知能、創発システム、認知発達口ポティクス、コミュニケーション場のメカニズムデザイン。システム制御情報学会論文賞、Advanced Robotics Best Survey Paper Awardなど受賞多数。『コミュニケーションするロボットは創れるか』(NTT出版)、『記号創発ロボティクス』(講談社)、『心を知るための人工知能』(共立出版)、『イラストで学ぶ人工知能概論』(講談社)、『賀茂川コミュニケーション塾――ビブリオバトルから人工知能まで』(世界思想社)、『記号創発システム論ー来るべきAI共生社会の「意味」理解にむけて(ワードマップ)』(新曜社)など編著書多数。

目次

ロボティクスを用いて記号を設置させる

都築 正明(IT批評編集部、以下――)先生が学生でいらした1990年代は、複雑系理論やカオス理論が盛り上がった時代でもあります。東京大学の池上高志先生にインタビューさせていただいた際に、池上先生が京都大学人文科学研究所にいらした安冨歩先生たちといっしょに立ち上げられた研究会がきっかけだと伺いました。

谷口 1990から2000年代までは、AIという言葉が試練のなかにあった時代だったといえるでしょうね。AIというものの意味合いは2度ほど変わっていて、20世紀のあいだはAIという言葉は「記号的AI」のことを指していて、論理推論やエキスパート・システム、オントロジーを想起する言葉でした。AIの黎明期から計算機科学でAIを実現するというなかで、計算機科学の基底にある記号論理をベースにすると、そういうふうに考えがちなので、あまり変わっていなかったのかもしれません。AI冬の時代とよばれる時期では、AIという言葉は「SFの世界の言葉」のような雰囲気がどこかあって、学会では「怪しげな言葉」のように取られる時期がありましたね。パターン認識や機械学習の研究者は人工知能やAIという言葉を使うのを避けていたように思います。1990年代から2000年代前半を通して、にニューラルネットワークやファジー、GA(Genetic Algorithm:遺伝的アルゴリズム)、また複雑系やカオス理論などが盛り上がってきました。そのなかで、大阪大学の浅田稔先生が「認知発達ロボティクス」を提唱して、ソニーの藤田雅博さんらと共にロボカップをつくったりしていましたね。藤田さんらがソニーからAIBOを作って発売していたのもその時期です。まさに僕の大学院生の時代はAIBOが人気だった時代と重なりあっています。

先生も、そうしたところに関心を抱かれていたのでしょうか。

谷口 そうですね。そうしたことを気にしつつも、修士・博士時代にはウンベルト・マトゥラーナとフランシスコ・ヴァレラの提唱したオートポイエーシスを始めとしたシステム論に惹かれまました。また博士1回生のときに、西垣通先生が『基礎情報学』という書籍を出されました。読んでみたところ、僕が当時、重要と思っていたオートポイエーシスやピアジェなどの名前が並んでいて驚きました。生命や記号など、僕が独自に取り込んできた思想や思考の道具立てが、とても似通っていたのです。そこから西垣先生のことは意識はしていたのですが、特に師事しにいくというようなムーブはしませんでしたね。ちゃんと見せられるものができてから行こうと。特に『基礎情報学』の議論枠組みでは届かない部分があると感じていたので、そこを埋めるような議論ができてから、持っていこうと思っていました。

どのようなことでしょう。

谷口 コミュニケーションや言語における接地の問題ですね。そうしたことは、認知言語学について強く感じてもいました。認知言語学は言語学に認知の領域を取り込むのですが、やはり学術的方法論としてテキストだけを扱う以上、スキーマなどの概念を使っても、身体そのもののリアリティや物理的・感覚運動的情報を直接的に議論に組み込めるわけではない。身体性が重要なのですが、それを実データや物理現象に接地できるような回路を学術的に持てないと、言語的記述のうえでの議論に留まってしまうということです。

ではどうすればよいのでしょうか。

谷口 身体というリアルな存在を、学問の理論体系に位置づけるためにはには、身体を学理上のモデルに接続する、つまりロボティクスを加えればよいわけです。身体性を持つロボットと機械学習のモデルを「言語」に関する議論に接続すれば、それまでの議論を実世界とつなげることができます。物理において、それまで言語的記述だけでディスカッションしてきたことを、デカルトやライプニッツ、ニュートンなどが数理モデルで拡張してきたわけですよね。座標系や微分方程式によって花開いた物理学があるわけです。さらに、かつては手計算や数学モデルの解析で行ってきたことを、20世紀の中盤からは計算機で数値シミュレーションすることができるようになった。計算機にデータを読み込ませてシミュレーションすることは、学問の記述様式をさらに広げたわけです。しかし、実世界と相互作用しながら動き続けることが知能の本質であるならば、シミューションを更に拡張する必要があります。それがロボットです。感覚運動系を持ち、実世界の情報を取り込みながら、知のダイナミクスを記述するモデルを動かし続ける。記号創発ロボティクスのようなロボットを用いた構成論的アプローチでは、環境と相互作用をしつつ変わりゆく存在としての、人間の知能を学術的に「記述」することができるのです。

動的な認知を記述し行為主体性をさぐる

動的なオートポイエーティックなことまでを、仮説として実証することができるということになるのでしょうか。

谷口 オートポイエーシスをどこまで議論するかですが、環境との相互作用に基づく知能を、動的なモデル化して記述することができるようになります。僕たちにとってロボットと計算機は紙と鉛筆の延長だとよく言います。僕たちは人類の科学史を通して、紙と鉛筆をつかって言語的なモデルをつくったり、微分方程式を計算したりしてきました。微分方程式は、あくまでも紙の上のインクの列に留まっていて動きませんが、計算機に入力すると、それが動きだすわけです。その意味では、いまのLLM(Large Language Model:大規模言語モデル)のように、ニューラルネットワークに大量のデータを自己教師あり学習で学習させて、知能を得ていく方法は、ここまで僕が言ってきたことととても親和性があります。ですから、昔の記号的AIに比べると、いまのAIについて批判的な意見は相対的にはとても少なく、昔の考えかたに比べると、「なんて正しいのだろう」という感慨を覚えるほどです。

プログラム言語だけで静的な計算処理をしていたことに比べると、LLMが扱う言語そのものはある程度は身体に即したヒューマンなものだということでしょうか。さらにマルチモーダルな情報を入れ込むことで、トップダウンとボトムアップとの界面がみえてくるという。

谷口 ええ、マルチモーダル情報というよりは、運動して環境の中で生きる存在という側面が大事かもしれません。そこからロボットの「行為主体」としてのあり方を見出したいと思います。僕たち人間もそうですが、AI研究は視覚と聴覚といったモダリティに偏りがちです。五感のなかでも、実は、視覚情報と聴覚情報は動作をしなくても受け取ることのできる情報です。そのため認知というのは基本的に受動的なセンシングだと思われがちですが、触れるというハプティクス情報は、動作をしなければ取得できないものです。また視覚情報も、実際は覗き込んだりした動きとの差分で認識しているので、やはり動くことが重要であると思います。生物進化の観点から見れば、僕たちは生き延びる(サバイブする)ために世界を認識し、モデル化してきた存在です。外敵の声に敏感であるのも、段差に注意して転ばないようにするのも、生存のための知覚です。世界を知るとは、単に外界から情報を受け取ることではなく、生き延びるために自ら動き、環境と相互作用しながら世界を“つくり出している”ということなのです。

動的なものに注意を向けて、また自分も行動しなければサバイブできないということですものね。先生は、2000年代に盛り上がったアフォーダンスについてはどう考えられますか。

谷口 アフォーダンスは重要な概念だとは思いますが、いろいろと再考の余地はある気がしますね。ちなみに、ロボティクスの分野では、アフォーダンスという言葉の意味も二転三転して換骨奪胎されているのですが。本来は対象を「行為」で認識することです。わかりやすい例として、椅子が挙げられます。椅子とは何かというと「座ることができるもの」ということですねです。古典的なAIでは「脚が4本あり、座面がある」といった静的な特徴で定義して、それを椅子として認識するようにしていましたが、それはなかなか上手く動かなかったわけです。実際にはそうではありません。足がなくても、座ることができればそれは椅子たりうる。つまり、対象の意味は行為との関係によって決まるのです。

ディレクターズチェアのように、フレームと布だけでできている椅子もありますね。

谷口 僕がよく例に出すのは、駅などにある横にバーだけがあるものです。あれも座るという身体の動作を促す椅子です。でも、aiboのような4足ロボットにとっては「座れない」のであれは椅子ではありません。そう考えると、形状のみで定義するかつての椅子の概念だけから椅子を定義することはできなくなってきます。このように、記号創発的な話をするうえでは、世界の分節化と身体とがどのような関係を持っているかということが重要になってきます。そうしたことを考えると、単にマルチモーダル情報が入ればよいというわけでないわけですね。