即興する心とAIの因果
第3回 “世界モデル”設計の不可能性と可能性

REVIEWおすすめ
著者 都築 正明
IT批評編集部

神経科学者にしてシリコンバレーの起業家であるジェフ・ホーキンスが2002年に著した『考える脳・考えるコンピュータ』は、階層モデルに基づく深層学習の進化に大きく寄与するとともに“世界モデル”に基づくAGI(Artificial General Intelligence:汎用人工知能)の実現を示唆した。しかし17年を経た現在、彼は新たな理論のもとにそれを否定している。彼の到達した“1000の脳理論”とは。

目次

予測する脳と計算するコンピュータ

神経科学と人工知能の研究を行うヌメンタ社の共同設立ジェフ・ホーキンスが、サイエンスライターであるサンドラ・ブレイクスリーとともに著した『考える脳・考えるコンピュータ』(伊藤文英訳/ランダムハウス講談社)は、現在の深層学習に大きな示唆を与えてきた。

ホーキンスは、科学とテクノロジーを架橋する興味深いキャリアを歩んだ人物だ。1959年にニューヨーク州に生まれ、科学誌『サイエンティフィック・アメリカン』の脳特集号を読んで脳の働きに興味を抱いたという。

彼は1979年にコーネル大学を卒業後、まずは資金とキャリアを築くためにインテル社のエンジニアとして勤務しつつ、同社に脳研究の部門を設立しようとするが却下される。

同社を退社後、MITの人工知能研究所への入所を試みるも失敗し、カリフォルニア大学バークレー校の博士課程で学んだものの、脳を学際的に研究することができず、シリコンバレーに戻る。

1992年にパーム・コンピューティング社を設立し、モバイル・コンピューティングの嚆矢とされるPDA“Palm Pilot”を開発する。

このビジネスの成功をもとに、2002年に大規模理論神経科学を研究するレッドウッド神経科学研究所を設立。2005年には同研究所をUCバークレーに移管し、『考える脳・考えるコンピュータ』で展開した自己連想記憶理論に基づくソフトウェア開発を行うヌメンタ社を共同設立し、同社チーフサイエンティストを務めている。

同書では“真の知能”である人間の脳は膨大な記憶を基に未知のことを予測する能力を持つ一方、AIの“人工知能”はプログラムに基づいて動作する根本的に異なる仕組みで動いていることを主張する。

特に人は脳の新皮質において現実世界の構造を記憶し、それを階層的に処理するアルゴリズムを持っていることが強調され、脳の本質を理解できない単純なニューラルネットワークモデルでは“真の知能”には到達できないと述べている。

そして知能の本質は、記憶による予測の枠組みであり、新皮質は現実世界をパターン記憶して、それをもとに未知のことを予測する能力を発揮するとした。

ホーキンスによると、大脳新皮質は階層構造をなしており、知覚情報は下位層から上位層へ伝わるボトムアップの過程で抽象度を高め、上位層から下位層へのトップダウンによるフィードバックによって予測と現実の照合が行われるとされる。

各階層構造においては、

  • 入力された知覚情報から時系列パターンを抽出
  • 過去の記憶と照合して次の入力の確率分布を計算
  • 予測と実際の入力との差異から誤差信号を生成
  • 誤差信号を用いてシナプス結合を修正

というプロセスが実行されている。

例えば視覚情報処理においては、前回記した眼球のサッカード運動で断続的に得られた映像を、この時間的予測によって連続的な認識に変換しているとされる。

このような生物学的なアルゴリズムを実装したニューラルネットワークモデルが、のちに多層ニューラルネットワークにおけるバックプロパゲーション(Backpropagation:誤差逆伝播法)として援用され、AIによる深層学習のブレイクスルーをもたらすことになる。

考える脳 考えるコンピューター〔新版〕

ジェフ・ホーキンス (著)

伊藤 文英 (翻訳)

ハヤカワ文庫

ISBN:978-4150506018

▶ Amazonで見る

1000の脳と座標系

脳は世界をどう見ているのか』(大田直子訳/早川書房)は、『考える脳・考えるコンピュータ』刊行、そしてヌメンタ社設立から17年が経過した2022年に、ホーキンスが脳がいかに予測を可能にするのかを体系づけた著作である。

同書では、動的な人の脳が、同じく動的な世界をどのように認識してモデル化し、学習するのかを“1000の脳理論”という理論を軸に展開される。

“1000の脳理論”は、神経科学者ヴァーノン・マウントキャッスルが1950年代に発表した皮質コラムについての洞察に端を発している。

大脳新皮質に約15万個配されている皮質コラムは、直径約1平方ミリメートルの柱状構造を持つもので、その中にはミニコラムが詰まっており、ミニコラムそれぞれには100個あまりのニューロンが入っているとする。

マウントキャッスルは、この皮質コラムが知能の基本単位だと主張した。皮質コラムはすべて同じような構造をしており、実際に同じ働きをするという。

つまり脳には運動野や感覚野、言語野といった分野は存在せず、それぞれの皮質コラムが独立して物体や概念をモデル化すると考えている。

それぞれ同じ機能を持つ皮質コラムが眼の知覚とつながれば視覚情報を、耳の知覚とつながれば聴覚情報をというように、同じアルゴリズムを持つ多数の皮質コラムが情報処理を行うということだ。

前回紹介したニック・チェイターの論に依拠して考えると、一斉に意味づけを行うと考えることができる。

この前提のもとで、ホーキンスはこうした構造と機能を持つ大脳新皮質が物体や概念の特徴や関係性を把握するために、どのような内的表現がなされているかに着目した。

従来は、特徴を検出してそれを統合することが、物体や概念を脳内で階層的に統合してモデル化することだとされていた。

これに対し、ホーキンスは、思考や知覚、発想はニューロンの活動であり、皮質コラムには多次元的な座標系が構成されていて、知識はその座標系にマッピングされるという“1000の脳理論”を提唱する。

物体の認識は感覚運動モデルであり、人は動くことで物体の全体をモデル化する。

そのように獲得された知識は、座標系に基づいて分散配置されるということだ。私たちの知識は何千もの皮質コラムに分散しているために、脳卒中や外傷などにより一部が欠損しても、脳は機能し続ける。

また各皮質コラムが完全な感覚運動モデルであるために、欠損した知識は修復することができる。

どうして何千ものモデルがあるのに、1つの認知につき知覚は1つずつなのか。それは皮質コラムが絶えず差異を学習し、そのモデルを更新するからだ。

皮質コラムはそれぞれが位置と座標を表現しており、コラム同士の投票行動による合理的な認知を採用することで、全体的に最適なモデルを構成し続けているのだとホーキンスはいう。

脳は世界をどう見ているのか: 知能の謎を解く「1000の脳」理論

ジェフ・ホーキンス (著)

大田直子 (翻訳)

早川書房

ISBN:978-4152101273

▶ Amazonで見る

本来の知能”を獲得するには

ジェフ・ホーキンスは、自身の“1000の脳理論”と照らし合わせながら、ディープラーニングに基づく現在のAIが“本来の知能”である人の知能のような柔軟なAGI(Artificial General Intelligence:汎用人工知能)に結びつくことを否定している。

まず、現在のAIはデータ内の静的な世界のみに依拠しているために、物理的な環境との直接的な関わりを持たず、人間の脳のように眼や手を動かしながら動的に物体の形状や特性を学習する感覚運動学習ができず、抽象的な概念を現実に適用する能力に限界があるとする。

人の脳が絶えず世界のモデルを更新しているのに対して、AIはデプロイまでに相当な学習を要し、またデプロイ以降は追加の学習を行うことが困難であることを挙げる。

また、脳が皮質コラムの構造により多次元座標系を形成して物体や概念の空間的・機能的関係をモデル化することに対し、生成AIはデータから抽出された統計的パターンに基づく出力しかできない。

ホーキンスは、AIには座標系に基づく予測メカニズムが欠如しているため、状況に応じた柔軟な推論を行えないと指摘している。

さらに彼は、脳の大脳新皮質が数十億のパターン認識ユニットの協調による複数の感覚入力と運動出力を統合するのに対し、この複雑な協調システムの生物学的複雑さを数理化することの困難さを指摘している。

また人間の脳は20ワット程度の消費エネルギーで多様なタスクを処理できるのに対して、GPT-4のような大規模言語モデルは訓練に数百万ドルの電力コストを要することを挙げ、この基盤モデルがまだ特定タスクに特化した工学計算機に留まっており、少ないデータで汎用的なパフォーマンスを発揮する生物学的知能の効率性を再現することにはほど遠いと批判している。

MetaのチーフAIサイエンティストであるヤン・ルカンもまた「AIはまだ“真の知能”ではない」との見解を示している。

本連載第10回で紹介した通り、ルカンは動物の前頭前野のような単一かつ互換可能な世界モデルを持つという仮説に基づいた動的なアルゴリズムを提案している。

これが、ホーキンスが次世代AIとして構想している、大脳新皮質のメカニズムを模して感覚運動システムと世界モデルを統合する“感覚運動AI”と類似したものになるのかは興味深いところである。