AIは「意識」をもつのか?
第2回 AIにも適用できる可能性がある「意識の統合情報理論」とは?

AIの意識に迫る本連載の第2回では、統合情報理論とはどのような理論なのかについて大泉氏に聞いた。
取材協力 大泉匡史・東京大学大学院総合文化研究科広域科学専攻広域システム科学系自然体系学講座 准教授
取材:2024年11月16日 東京大学駒場キャンパス大泉研究室
![]() |
大泉匡史(おおいずみ まさふみ) 2005年、東京大学理学部物理学科卒業。2010年、東京大学大学院新領域創成科学研究科にて博士取得。2019年4月より東京大学大学院総合文化研究科広域科学専攻 准教授。共著に『 |
執筆者プロフィール
松下 安武(まつした やすたけ)
科学ライター・編集者。大学では応用物理学を専攻。20年以上にわたり、科学全般について取材してきた。特に興味のある分野は物理学、宇宙、生命の起源、意識など。
目次
「意識が生じるネットワーク」と「意識が生じないネットワーク」
デジタルカメラは意識をもつか?
前回も簡単に紹介したが、統合情報理論は、意識の研究において近年大きな注目を集めている理論である。基本的には人間の脳の意識についての理論だが、対象は必ずしも脳に限っていない。ネットワークが「統合情報量(integrated information)」(詳細は後述する)というものをもてば、そこには大なり小なり何らかの意識が生じるはずだと考える理論なのである。つまり、AIの意識についても論じることができる可能性をもった、数少ない理論の一つだと言える。
大泉 ただし、現状の統合情報理論は、脳やAIの意識について確信をもって議論できる段階ではありません。まずは人間の脳の意識について十分に説明できるという段階を実験などによって今後クリアしていく必要があります。以下での議論は、そういった段階の理論を前提にしたものだということを念頭においていてください。
統合情報理論が考えるのは、脳の内側で起きている情報のやり取りです。ニューロン(脳の神経細胞)が電気的な活動を起こして、さらにつながった別のニューロンを活動させる。そういった情報のやり取り自体を考えるわけです。統合情報理論では、このようなニューロンどうしの因果関係こそが意識に関係する情報であると考えます。その情報の量を数学的に表したものが「統合情報量」であり、統合情報量が大きいほど、意識の量、つまり意識レベルが高いと考えます。
まず脳がもつ「情報」について考えてみよう。例えば、私たちがトイプードルを見て、それが意識に上ったとき、脳のニューロンのネットワークはそのトイプードルに関する様々なクオリア(色、形、においなど)を反映した活動パターンを示していると考えられる。
大泉 私たちの脳は外界の様々なものを見て、それらをちゃんと区別して認識できます。それは脳、すなわちニューロンのネットワークの活動パターンで表現できる情報の種類が非常に豊かだということを意味しています。もしニューロンのネットワークが表現できる情報の種類が少ないと、例えばイヌを見てもネコを見ても、ニューロンのネットワークは同じような活動パターンになってしまい、イヌとネコを区別できないでしょう。
統合情報理論で鍵を握るのは、単なる情報ではなく、「統合された情報の量(統合情報量)」である。この場合の「統合された(integrated)」とはどういう意味だろうか?
例えば、赤いリンゴの「赤色のクオリア」だけを取り出して認識することはできない。リンゴという丸い物体の形の情報と、リンゴの赤色の情報は私たちの脳の中で「統合」されているのだ。
大泉 デジタルカメラを考えてみてください。デジタルカメラは膨大な数のフォトダイオード(光検出器)が集まってできています。たくさんのフォトダイオードを密に並べれば、人間の眼よりもはるかに精密なものだって作れます。外の世界を非常に精密に表現できるものを簡単に作れるわけです。
ではそのようなデジタルカメラに意識はあるのかというと、直感的にはおそらくそういった意識はもっていないと多くの方は考えるでしょう。統合情報理論でもデジタルカメラに意識はないと考えます。
すべてのフォトダイオードは独立していて、互いに情報のやり取りがありません。これはデジタルカメラがもつ情報が「統合されていない」ということを意味しています。デジタルカメラの統合情報量はゼロなのです。つまり、統合情報理論に基づく限り、単純なデジタルカメラは意識をもってないだろうと推測されます。
一方で、私たちの脳では、ニューロンどうしが活発に情報のやり取りを行っています。これは情報が「統合されている」ということを意味しています。脳は統合情報量が極めて大きなシステムだと考えられます。例えば、私たちは目の前の右側の視野と左側の視野を別々に認識することはできませんが、これは右側の視野の情報と左側の視野の情報が脳の中で統合されているからです。
統合情報量とは、非常に大雑把に言うと、そのネットワークが表現できる活動パターンの多さと、その活動によって生じるニューロン間の因果関係を定量化したものだと言える。実際の統合情報量の値は、ニューロンどうしのつながりの強さをもとに計算される(詳しくは図2-1~図2-3を参照)。
図2-1 ネットワークの統合情報量①
矢印は別のニューロンとのつながりを表わし、矢印の太さはつながりの強さを表わしている。Aのネットワークでは全体がつながっているため、一部の影響が全体に伝わる。このようなネットワークは「統合されている」と言える。
一方、Bのネットワークでは、上側と下側がつながっていない。そのため、上側の影響は下側には伝わらないし、下側の影響は上側には伝わらない。このネットワークは上側と下側が統合されておらず、「二つのモジュール(機能単位)に分かれている」と言える。各モジュールはAのネットワーク全体と比べると、ニューロンの活動パターンのバラエティーと因果関係が少なく、統合情報量は小さい。
図2-2 ネットワークの統合情報量②
Aのネットワークはニューロンどうしのつながりの強さにバラエティーがある。そのため、ネットワーク全体の振る舞いは複雑になり、様々な活動パターンを示すことができる。このようなネットワークは統合情報量が大きい。
一方、Cのネットワークはすべてのニューロンのつながりの強さが均一でバラエティーがない。そのため、ネットワーク全体の振る舞いは単純なものとなり、活動パターンは限定的になる。このようなネットワークは統合情報量が小さい。
図2-3 ネットワークの統合情報量③
D.フィードフォワードネットワーク:入力された情報が一方向にのみ伝わっていき、出力に至るようなネットワーク。実際のAIでは、静止画の解析など時間を含まない用途に向いている。統合情報量は小さい。
E.リカレントネットワーク:情報が一方向だけではなく、出力が後戻りして再び入力されるような構造をもったネットワーク。過去の情報をもう一度、入力に戻して使うことができるので、実際のAIでは、文章の前後関係を読み取るなど、時系列を考慮する必要がある用途に使われる。統合情報量は大きい。