言語の到達点としてのLLMと、そこから見えないもの
――ジャーナリスト・服部桂氏に聞く(1)
桐原永叔(IT批評編集長)
2022年11月30日にOpenAIからChatGPTが公開されてから、明くる2023年は生成AIが大いに話題となった1年だった。テック業界では「AIの民主化」と言祝がれる一方、ホワイトカラーの職が失われるのではないかという「AI脅威論」も大いに話題となった。本特集では、多くのデジタル・テクノロジーの重要人物と親交を結び、国内に紹介してきたジャーナリスト服部桂氏を迎え、人類とテクノロジーという幅広い視座からデジタル・テクノロジーを眺望する。
取材:2023年10月26日 トリプルアイズ本社会議室にて
服部 桂(はっとり かつら) 1951年生まれ。早稲田大学理工学部で修士取得後、1978年に朝日新聞社に入社。1984年にAT&T通信ベンチャーに出向。1987年から1989年まで、MITメディアラボ客員研究員。科学部記者や雑誌編集者を経て2016年に定年退職。関西大学客員教授。早稲田大学、女子美術大学、大阪市立大学などで非常勤講師を務める。著書に『人工生命の世界』(オーム社)、『マクルーハンはメッセージ メディアとテクノロジーの未来はどこへ向かうのか?』(イースト・プレス)、『VR原論 人とテクノロジーの新しいリアル』(翔泳社)他。訳書、監訳書に『デジタル・マクルーハン―情報の千年紀へ』、『ヴィクトリア朝時代のインターネット』、『チューリング』(以上、NTT出版)、『テクニウム――テクノロジーはどこへ向かうのか?』(みすず書房)、『〈インターネット〉の次に来るもの 未来を決める12の法則』(NHK出版)、『アナロジア AIの次に来るもの』(早川書房)、最新の訳書に『ホールアースの革命家 スチュアート・ブランドの数奇な人生』(草思社)。 |
目次
音楽と言葉、電子工学を架橋した青春時代
都築 正明(以下、――) まず、服部さんのライフヒストリーをお聞かせください。
服部 桂氏(以下、服部) 小学校から高等学校までは同じ国立校に通いました。とても自由な校風で、のびのびと過ごすことができました。中学校からは、東京オリンピックで注目を集めたこともあって、サッカー部に入りました。一方、天文研究会にも所属して、望遠鏡を作って天体観測をしたり、天体写真を撮影することにも凝っていました。当時は学生運動やベトナム反戦運動が盛んでしたから、フォークギターを手にPPM(ピーター・ポール&マリー)などのプロテストソングを歌ったりもしていました。
――音楽については以前から素養があったのですか。
服部 3歳のころから高校までバイオリンを習っていました。また小学校は「カルミナ・ブラーナ」などの楽曲で有名なドイツの作曲家カール・オルフの提唱した「子供のための音楽教育」に基づいたクラスに入れられチェロを担当して、オルフ自身が来日した際にはNHKホールで演奏もしました。さらに高校ではオーケストラでバイオリンを弾いていました。
――メディアに関心を持たれたのも、そのころですか。
服部 私がメディアにかかわることに大きく影響を与えたのは、高校生のときに映画を制作したことです。1968年にまず、スタンリー・キューブリック監督の「2001年宇宙の旅」に衝撃を受け、その後モントリオール万国博覧会でマクルーハンのメディア論をマルチ・スクリーンで映像化するという記事を読んで、自分でも新しい形の映画をつくりたいと思ったんです。ストーリーは、宇宙人が学校を乗っ取るというもので、ゴダールの「アルファヴィル」やイギリスの「プリズナーNo.6」という不条理SFドラマに影響を受けたものでした。それを2本の8ミリ映画と4枚のスチール写真で表現しました。その後は映画監督を目指そうと思い、パリの映画博物館の前に住んでいたこともあります。
――高校卒業後は、どうされたのでしょう。
服部 実家が開業医だったので医者になるよう言われていたのですが、そこへの反発心がありました。医学部に向けた教育を受けていましたが医学部は受けずに、理系科目で受験できる早稲田大学理工学部に入学しました。子どものころに電子工作が楽しかったことから電子通信科に入ったものの、勉強はせずにジャズ研究会をはじめ音楽系のクラブを掛け持ちしていました。途中で勉強に飽いてしまい、休学して1年間ヨーロッパを放浪したりしていました。復学して4年次に卒業論文のテーマを万葉集に使われていた上代日本語の音韻研究にしました。奈良時代には日本語には文字がなく、漢字を充てた万葉仮名を使っていたのですが、そこでは母音「イ」「エ」「オ」にそれぞれ2種類の漢字が充てられています。母音が現在の5種類ではなく8種類あったということです。
――現在はワ行におかれている「ヰ」「ヱ」「ヲ」にあたる音ですね。
服部 母音が8種類あって、それぞれ異なる発声が行われていたとすると、例えば子音をつけたカ行でも「キ」「ケ」「コ」が2種類ずつ存在し8つの発声があったと考えられます。こうした音韻学でいう甲類・乙類の区別や、離島に残っている音について文献を調べたりもしました。万葉集の歌をデータ化し、それをコンピュータで多変量解析して、その出現頻度や音ごとの近さを調べて、失われたとされる乙類の母音の性質に関する研究を卒業論文にまとめました。論文を国語学会に送って発表もし、指導教官から「それは理工学部で扱う話ではない」と言われたりもしましたけれど、どうにか卒業することができました。
――どうして音韻に関心を持たれたのでしょう。
服部 音楽に関わっていたことが大きいのだと思います。オーケストラにもいましたし、ジャズをはじめさまざまなバンドにもいましたから。現代音楽を演奏するためにコンピュータを使うアルバイトもしました。さらにコンピュータを使って民族音楽を採譜したり自動的に作曲をして演奏する電子楽器もできないかと研究していました。
――当時のシステム環境はどのようなものだったのでしょう。
服部 プログラムをパンチカードで処理してラインプリンタで出力する時代でした。プログラムを1本コンパイルして実行するのにも時間もお金もかかりましたが、そこでコンピュータの動作原理を知り、当時開発されたマイクロチップを使ったマイコンも作ったことから、現在のコンピュータやデジタルメディアの将来について考えられる基礎は学べたと思います。
――卒業後は、どうされたのでしょう。
服部 理工学部でしたから、電機メーカーなどに就職するのが一般的な進路ですが、当時は石油ショックの影響ですんなり就職できないような状況で、会社員になるのも嫌だったので大学院に進みました。卒業後は何か一般の会社にはない雰囲気を感じたので朝日新聞社に入社して、さまざまなことに携わりつつ定年まで過ごすことになります。
人類史のタイムスパンからテクノロジーを概観する
――お話を伺うと、マクルーハンが指摘したメディアの聴覚から視覚への転換を服部さんご自身が辿られているようにも見受けられます。
服部 私は大修館書店が発行していた「月刊 言語」を創刊号からすべて持っています。自分でもなぜそこまで言葉に強い関心を抱いてきたかの理由がわからず、海外経験を通して外国語を学んできたせいだと思っていました。しかし最近になって、言葉こそが人間の知の基本要素であるせいで、興味を持つことになったのだということに思い至りました。そのうえで『アナロジア AIの次に来るもの』(ジョージ・ダイソン著/ 服部桂監修/橋本大也訳 早川書房)の解説にも書いたように、私たちが現代の文明として認識しているのは結局のところ、言語の所産に過ぎないのではないのかと考えるようになりました。その言葉の処理を自動化して行うために行き着いた先がAIであり、LLM(Large Language Model:大規模言語モデル)だと思い、その後に来るものを考えるようになったのです。
――AIについて解説した書籍は多く刊行されていますが、ほとんどが1956年のダートマス会議の話題から書きはじめられています。コンピュータについてはノイマン型コンピュータやENIACなどハード面から解説されることが多いです。
服部 まずそもそも計算するとはどういうことか、ということから考えなければ、コンピュータの存在意義はわかりません。人類の歴史から考えると、人間がサルから分化したのは旧石器時代からです。諸説ありますがこれを仮に約300万年前だとします。その後、言語を発明したのは新石器時代の約3万年前とされています。クロマニョン人によってアルタミラやラスコーの洞窟絵画が描かれた時代ですね。この時代には人類が声帯を発達させて言葉を話すようになり、さまざまな種類の石器を用いるようになり、絵を描いたりもするようになり知能が発達しました。さらに3,000年ほど前にはアルファベットのような文字が発明されています。グーテンベルクが活版印刷を実用化したのは15世紀ですが、一般に普及した時期を科学革命が起きていた300年前として考えます。パソコンやスマートフォンの時代がはじまったのは最近のほぼ30年の期間です。非常に大まかな数字ではありますが、それぞれ10分の1ずつのタイムスケールで人類の文化が大きく変化しています。人類300万年の歴史の中で、言葉を使うようになったのはそのたった1%の期間にすぎません。さらに文字を使うようになったのは0.1%という、つい最近のことなのです。4大文明といっても人類史からすると無文字文明を含めると、ごく最近のことにすぎず、その後に言語を精緻にしていくことで、筋道を立ててものを説明できるようになり、法律を成文化して、人間がそれに従うようになったにすぎません。
――知というものが言語を用いてシンボライズされるとともに、権威づけもされていくことになるわけですね。
服部 数字についても13世紀になってヨーロッパでアラビア数字が用いられるようになります。それらを活版印刷で整理して、書き文字が大量にコピーされていったことから科学革命がおきました。そして啓蒙時代に百科全書も作られて知識が整理されてテクノロジーが進み、産業革命がおこるわけです。そのように言葉が精緻化されていって、行き着いた先がコンピュータのアルゴリズムだと考えられます。
――論理だけを取り出して抽象化させていったわけですね。
服部 それは言語の情緒的な側面を排して「このような場合には、こうしましょう」というルールを積み重ねて結論を出すというプロセスを、法律のように文書化して手順を定め、機械にさせているだけです。原理的には言葉の判断をコンピュータによって高速化しているだけですから、時間さえかければ人間にも同じ計算をすることができます。
知を書き尽くそうとする文字言語の系譜と限界
――現在はLLMをはじめとした生成AIブームといってよいと思いますが、服部さんからしてみると言語文化の1断面にすぎないという考えかたですか。
服部 実用面においては処理スピードはとても重要です。有限の時間しかない生物としての人間が、一生のうちにどれだけチョイスを持てるかに大いに関係するからです。生成AIはそうした言語ができる話を高速にいくつもこなしてくれ、われわれを豊かにしてくれます。人間が他の動物に先んじて進化できたのは言語のおかげで、この3,000年ぐらいの期間に書き言葉ができて、言葉が精緻化していくなかで書かれた知が印刷本で普及して体系化し、さまざまな学問分野が生まれ、そうした総体が教養や文明と考えられて来ました。しかしそうした世界で、なにがどの書物に書かれているかという知識に裏打ちされた学者の持つ権威は、いまではGoogle検索にとって代わられています。そこで私は、コンピュータとはこうした文明の基礎にある言葉というものの働きを、外部化して機械化したものに過ぎないと考えるようになりました。
――私たちは言語を所与のものとして考えていますし、記述されたものを文化だと考えています。しかし人類史からみるとそれはごく短いスパンで用いられているものにすぎないし、コンピュータはそれを外部処理しているものにすぎない、ということですね。
服部 そうなんです。私たちは3歳ぐらいから言葉を話しますから、言語と文明との関係を無意識に当然のもののように思っていますが、人類史からみれば最近使われるようになったものにすぎず、生命史から考えると極めて限定されたものです。言語に似たものを用いる動物もいますが、人間だけがそれを精緻に精密にしてコンピュータという機械に処理させるまでになったのです。
――私たちが文化やテクノロジーとして認識しているものに通底しているのが言語であるということですね。
服部 私自身が言葉に興味を抱いていた理由が、人間文化のキーとして言語がほぼすべての知の共通項であり最もユニバーサルな存在であることに魅かれたからだったことに気付いたのです。宗教は無文字時代にもありましたが、紀元前500年頃に論語や仏典が記されるようになり、1世紀にはキリスト教、7世紀にはイスラム教が加わって3大宗教が誕生して以降、言語でどこまで説明できるのかを追求してきたのが人間の文明だともいえます。ユダヤ教のカバラでは、神の創造した世界を1冊の本とみなしてこれを読み解こうとする神秘主義や数秘術が生まれました。しかしほとんどの人は文字の読み書きはできず、神の言葉や原理を知っているとされる人が魔法使いとして尊敬されているような時代がずっとつづきました。そしてやっと科学革命の時代を経て、『アナロジア』の冒頭で言及されているライプニッツは、中国の易経の陰陽論から着想して数字を0と1で表す2進法も提唱しました。また実際に、歯車によって四則演算を行う機械式の初のデジタル式計算機を構想しています。
――17世紀に、現在のデジタルに至る発想がすでになされていたわけですね。
服部 そのライプニッツの後、18世紀には合理主義にもとづく啓蒙思想のもとでフランス革命が起こり、19世紀には産業革命が本格化し、知識が経済学や社会学、物理学や生理学などの学問分野に分化しました。19世紀後半にはそれらをすべてまとめて、体系化された言葉によって、学問の学問として総合的にすべての知を交換できるかということが考えられるようになりました。数学者のジョージ・ブールは論理代数を提唱し、近代論理学の祖ともされるパースやフレーゲに続いてバートランド・ラッセルは論理主義から記述理論を示し、その後、世界をすべて数学で記述できうるというヒルベルトのような論理主義の権化のような人も現れました。数学で記述して解答を求めるというのは、まさにプログラムの発想ですよね。言語学というのはもともと宗教と深くかかわっていたのですが、より科学的な見地から言語が注目されるようになり、ソシュールなどは言語の構造に着目する記号論を提唱しました。
――抽象化した言語によって記号操作を行おうとしたわけですね。
服部 そうです。そうした言語至上主義を、そのまま機械に実装したのがコンピュータです。しかし言語的な数学論理は万能でもユニバーサルな存在でもなく、実のところでは、コンピュータの原理をつくった1人であるアラン・チューリングはある論理体系の中ではいつまでも解けない問題があることを証明してしまい、クルト・ゲーデルは無矛盾性が証明できないという不完全定理を唱えてしまいます。