東京女子大学現代教養学部准教授・大谷弘氏に聞く
(1)LLM(大規模言語モデル)は「言語ゲーム」的か
(大規模言語モデル)は「言語ゲーム」的か
都築 先生は、前期ウィトゲンシュタインの著作『論理哲学論考』(岩波文庫 以下、『論考』)をどう読まれているのでしょう。
大谷 『論考』は、形而上学を沈黙させることをテーマにした本です。ウィトゲンシュタインは、まず不毛な議論に陥りがちな形而上学の論争を取り除いたうえで哲学を行おうとしたわけです。『論考』に記された個別のセクションを取りあげて、それぞれにどのような洞察があるかを論じる議論も数多くあります。しかし私の場合は『論考』全体で目指しているメタ哲学を把握したうえで、さまざまな議論の位置づけを考えています。『論考』にはまず、明確な記号言語を提示するという意図があります。日常言語というのは曖昧だったり多義的だったりしますから、論理空間のなかで一つひとつの命題が、どの場所にあるのかが見えにくくなっています。『論考』では、そこをクリアに提示する記号言語をいかにして用意するかということが語られています。そして、そういった記号言語が用意されたときに、個別の哲学的対話のなかに、形而上学者の言葉が翻訳できないことが示されれば、形而上学者の言葉がナンセンスだということが判明して、形而上学を「語り得ぬもの」として沈黙させることができる。私としては、言語を明確化していくという課題に向けて書かれている本だという捉え方をしています。
都築 言語の明確化というのは、どういうことでしょう。
大谷 まず命題が、どのように対象物を写し描き出して(写像)いるかということ、そしてどのような論理に従って、論理空間のなかでどんな位置を占めているのかを明らかにするということです。
都築 そうした記号論理学の考え方は、コンピュータのプログラム言語にも反映されていますよね。機械を動かすための0/1や16進数でできた機械語があって、それを使いやすくして、左右に桁をずらすような命令をするアセンブリ言語ができます。その後、それをさらに扱いやすくした高級言語が生まれて現在に至りますが、実際にコンピュータ内部で論理演算をしていることは変わりません。
大谷 当時、記号論理学を使って明確化を行うということは、フレーゲやラッセルといった数学者、論理学者たちがウィトゲンシュタインに先駆けて行っていました。『論考』の体系は非常に禁欲的であり、コンピュータのプログラム言語の前史として考えたとき、その位置づけがどのようなものになるかは興味深い研究テーマですね。
都築 処理を手続き化していくような発想はコンピュータの進化も同じですよね。脳神経回路を記号化したニューラルネットワークを構築して人間の知能を体系的に再現しようとする試みがなされましたから。そこが行き詰まったところで、ビッグデータを強化学習させると体系的なところはわからないけれど正しい結果が出てくることがわかるようになりました。これは、大量の言語コーパスを学習させたところ、なめらかな自然言語を出力するようになった現在のLLM(Large Language Models:大規模言語モデル)につながります。文法的な裏づけがないため、言語学の大家、チョムスキーなどはLLMを「凡庸な悪」として批判するわけですが。
大谷 脳に言語に特化したモジュールが生得的に備わっているというチョムスキーは演繹的なモデルを考えているわけですよね。そうするとパフォーマンスの部分がブラックボックスになってしまう。後期ウィトゲンシュタインはパフォーマンスの部分に注目していますから、矛盾するとはいわないまでも、注目する点が異なっている印象があります。
都築 チョムスキーの立場からは、語と語の繋がりだけで会話ができてしまうと「普遍文法」という自説が否定されることになるので容認しがたいのだと思います。一方、最近は今井むつみさんと秋田喜美さんの共著『言語の本質-ことばはどう生まれ、進化したか』(中公新書)が話題になっています。実世界にある事物の名称とコンピューター内部で扱う記号とが結びついていない、この本の言葉でいえば「記号接地」をしていない言語がAIによって発達してしまう現状について考えなければならないと著者たちが述べている箇所が印象的でした。著者たちは別のところでも、ChatGPTについて記号接地していないから考えることができないと言っています。
大谷 やはり言葉が意味を持つということがキーワードになってきますね。少し前はAI「東ロボくん」の研究開発をされていた新井紀子さんが似たような主張をされていました。私と同じく東京女子大学の哲学専攻で教えられている黒崎政男先生はAIの哲学を専門とされているのですが、黒崎ゼミの学生の卒業論文を読んだりすると、同じように結論づけられているものが多くありました。私としては「AIは意味が理解できない」といわれても、そもそも意味を理解するとはどういうことなのだろうという疑問が湧いてきます。 なんとなく観念を把握するようなイメージだけで捉えられていては不十分で、そこをしっかり考える余地があるのではないかと思います。記号接地や身体性ということがテーマにはなるとは思いますが「意味を理解する」というフワッとした言葉を用いて、それがあれば言語で、なければ言語ではないと断じるのは適切なことではないと思います。
桐原 永叔(IT批評編集長 以下、桐原) 私は、『言語の本質』が注目を浴びているのは身体感覚から発したオノマトペとあわせて記号接地を論じたことで、言葉の意味というものを考え直すことができるからだと思います。その文脈でChatGPTが出力しているのは身体性を持った言語ではないというのは、多くの人が潜在的に抱えている願望に応えるものとして喜ばれている気がします。
都築 ただ記号接地や身体性ということで考えると、LLMの教師モデルとなっている言語コーパスは世間の人たちがネットに書き込んだ言葉なので、すでに生活のなかで接地した言語が多く含まれているともいえます。それをさまざまなパターンで学習して確率論的にならべて文章を生成しています。それはある意味でウィトゲンシュタインのいう「言語ゲーム」に近いようにも思うのですが。
大谷 そうですね。言語ゲームというのは、厳密にルールに従うというよりも、パターンの把握をベースにしていると考えられます。そして、そのパターンは生活から生まれていると考えられています。その意味では、ChatGPTなども膨大なパターンを学習している。ロジックありきではなくパターンの把握から言語にアプローチしているという意味では、似ているともいえます。ただ、ウィトゲンシュタインのいう言語ゲームは実践をバックグラウンドとして整理するという考え方なので、データの世界に限られるChatGPTの現場とは大きく違うような気もします。どこまでを実践の現場として捉えるかは、やはり難しいところですね。
