研究者とAIが協働して課題を解決する ――東京大学大学院准教授馬場雪乃氏に聞く（１）| 次のブレイクスルーのヒントはここに　IT批評

研究者とAIが協働して課題を解決する
――東京大学大学院准教授馬場雪乃氏に聞く（１）

FEATUREおすすめ

2024.06.17

聞き手都築正明

IT批評編集部

日本の学術研究の基盤の揺らぎが指摘されている。2023年に公表された被引用件数が上位1％に占めるトップ論文の数は319本、国別順位で12位と歴代最低のスコアとなった。この背景として、人材や研究費用の確保が難しいことや短期間でコンスタントに成果をあげなければならない予算状況が指摘されている。研究者とAIが相補的に研究課題にチャレンジするとともに、市民とパートナーシップをむすんで研究をすすめるシステムを研究する東京大学の馬場雪乃氏に話を聞いた。

2024年5月23日　東京大学馬場雪乃研究室にて

馬場雪乃（ばばゆきの）

東京大学大学院総合文化研究科広域科学専攻准教授。東京大学大学院情報理工学系研究科創造情報学専攻博士課程修了。情報理工学博士（東京大学）。国立情報学研究所特任研究員、京都大学大学院情報学研究科助教、筑波大学システム情報系准教授などを経て2022年より現職。人工知能学会理事・代議員。人工知能、人とAIの協働、集合知、クラウドソーシングの研究に従事。人間の正確な判断をAIに取り入れる機械学習技術を多数開発。JSTムーンショット型研究開発プロジェクトにおいて、人間と協働して研究を行うパートナーAIの開発を推進する。2024年IPSJ/IEEE Computer Society Young Computer Researcher Award受賞。共著書に『データサイエンティスト養成読本　機械学習入門編』（技術評論社）『ヒューマンコンピュテーションとクラウドソーシング』（講談社）がある。

ギークな少女が夢みたAIとあゆむ社会

研究パートナーとしてのAIを開発する

身近なところにある集合知のニーズとデータ

ギークな少女が夢みたAIとあゆむ社会

都築正明（以下――）　先生がコンピュータ・サイエンスの分野に進まれたきっかけを教えてください。

馬場雪乃氏（以下、馬場）　父がエンジニアだったこともあり幼少期からワープロやパソコンが家にある環境で、子ども部屋にもMSXという8ビットコンピュータがありました。小学校3〜4年生ごろに、それをつかって自分でゲームをつくることができると知って、図書館で借りたプログラミングの本を読みながらBASICのプログラムをはじめました。

――人工知能についてはいつごろお知りになったのですか。

馬場　小学生の時に「新世紀エヴァンゲリオン」の放映がはじまりました。作中には赤木リツコという素敵なコンピュータ・サイエンスの博士が出てきます。彼女の母親が国防施設や軍事戦略、市政を司るMAGIという人工知能をつくったという設定になっていて、そこから人工知能への憧れが生まれました。

――MAGIが3つのAIシステムが合議をはかっているのも今日的ですよね。GPT-4では8個のAIが並列で動作しているそうですし。

馬場　MAGIの面白かったところは、人間の人格を移植していることでした。母としての自分と科学者としての自分、女性としての自分の3つのペルソナを模したOSが多数決でものごとを決定するというところです。

――濃い欲望が入っているので、小学生にはショッキングだったかと思いますが……。

馬場　小学生なりに理解できていた気がします。「浅はかなお母さんだな」という感想を抱いた記憶がありますから。

――「戦後史の転機」ともいわれた1995年に、思春期を過ごされていたのですね。

馬場　地下鉄サリン事件や阪神大震災など多くの事件が起こった時期ですね。Windows95が発売されたことで、PCが一気に普及した時期でした。当時はまだプロバイダサービスは充実していなかったので、パソコン通信をしていました。その後、インターネットに触れていき、特にGoogle検索エンジンの登場に感激したのを覚えています。

――中学生になってから、本格的にインターネットに入っていくというタイミングですね。

馬場　中学生のころは、ずっとインターネットの世界に浸っていました。私立の女子中高一貫校に入ったのですが、女子校での人付き合いや集団生活があまり得意ではなかったので、同級生と対面で話すよりもインターネット上の人たちと話すほうが楽しくなってきました。私の通っていた学校には、生徒がいきいきと活発に発言することを旨とする校風があって、その価値観にうまく適応できた生徒がヒエラルキー上位にいて学校活動をすすめていく雰囲気がありました。そこから外れてしまうと、うまく自分の意見や意思が届けられない面もあり、そこにしんどさを抱えていました。発言してもスルーされてしまうことも実際にありました。高校1年生のときに中退して、大学入学資格検定（現：高等学校卒業程度認定試験）を受けました。

――大学では情報系を専攻されたのですよね。

馬場　東京理科大学の電気電子工学科に入学しました。卒業後に東京大学の大学院に進学して、本格的にAIの研究をはじめました。まず着手したのはウェブマイニングの研究です。まだビッグデータという言葉が登場する前でしたが、インターネット上に集まっているさまざまな情報を構造化して使いやすくする研究でした。写真共有サービスFlickrにおいて、写真を媒介として大量の言葉と場所の情報を獲得できたので、それらをマイニングして構造化しました。たとえば「花火を観るならここがおすすめ」というような、それまで地図や本にしかなかった情報や、既存のメディアにない新しい情報を提示する研究を修士課程で行いました。博士課程ではそれを1歩進めて、言葉と画像の関係を解析する研究をしました。それぞれのユーザーは自分の撮った写真を整理するためにFlickrを使っていたわけですが、そこで蓄積された各人の写真や言葉、それに行動データを集めることで、多くの人々の情報源とする研究をしていました。

――情報工学や機械工学だけで完結するのではなく、ヒューマンなことを工学化することに関心を抱かれていたのですね。

馬場　人々が各自の意思のもとに行っている個々の行動が社会的な貢献につながることに、強い興味をおぼえていました。

研究パートナーとしてのAIを開発する

――ビッグデータに人が関数としてかかわるヒューマン・イン・ザ・ループ（Humam-in-the-Loop）の発想は、データマイニングの延長線上にある発想でしょうか。

馬場　はい。各ユーザーのデータを素材に少し料理するだけという立場から、こちらからほしい情報やデータを求めていったほうが効率的にデータを集められるという発想に至って、クラウドソーシングの研究に進んでいったという経緯です。ウェブマイニングという受動的なところから、能動的に介入する研究スタンスに一歩進んだイメージです。

――先生が開発を進めている、研究のパートナーとなるAIは、どのような働きをするのでしょう。

馬場　JST（国立研究開発法人科学技術振興機構）のムーンショット型研究開発事業のプロジェクトになっています。このプロジェクトは2023年に発足したので、ちょうどChatGPTの登場と同時期ぐらいにはじまったことになります。当初はLLMに文献データを大量に入れてしまえば、研究できるAIが実現できるのではないかと考えていました。しかし研究者の方々にヒアリングしてみると、研究室だけで共有される暗黙知があるので、文献だけで学習したAIは研究者のパートナーにはなり得ないというお話を多くいただきました。ですから、AIを研究のパートナーにするためには、研究者がそうした暗黙知をAIに教えていく必要があるわけです。私たちがムーンショットのプロジェクトで行っているのは、AIが出してくる結果に研究者がフィードバックを与えることで、研究者だけが持っている暗黙知をAIに教えていく取り組みです。

――ChatGPTが出てきたときに、存在しないリファレンスをまことしやかに並べられたとおっしゃっていた方もいました。

馬場　先日、東京大学の五月祭に登壇して、GPT-4へのクイズを学生から募ってみました。「東大の校歌はなんですか」という問いにGPT-4がデタラメな答えを生成するのをみながら、いまでもハルシネーションがあることを示しました。

――仮説を立てるにあたって、AIからインスピレーションを得ることも研究されているそうですね。

馬場　人の研究者は、自分の研究領域の文献ばかりを読んでいるので、どうしても発想が偏りがちです。そこで、AIの客観的な視点を入れてあげることで、新しいひらめきや仮説が出てくるのではないかと期待しています。

――学際的な研究も広がりやすくなりそうですね。

馬場　そこは大きく期待できるところだと思います。

――有名な経済学のジョークがありますよね。鍵を落として街灯の下で探している経済学者に、通りがかった人が「どうして暗がりも探さないのですか」と訊くと「だって街灯の下にないと見つからないじゃないか」と答えた、という。

馬場　面白い喩えですね。仮説を検証する手段を数多く提案することも、AIが得意とするところだと思います。化学分野では、だれが実験をするかによって結果が違うことも多いそうです。そこでAIがサポートして適切な実験者をアサインメントすることも可能だと考えています。

――コツがあるにしても、あまり属人的になってしまうと検証の真偽があやふやになる懸念もあります。

馬場　ボスのプレッシャーがあったり、グループの同調圧力がはたらきすぎたりしないように、AIに多角検証の一端を担わせることも可能だと思います。仮説においても実験においても、AIは人の視野を広げるのに役立つと思います。

――先生はムーンショット型研究の解説動画（https://youtu.be/4K4ZzSPwLFs?si=hh4DWgi_y4mc3qbS）で、AIに「この仮説にしがみついても未来がないよ」とアドバイスしてほしいとおっしゃっています。

馬場　人間はどうしても確証バイアスにとらわれたりサンクコストを惜しんだりしますから、なかなか自分の立てた仮説から手離れできないんですよ。そういうことは、だれかに指摘してほしいと思います。

――科学研究にAIが参加するようになって人的コストがかからなくなれば、若い研究者が自分の研究をしやすくなるメリットもありそうですね。

馬場　それは大いにあると思います。マウスの世話をはじめ、現場によっては若手研究者がさまざまな雑用に追われて自分の創造性を発揮できないことも多いでしょうから。AIが雑用をサポートしてくれれば、若い方々が自分の時間を持って発想を活かせるのではないかと思います。

――学務で多忙な先生もいらっしゃいますよね。定年退官して「ようやく自分の研究ができる」とおっしゃる先生も多くいらっしゃいます。

馬場　学内業務のDX導入がどんどん進んで、研究時間が確保できるとよいと心底思います。実際は責任があるので難しいのですが、教員どうしでは冗談で「試験監督AIがほしいよね」と言い合ったりしています。

身近なところにある集合知のニーズとデータ

――先生は、創薬分野でノンプロやセミプロの方々の知見を活用するメソッドについての論文も書かれていますね。

馬場　AI創薬の分野では、AIは薬の候補を次々に提案することができますが、実際につくる場面ではプロの化学者の力が必要です。しかし化学者はすごく多忙で人数も限られていて、そこがボトルネックになっています。そこで、化学者だけに依存するのではなく、化学の知識を持っているセミプロの方々を何人か集めて、その集合知で1人の化学者に仕立てることで、構成可能性の判定をサポートしてもらうことを考えました。論文では、それがどの程度の精度で可能なのかを検証しています。

――かねてより日本では海外医薬品の認可のハードルが高いことで生じていたドラッグ・ラグが問題視されていましたが、現在ではそもそも開発に手をつけられないドラッグ・ロスが顕在化しています。治験に関しては仕方ないですが、それ以前のところは合理化する余地がありそうですね。

馬場　そうですね。専門家に頼りすぎていることが不合理を生んでいる傾向は、さまざまな分野でみられます。たとえば医療でいえば、医学の知識を持っている人の力を借りながら、医師の負担を減らしてあげるようなことが、もっと行われてもよいかと思います。

――さきほどは人的コストについて伺いましたが、科研費や研究資金の獲得についても、ある程度AIに任せることができると研究に力を入れられると拝察します。

馬場　たとえば、私が過去に提出した研究費の申請書のデータをLLMに入れて、私らしい文章を書いてくれたらとても助かりますし、業務量の削減にもつながると思います。

――データ収集のスキームを省力化したり精度を上げたりすることで、研究の規模感も変わってくると思うのですが。

馬場　AIの手助けによって研究の範囲を広げるということですね。その観点でAIに最も期待できるのは、コラボレーターを見つけることだと思います。自分たちの手の届くかぎりで研究をしながらコンスタントに論文を書いていくことで、ニッチな研究が多くなってしまうことも往々にしてあります。研究者自身の抱えている問題について、それを解決してくれる人が世界中の研究所のどこかにいるかもしれません。その人をAIが見つけてくれて、すぐにコラボレーションをはじめられたりすれば、もっと大きな研究テーマに取り組めると思います。

――先日、植物図鑑が好きな3歳の子どもが、栽培が禁じられているケシを車窓から発見したニュースが報じられました。この子どもの知識や観察眼は称賛されてしかるべきですが、潜在的なローカルな知を共有することも重要なのではないかと考えました。

馬場　私の考えるシチズン・サイエンスとは、そうした知を活用することです。インターネットは1人の特別な知識を民主化することができるツールですし、AIはそうした知の集積をマイニングして日常に生かすことに長けたツールです。システムを開発することと同じように、データを集めることも重要ですから、AIがもっと身近なものになってほしいと思います。たとえば毒キノコや毒ヘビなどの情報を抽出してマッピングすれば安全な山歩きのガイドブックができるように、AIがもっと日常的に使われるようになってほしいと思います。

→（２）に続く