国産LLM開発に「富岳」で挑む
富士通研究所・白幡 晃一氏に聞く(1)

FEATUREおすすめ
聞き手 桐原 永叔
IT批評編集長

猛烈なスピードで普及を遂げる生成AIは、ビジネスや社会の様相をも変えようとしている。LLM(大規模言語モデル)をはじめとしたAIモデルそのものが、次代のインフラとまで目されるなか、その開発のほとんどはアメリカのテックジャイアントと、その周辺で行われている。産学官が知見を集積する国産LLM開発として期待を集める「富岳」を用いたLLM開発プロジェクトについて、中心メンバーである富士通研究所の白幡晃一氏に話を聞いた。

白幡晃一

白幡 晃一(しらはた こういち)

富士通株式会社 富士通研究所 コンピューティング研究所イノベーティブコンピューティング コアプロジェクト リサーチディレクター

脱炭素社会に向けた材料探索、構造・流体解析を用いた設計などの領域でハイパフォーマンスコンピューティングとAIを活用してイノベーションを起こすためのコンピューティング技術の研究開発をリードしている。2010年東京工業大学理学部情報科学科卒業、2012年大学院情報理工学研究科数理・計算科学専攻修士課程修了、2015年博士課程修了、博士(理学)。2015年より富士通研究所研究員、2018年よりシニアリサーチャー、2021年主任研究員、2022年プロジェクトマネージャー、2023年よりリサーチディレクター。2017年CANDAR GCAワークショップ最優秀論文賞(共著)。2020年、2021年スーパーコンピュータ「富岳」およびABCI(産業技術総合研究所が構築・運用するAIクラウド計算システム)を用いて機械学習処理性能ベンチマークMLPerf HPCで世界最高性能を達成。

目次

並列計算の面白さに目覚めビッグデータの研究に

桐原永叔(IT批評編集長、以下桐原) 白幡さんの研究者としてのバックボーンについてなんですが、何がきっかけでコンピュータ研究の世界に入られたのでしょうか。

白幡晃一氏(以下、白幡) 特に小さい頃から確たる目標があったというわけではなくて、数学の先生か理数系の専門性を活かした職に就きたいと考えて、東京工業大学の情報科学科というところに進学しました。やっぱりこれからは情報科学の時代かなと感じていたのと、純粋に学問としても興味がありました。これからの社会に役立つことを学びたいと考えたときに、ITを学んでいくとかなり面白いことになるんじゃないかと思っていました。

桐原 東工大では何を学ばれたのですか。

白幡 松岡聡教授(現理研計算科学研究センター長)の研究室を選びました。松岡研究室は並列分散コンピューティング、特に高性能計算(HPC)に関するソフトウェア基盤技術の研究を行なっていました。当時は並列計算については、何も知らなかったのですが、スーパーコンピュータやビッグデータの研究を行っているという話を伺って、科学としても新しい発見が期待される分野だし、プラスしていろいろな社会課題の解決にも役立つだろうということで研究室に入りました。研究自体はやればやるほど面白いという感じで没頭していたのですが、将来は企業に就職したいという気持ちが強かったですね。ドクターを取得してから企業に行くのがいいのではないかと先生からアドバイスを受けて、ドクターで最先端の技術を身に付けてから就職しようと思いました。その間、世界の企業をいろいろ見ておこうと、3カ月ほどシアトルに行きMicrosoftでインターンをやったり、日本IBMでインターンをやったりしていました。

桐原 ビッグデータのことを研究しようとして、スーパーコンピュータに出会ったという順番になりますか。

白幡 というよりは、並列計算の面白さが最初にあって、そこからビッグデータの研究に行ったという順番ですね。

桐原 テック企業がいろいろあるなかで、富士通を選ばれたのはどういう理由からでしょう。

白幡 世界トップクラスのスーパーコンピュータを開発している企業ですから、大学時代に学んだ技術を活かせるかなと思いました。富士通の研究所で、世界初であるとか世界一となる技術や製品・サービスを生み出し、社会に貢献したいという気持ちがありました。

桐原 データこそ“次世代の石油”、重要資源だみたいなことが言われていましたが、当時はそういうことは意識していましたか。

白幡 それはありました。インターネットが絶対発展していくんだろうなと思っていましたし、そうなると膨大なデータが取得できることは見えていましたから。ビッグデータが生まれていくなかで、データを解析するという新しいスパコンの使い方がまさに見いだされているような時代だったので、たしかにビッグデータも重要なキーワードとして意識していました。

桐原 先ほど社会課題の解決と言われましたが、私が連想したのは、データが石油だとすればスーパーコンピュータでより精製して使いやすくしたほうが、データの社会性が高くなるというようなイメージなのかなと。

白幡 そうですね。それはかなりあると思いますね。

桐原 面白いですね。そういう意味では今回のような国産のLLM(大規模言語モデル)1開発への取り組みは、白幡さんの指向性とも合致しているわけですね。

白幡 そうですね。まさにそこは並列計算の技術が存分に活躍できるところですし、特に「富岳」2は国産のスパコンですから、日本ならではの研究にもなると思います。実際にやったらどんなものが出てくるんだろうという不安な面もありながら、自分としては、これは面白いなと思いながら取り組んでいます。

1 2 3 4