生成AIでビジネスが激変する
─週刊ダイヤモンド編集委員が語るChatGPTとの付き合い方
生成AIの爆発的な台頭により、あらゆるビジネスにおいてAI化が進行し、生成AIは確実にAIと人間との付き合い方を次の段階へ進めた。この25年間、雑誌メディアからWebメディアに活躍の場を移しつつ、ITの社会への浸透を取材してきた吉岡綾乃氏の講演録をお届けする。生成AIはビジネスをどう変えていくのか、そして私たちはどう付き合うべきか。
第2回「トリプルアイズフォーラム」 吉岡綾乃氏講演より
2023年9月8日 オルクドール日本橋
吉岡綾乃 週刊ダイヤモンド 編集委員 慶應義塾大学大学院文学研究科東洋史学専攻修了。ソフトバンク株式会社に新卒入社、出版事業部にてPC雑誌の編集に携わる。2004年、アイティメディアに入社。「ITmedia +D Mobile」編集部で記者としてキャリアを積んだ後、「ITmedia ビジネスモバイル」「Business Media 誠」「ITmediaビジネスオンライン」を立ち上げ、編集長を務める。プレジデント社に転職、「プレジデントオンライン」の副編集長を務めた後、2019年にダイヤモンド社に入社。2021年にダイヤモンド編集部へ異動、編集委員。Twitterのアカウントは、@YoshiokaAyano。 |
目次
この25年間にIT業界で起こったこと
この25年間にIT業界で何が起こったのか、ITが社会をどう変えてきたのか、私自身のキャリアを振り返りながら辿ってみようと思います。
私は1998年にソフトバンクに入社して「DOS/V magazine」というパソコン雑誌の編集部に配属になりました。ちょうどWindows 98が日本で発売になった年で、パソコンが広く一般に普及しました。翌年にはiモードサービスがスタートして、携帯電話からインターネットにつながるという画期的な出来事がありました。2000年問題を経て、2001年にはフレッツADSLやYahoo!BBの事業がスタート、2003年には光回線が登場して、今では当たり前になっているインターネットの常時接続が実現しました。2004年にはmixiが登場して日本でもSNSがだんだんと普及していきます。
この頃になると、出版業界で雑誌が売れないという傾向が出始めました。雑誌を買わなくても、ネットで情報を集められるということで、まず最初にパソコン雑誌が売れなくなります。私も悩んだ末に2004年にソフトバンクグループ内のアイティメディア株式会社に転職することになり、「ITmediaモバイル」という携帯電話に関する情報を配信している媒体の記者に転身しました。
当時の携帯電話業界は変化が大きく、新しいトレンドやサービスがどんどん出てくる、非常にエキサイティングな業界でした。2008年にはiPhoneが日本でも発売され、Facebook、Twitterの日本語版がスタート。2009年 にはAndroid版のスマホが登場し、2011年に LINEのサービスが始まりましたから、この時点で今に至るネット社会、SNS社会が出来上がったのがわかります。
生成AIの一般利用はインターネットの登場と同等のインパクト
2019年に、ネットメディアのマネタイズの経験者ということでお声がけしていただき、ダイヤモンド社に転職しました。私が2004年ごろに直面したパソコン雑誌が売れないという問題が、一般の雑誌も波及してきたのですね。今は主にダイヤモンド・オンラインでネットの記事を編集しています。かつては紙(週刊ダイヤモンド)で掲載された特集記事を後からダイヤモンド・オンラインで配信していたのですが、現在は、まずネットに載せてから紙に掲載する、または同時並行で行うというようにデジタルファーストに変わってきています。
ダイヤモンド・オンラインがどうやってマネタイズしているかというと、2019年から「ダイヤモンド・プレミアム」というサブスクリプションで記事が読めるというサービスを導入しており、無料記事、会員向け無料記事、プレミアム(有料記事)の3本立てで運営しています。私は主に無料記事を担当しているのですが、今年の6月に週刊ダイヤモンドで「ChatGPT完全攻略」という特集記事を組むことになり、久しぶりに紙の編集に携わりました。これがたいへん売れまして、過去5年間で一番売れ行きの良い号になりました。ChatGPTが「週刊ダイヤモンド」を購読している層にも興味のあるテーマだということで、第2弾としてこの9月に「ChatGPTプロンプト100選」という特集を組んでいます。
この25年を概観すると、大きな波がいくつかあったことがわかります。
①2000年前後:インターネットの登場(パソコンとインターネットの普及、常時接続化)
②2010年前後:スマートフォンの登場と普及(手のひらでインターネット、いつでもどこでもインターネットが利用できる)
これによって、2000年代は誰でも情報が発信できる、情報の無料化が進んだ時代ということが理解できると思います。
そして、
③今年(2023年)、ChatGPTに代表される生成AIが一般利用可能になっています。
これは上記のインターネットやスマートフォンの普及と同等以上の大きな変化であり、社会に影響を及ぼすムーブメントであると思っています。
生成AIとは何か?
生成AIとは、「プロンプト」と呼ばれる文章の入力をもとに新しいコンテンツを“生成”するAIのことを指します。文章や画像、音楽、動画などを、プロンプトを書くだけでつくりだすことができます。生成AIにより、多くのクリエイティブなタスクが自動化可能になりました。生成AIはいくつかありますが、代表的なものとしてテキスト生成AIのChatGPT(OpenAI)やBard(Google)、 画像生成AIのMidjourneyやStableDiffusion、Adobe Firefly、音楽生成AIのSOUNDRAWやJukeboxなどが有名です。
プロンプトさえ入力すれば、その能力がなくても文章が書け、絵が描け、動画や音楽を作ることができます。日本語のプロンプトから、外国語の文章が出てくる。モデルがいなくてもカメラがなくても、カメラマンが撮影した美女の画像をつくりだすこともできます。写真風でもイラスト風でもお好み次第です。作成した画像や音楽は自由に使うことができるとしているサービスも多いです。
現在、チラシやポスターを作成するときにネット上のフリー素材のイラストを使っている人は多いのですが、その素材が好きだから使っているというよりは、無料だから使っている人が多いのではないでしょうか。しかし、自分でプロンプトを書くだけで、一瞬のうちにイラストが出来あがり、しかも著作権は自分のものなので自由に使うことができる、仕事にも生かせるとなれば、状況は変わってくるでしょう。
ChatGPTとは何か
ChatGPT とはOpenAIが開発した、自然言語処理技術を活用したテキスト生成AIのことで、「GPT」は「Generative Pre-trained Transformer」の略です。 このGPTと自然文でチャットのように双方向でやりとりできる仕組みが「ChatGPT」です。一般的な質問応答だけでなく、物語生成や具体的なタスクの提案、多言語間の翻訳など、多岐にわたる作業を行うことができます。さらにプラグインを入れることで、人が音声で話しかけると音声で返すといった使い方、つまりChatGPTと話すことも可能になります。基本的には、人間が日常的に使うテキストベースのコミュニケーションツールとしての役割を果たしています。
ChatGPTは突然出てきたわけではなくて、人が書いたり話したりする言葉をコンピュータに理解させる技術である自然言語処理の研究の延長線上に出てきたものです。自然言語処理の大規模なAIモデルをLLM(Large Language Model=大規模言語モデル)と呼んでいますが、GPTはそのうちの一つです。では、GPTが何をしているのかというと、非常に単純化して言うと、「文章のなかで次に現れるべき言葉を確率的に予測している」と思ってください。GPTやBERTなどの言語モデルの訓練では、まず事前学習を行なって言語モデルとして成熟させます。この段階では、次の言葉の予測ができるようになっています。その後の段階としてファインチューニングを行います。そこでは言語モデルのニューラルネットワークのパラメータに微調整を加えながら特定のタスクにモデルを適応させる学習を行います。事前学習にはたくさんの文章を必要としますので、GPTはWebなどから大量のテキストを事前学習しているわけです。
ChatGPTと人間はどこが違うのか
ChatGPTが行なっていることは、人間が脳で言語を処理していることと“やや”似ています。とはいえ、次に続く言葉を探しているだけなので、一見、人間のように思考しているように見えますが、心や意思があるわけではありません。このことは覚えておいたほうが良いと思います。
GPTのGはGenerativeで、人間が書いたかのような自然なテキストを「生成する」という意味です。PはPre-trainedで、これは書籍・記事・Webサイトなどの膨大な量のテキストを事前学習していることを表しています。たとえば、GPT-1(2018)では書籍7000冊で学習させたとアナウンスされています。GPT-2(2019)では大量のWebページを学習、GPT-3(2020)はもっと大量のWebページを学習させたとしています。GPT-3.5(2022)になると人の手でファインチューニングしていますとアナウンスし、ついにGPT-4(2023)では非公表になりました。最後のTはTransformerで、深層学習モデルのことを指します。従来モデルの「長期記憶が苦手」「並列処理ができない」をTransformerが克服することで劇的に処理が高速化しました。文頭から順番に一つずつ単語を処理する必要がなく、従来手法に比べ処理速度も速い。学習データが大規模になるほど予測精度が向上するのも特徴です。ChatGPTはTransformerを用いることで、webから集めた膨大な単語を学習し、それをGPU*を使って並列処理することで、自然な文章の生成を可能にしました。生成AIが大量のデータを学習するには、高性能なGPUを備えた多数のサーバーと、それらを収める大規模なデータセンターが必要になります。
*GPUとは「Graphics Processing Unit」の略で、3Dグラフィックスなどの画像描写を行う際に必要となる計算処理を行う半導体チップ(プロセッサ)のことである。CPU(Central Processing Unit=中央演算処理装置)のような汎用的な処理が苦手である反面、単純な処理を並列に実行することが得意なGPUは、機械学習との相性が良い。大量のデータをもとに膨大な計算処理を行うディープラーニング用に、GPUを搭載した高速サーバーが活用されている。
ChatGPTが得意なこと
ChatGPTは基本的にはテキスト生成AIなので、文章を作るのが最も得意です。ユーザーからのプロンプトを基にして、さまざまな文章を生成できます。メールの文章も書いてくれますし、「報告書」などフォーマットが決まった文章を書くのは得意中の得意です。ダミーデータを作るのも一瞬ですし、CSVでの出力もできます。
情報を検索して回答するのも得意です、とChatGPT自身も言ってます。 たとえば、「太陽系の惑星は何個?」や「シェークスピアの代表作は?」といった一般的な質問や難易度の高い質問に答えてくれます。ただし、検索できる内容は2021年9月までなので注意してください。新しい情報には原則対応していないので、そこはGoogleのBardなど、検索が得意なAIを使ったほうがいいでしょう。
教育的サポートにも有用です。学問や技術的な質問に答えることができるため、学習のサポートツールとしての利用には結構使えます。「小学生にも分かるように、喩え話を入れて説明してください」「大学生が理解できるような説明にしてください」など、レベルを指定して説明させるとびっくりするほど上手なので、ぜひ試してみていただきたいです。また、プログラムを書くのは非常に得意です。私自身はプログラマーではないのであまり関係ないなと思っていたのですが、最近個人的にいいなと感じたのは、OfficeのVBA(マクロ)を書かせることです。Excelのマクロはいろんなところに情報がありますが、WordやPowerPointのマクロもChatGPTは一瞬で書いてくれて、仕事の効率がずいぶん上がるようになりました。実は今日の講演も、スライドの構成はChatGPTが考えてくれました。さすがにそのまま使ったわけではなくて、叩き台にして足したり引いたりしてPowerPointをまとめましたが。
あとはクリエイティブな提案をしてくれます。ユーザーがアイデアやインスピレーションを求めているとき、ChatGPTはクリエイティブな提案やアドバイスを提供してくれます。キャッチコピーを考えてもらったり、記事のタイトルを考えてもらったりに使っています。とにかく速くて大量に考えてくれるのがいいところなので、そのまま使うことは滅多にないですが、叩き台としては十分以上です。
翻訳機能も非常に優れています。昔の翻訳機は文字単位で訳していたのですが、ChatGPTはいったん文章を全部読んでから訳してくれるので、文脈を外しません。英文メールを書くときなど、用途によっては翻訳アプリより便利だと感じます。
さらに今年の夏に新機能が発表されました。一つは「カスタム・インストラクション」と言って、ChatGPTが答えを出力するときの条件などを事前に決めておける機能が追加されました。ChatGPTに知っておいてほしい事前情報やどのように回答してほしいかを書いておくと、プロンプトを書くときにキャラクター条件をいちいち含める必要がなくなりました。二つ目が「コード・インタープリター」で、自然言語でやりたいことを入力するとPythonのプログラムを書いてくれます。しかもプログラムにどういう意味があるのかについても詳しく解説してくれます。
ChatGPTのリスクと課題
ChatGPTは便利ですがリスクもあります。一つはデータのプライバシーとセキュリティに関するリスクです。ChatGPTを使うということはデータがOpenAIに流れてしまうので、企業で本格的にChatGPTを導入する場合は、機密データを入力しないよう、また個人情報などが外部に漏洩しないような仕組みが必須になります。有料版には「入力された情報を学習しない」という機能がありますが、本格的に企業でChat GPTを導入するということになると、社内サーバを立てて使うとか、マイクロソフトやGoogle、AmazonのChatGPT対応クラウドを使うなどの対策をする必要があります。
もう一つ、信頼性と偏見の問題があります。ChatGPTは知らないことでも「知りません」とは言わずに、堂々と嘘をついてきます。ハルシネーション(幻覚)と呼んでいるのですが、事実に基づかない情報を生成する現象のことです。まるでAIが“幻覚”を見ているかのように、もっともらしい嘘を出力するため、このように呼ばれています。なぜこんなことが起こるのかというと、インターネットなどから収集した大量のデータでモデルを学習するため、偏ったデータや誤った情報が含まれるデータを学習した結果、ハルシネーションが発生してしまうことがあります。また、言語モデルはある単語に対し次に続く確率が高い単語を予測するものであり、正しい情報を出力することを目的として訓練されているわけではありません。そのため、文脈には合っていても、真実ではない情報を出力してしまうことがよくあります。
さらに、ChatGPTを使う人が爆発的に増えた結果、専門家が予想していたよりも早く、学習結果が悪く働いて回答を間違うケースも出てきました。随時修正が行われているようですが、GPTの学習速度があまりにも速すぎるために、こうした事態も起こるのです。
ChatGPTはどんな人に向いているのか
Chat GPTの話をすると「私、IT苦手だから分からない」と拒否反応を示す人がいますが、ITに苦手意識のある人こそ、ChatGPTを使ってほしいです。プログラム言語を書けなくとも、普段話している言葉で入力すれば何らか答えを返してくれるのがChatGPTです。これは、ベテラン社員が経験の浅い若手社員やアルバイトに「これやっといて」と指示を出すのと似ていませんか。「できません」と返ってきたり、間違ったりした場合には、「じゃあこうすればいいんじゃない?」とアドバイスすることも、普段会社でやられていることだと思います。人に指示をするのと同じようにプロンプトを書けばいいのです。ChatGPTは間違えることもあるし、存在しない情報を堂々と書くこともあるので、信じすぎずに自分でもチェックしたり、何度もやらせたりするマインドが大事です。Chat GPTは非常に汎用的なので、他の人の使い方を真似して、自分なりの使い方を模索するとよいと思います。
未来のビジネス環境とChatGPT
今後、ChatGPTを含め生成AIが当たり前に使われる世の中になることは間違いないでしょう。とにかく進化が速いのが特徴です。先月できなかったことが今月はできるようになっているといったふうに、数カ月おきに新機能が追加され、どんどん仕様が変更されています。これまでの25年間と比較しても、こんなにエキサイティングな状況はなかなかないのではないでしょうか。
今後はさまざまなビジネス環境で、さらにデジタル化と自動化が進むと思われます。これまでは労力や手間やコストがかかりすぎるので人間にはできなかったこと~例えば一人ひとりにカスタマイズしたサービスなど~が、生成AIを導入することによって可能になってくるでしょう。新しいサービスの開発や、すでにあるサービスの付加機能追加がものすごい速さで進むだろうし、現にそうなりつつあります。
最後にこれだけは言っておきたいのですが、むやみにAIを怖がる人が多すぎると感じています。雑誌などでAIの特集をやると必ず、「これから消える職業ランキング」とか「こういう人は職を失う」といった記事を作りたがるし、実際読まれもするのですが、ChatGPTがどんなにすごくても所詮はツールであることを忘れてはいけないと思うのです。誰でも使えますから、まずは自分で触ってみた上で、「こういうことができる」「これはできない、苦手らしい」ということを自分で体験するのが大事なのではないでしょうか。(了)