慶應義塾大学大学院メディアデザイン研究科准教授 標葉隆馬氏に聞く
第4回 生成AI時代の「声」を考える─災害記憶とナラティブの継承

FEATUREおすすめ
聞き手 都築 正明
IT批評編集部

災禍の記憶は、いつどのように語られ、残されるのか。沈黙の時間を経て立ち上がる声、研究資金の時間軸とのズレ、SNSからはこぼれ落ちるナラティブ──標葉隆馬氏は東日本大震災を起点に災害をめぐる“声の地層”に注目し、当事者の声をアーカイブし継承することの可能性と政治性を問いつづけている。

取材:2025年12月1日 慶應義塾大学日吉キャンパス標葉研究室

 

標葉隆馬(しねは・りゅうま)

慶應義塾大学大学院メディアデザイン研究科・准教授。京都大学農学部応用生命科学科卒業、京都大学大学院生命科学研究科博士課程修了、博士(生命科学)。総合研究大学院大学助教、成城大学准教授、大阪大学准教授を経て、現職。先端科学技術をめぐるELSI(Ethical, Legal and Social Issues:倫理的・法的・社会的課題)の分析、メディア分析、コミュニケーションデザイン、政策分析などを組み合わせながらRRI(Responsible Research and Innovation: 責任ある研究・イノベーション)の視点を踏まえた科学技術ガバナンスに関わる研究を進行中。主著『責任ある科学技術ガバナンス概論』(ナカニシヤ出版 2020)。

 

目次

体験のアーカイブと「声の地層」

AI時代における声の生成を考える

 

体験のアーカイブと「声の地層」

都築 正明(IT批評編集部、以下―) 先生の取り組まれている、東日本大震災の記憶や語りのプロジェクトについてもお話しください。

標葉 隆馬氏(以下、標葉) 東日本大震災をきっかけに、災害をめぐるメディア報道の分析やナラティブの研究を15年ほど続けています。きっかけは、被災地域が自分の地元だからです。被災状況や原子力発電所の事故を目の当たりにして、避けて通れない課題であると思いました。それ以前には、災害や防災の課題には関わってこなかったのですが、15年前の震災が起きてから決意してはじめました。正直なところ、進めれば進めるほど辛くはなるところもあるのですが、ライフワークとして続けていこうと決めています。そのなかで最近、特に興味深かったのは、沈黙ののちに数年間を経過して語りはじめる方がいらっしゃるということです。1つとても素敵な実践事例を紹介させてください。せんだいメディアテークという施設の方々が、震災直後からずっと語りのアーカイブ活動をされていて、9年目のときにiPadのある部屋に2人1組で入って、当時のことを語らいつつ、それを録画して公開する「わすれン! 録音小屋(https://recorder311.smt.jp/series/rokuongoya)」という試みをはじめました。制作意図をお伺いしたところ、8年経ってからようやく話せるといって話す方がいらっしゃるとのことでした。そのお話しは、いまのタイミングで録らないと消えるもので、録らなければ記録にすら残らないことをおっしゃっていて、とても腑に落ちました。しかし翻って研究者側の事情を考えてみると、科研費のデータをみても1〜2年目がピークで、あとは指数関数的に減っています。むしろ災害というのは長期戦で、10年〜20年を経て当時の課題を話してくださる方が増えてくるのですが、継続した研究プロジェクトとして資金を獲得できるシステムになっていないので、非常に矛盾を抱えた構造になっています。ライフワークとしての災害研究の今後の課題は、この記憶の継承、そして長期にわたる災害研究と齟齬をきたす研究環境・科学技術政策構造の問題だと考えています。

桐原永叔(IT批評編集長) 戦争についても災害についても、生活の一部として語られていたものが、時間が経つことで歴史の一部となってしまいます。語りを記録することは、戦争や自然災害が歴史化して政治の道具になってしまう力学へのカウンターにもなり得るでしょうか。

標葉 まさにそう思います。生に近い語りがリアルタイムに蓄積していくことを、瀬尾夏美さんという作家はご著書――『声の地層: 災禍と痛みを語ること』(生きのびるブックス)――で「声の地層」という言葉で称されていて、いい表現だなと思っています。声の地層を可視化することは、ポリティクスへの最後の対抗手段になるのだと考えています。東日本大震災からは15年、阪神・淡路大震災は30年が経過していますので、直接記憶を継承できるかどうかの問題が出てきます。第二次世界大戦や広島・長崎の原爆被害者も含めて、やはり語りは継承しなければなりません。そうした意味では、広島の被爆者の語り部さんの後継者育成なども意義深いと感じています。被爆者本人でなくても、リアリティを持った想像力が発揮されて、ナラティブを語ることの力は大きいのだと、私は信じていますし、個人的に応援しています。

SNSで生活者の観点がダイレクトに残されていることも、記憶の継承に役立つでしょうか。

標葉 ログとして残ることは大事だとは思います。ただしSNSのデータはダーティーデータなので、どこまで使えるかは疑問です。twitterがXになったあとは、まずますデータの値段も上がっていると思いますし、データそのものもBOTが多くて分析に耐えられなくなっていると思います。一方BlueskyのAPIは学術利用ができますが、登録者数の数はXに遠く及びません。そうしたなかで面白いと思っているのは、先ほどお話ししたせんだいメディアテークさんがおっしゃっていた、12年ほど経って干支が1周したぐらいから、長い文章を書きたい人が増えてきたという話です。いまだから整理できることがあるせいなのか、これまで定点観測写真などを載せていた当事者の方々が、長文でまとめてみたいとおっしゃる事例が目にみえてふえたというのです。そう考えると、SNSではなくかつてのブログのように、ある程度まとまった文章を書くことが見直されるかもしれません。そうした文章をまとめられるプラットフォームやアーカイブができると、これまでとは異なる声の地層ができるのではないかと思います。これは災害に限らずさまざまなテーマを考えるうえでも重要になるかもしれません。コロナ禍のパンデミックについても、さまざまな人がそれぞれの影響を受けていて、そこには社会階層や世代などの断層があるはずです。いまは見えない声の地層が可視化されれば、将来同じようなパンデミックが起きたときには重要な示唆を私たちに与えてくれるはずです。

先生の教え子さんたちは、休校などによる学びの変容を受けている世代ですよね。

標葉 そうですね。文章にしなければ伝わらないことはあるはずですから、そこには希望を感じます。さまざまな方々から教わりながら、そうした将来像がみえるようになってきました。

 

AI時代における声の生成を考える

先生の取り組まれている「声遊楽」のプロジェクトについて教えてください。

標葉 「声遊楽」では、JT(日本たばこ産業株式会社)のコーポレートR&D組織であるD-LABさんからお声がけいただいて、AI時代における声の生成をどう考えるかについて研究しています。 D-LABさんでは「心の豊かさ」について様々な観点から研究されていて、たとえば呼吸やデザインに関する研究が行われています。その一環として、声優が好きな林大輔さんというリサーチャーの方と一緒に、声に注目した研究をすることになりました。生成AIによる画像生成や動画生成に比べて、声の生成については権利関係を含めた議論や制度設計が多いので、ELSIの見地からも研究しがいのあるテーマです。論文ベースで調べても、生成AIによるオーディオ生成のELSIや倫理問題を扱っている論文は、あまり出てきません

アニメ作品の生産や消費が多かったり、VOCALOIDやVTuberの発祥地である日本では、声についての権利意識は高いように思われますが。

標葉 2,000人を対象にウェブでモニターアンケートをしてみました。すると、声について権利者の制限なく自由に使うことについて2割ぐらいの人が「強く賛成」「やや賛成」という回答でした。5割ぐらいが「権利上問題がある」という回答、3割ぐらいの方は「よくわからない」という回答でした。この数値の普遍性は別問題ですが、2割というのは無視できない数字だと思います。「生前の許諾なしに死者の声を生成してよいか」「私的利用なら許諾なしに声を生成してよいか」などさまざまな方面から質問したのですが、概ね2割ぐらいの方は自由に使うことに賛成でした。権利関係だけでなく、個人のデータを勝手に使われるアイデンティティ・ジャックなどを考慮にいれると、この2割を放置することには懸念が生じます。この課題については、生成AIとも絡めて来年いっぱいを目処に考えていきたいと思います。

さきにお話しいただいた「語り」や声の訴求力を考えると、画像や動画のディープフェイクに違和感を抱いたとしても、声のディープフェイクは心理に大きく影響を及ぼす可能性がありそうです。

標葉 言うことを聞きたくなる声があると思います。ニューロテックの分野でマニピュレーションといわれる、操作する/されるの問題に近い問題が起きるのではないかという気はします。声においては、実は視覚情報以上にマニピュレーションの作用が際立つかもしれません。声と生成AIにおいては、最終的に従来いわれているサブリミナル効果と、なにがどう違うのかという議論にはなってくると思いますから、そこを峻別していかなければならないと考えています。

第5回につづく