ASI-Archが拓く創造と進化の時代
第1回 AlphaGoの“第37手”からASI-Archへ──AIは創造者になれるのか
2016年3月、囲碁に詳しいわけでなくても、韓国ソウルで行われた囲碁のプロ棋士李世乭(イ・セドル)九段と、Google DeepMindの囲碁AI「AlphaGo」の対局が記憶に残っている方が多いのではないでしょうか。約9年経った2025年7月、AIが自らのモデル設計を自動化するASI-Arch(Artificial Superintelligence for Architecture)が発表され、この対決が再び注目を浴びています。ASI-Archは何を達成したのか、そしてAIがAIを創造する時代の幕開けは本当に始まったのでしょうか。5回の連載の初回として、これらの出来事が何を意味しているのかを整理していきたいと思います。
目次
AlphaGo“第37手”と1万分の1──AI学習プロセスの革新
2016年にAlphaGoが放った”第37手”は、当時の観客に大きな驚きを与えたと伝えられています。定石を大きく外れたその一手は、勝率を度外視したミスのようにも見えたため、観客たちは「これはAlphaGoのミスではないか」という声も聞かれたと報告されています。しかし、のちの解説によれば、この一手は十数手後に局面を一変させ、最終的にはAlphaGoの勝利につながったことが明らかになりました。実際にWIREDはこの一手に関して「人間が同じ手を選ぶ確率は1万分の1だった」と紹介しており、DeepMind自身も同様の数字を示しています。こうした報告を踏まえると、この一手が単なる勝負の一幕にとどまらず、盤上を超えて人間とAIの境界を揺さぶった出来事だったと受け取ることができそうです。
AlphaGoはどのようにしてこの”第37手”を導き出したのでしょうか。その背景には、深層学習とモンテカルロ木探索(MCTS)を組み合わせた多層的な仕組みが鍵となっていたとされています。単に計算量が多いという意味ではありません。過去の膨大な棋譜を学習したAlphaGoは、「この局面なら人間はこのように打つ」という確率分布を予測するポリシーネットワークを構築します。これが、人間の直感に近い形で次の一手を絞り込む役割を果たします。ポリシーネットワークが提示した有力候補をもとに、未来の対局を何万回もシミュレーションし、勝率を統計的に評価します。この評価を担うのがバリューネットワークと呼ばれる別のモデルで、ある局面から最終的な勝敗の見込みを数値化する役割を担っています。
重要なことは、これらのモデルが固定的に働いているわけではなく、自己対局を繰り返すなかで互いに改良され続けることです。初期の段階では未熟だったポリシーネットワークも、対局を重ねるごとに精度を高め、バリューネットワークの予測も同時に洗練されていきます。まるで進化のプロセスのように、モデル同士がフィードバックを与え合いながら強化され、やがて人間を超える戦略が自然発生したのです。
こうした複数の学習プロセスが交互に作用し、統計的評価と直感的予測が結びつく構造そのものが、このシステムの複雑さの核心となります。こういったことから”第37手”は確率モデルから見ても極めて異例だったと言えるのです。
しかしこの出来事はここで終わりません。第4局で李世乭(イ・セドル)九段が放った”第78手”は、AlphaGoを逆に驚かせたと言います。AlphaGoは”第37手”と同じように予測確率が極めて低い手に遭遇し、評価関数が一時的に混乱したと報告されています。解説者の1人は「人間らしい創造性がAIを打ち負かした瞬間だ」と評しました。
このAIの”第37手”と人間の”第78手”は、創造と予測の限界を鮮やかに照らし出した出来事だと感じます。AIが人間を驚かせ、人間がAIを驚かせる。そこには単なる勝敗を超えた、人間とAIとの関係の変化の象徴のように思えるのです。
創造は「意味づけ」から生まれる──AIと人間の視点
AlphaGoの”第37手”や李世乭(イ・セドル)九段が放った”第78手”をめぐるエピソードは、単なる技術的な出来事にとどまらず、創造性という古くて新しい問いを再び前景化させたように思います。なぜあの瞬間を多くの人が「創造的だ」と感じたのでしょうか。
哲学の世界において「創造」はしばしば意図や目的、つまり志向性(intentionality)と結びつけて語られます。フランツ・ブレンターノやエトムント・フッサールといった現象学の思想家たちは、心の動きが常に何かに向かっていることを強調しました。例えば「この手は相手を驚かせるために打たれた」という解釈が成り立つのであれば、そこには目的が感じられるのではないでしょうか。
ではAlphaGoの”第37手”の目的とは何だったのでしょうか。技術的には勝率を最大化するための計算結果に過ぎなかったと言えるでしょう。AIは未来を見通していたわけでも、観客を感動させるなどのエンターテインメントを意識したわけでもないでしょう。にもかかわらず観客たちは、そこに美しさや驚きを見出し、物語を付与したのです。ある意味で人間はAIの出力に対して後付けの意味づけを行い、「創造らしさ」を投影していたと言えるのではないでしょうか。
一方李世乭(イ・セドル)九段が放った”第78手”はどうでしょうか。そこには明確に勝利への意図が宿っていたと言えるでしょう。観客たちはその一手を「人間にしか打てない」と評し、AIが混乱する様子に快哉を叫びました。ここには確かに、人間の側からAIに突きつけた創造性の証明があったと言えるでしょう。
こうしてみると、創造とは単なる新規性ではなく、文脈や意図との関係のなかで初めて立ち現れるものだと考えられると思います。AIがどれほど予測不能な一手を生み出しても、それが「創造的だ」と評価されるかどうかは、人間がそこに物語や価値を見出すかどうかにかかっていると思うのです。
ASI-Archの登場──1,773実験・20,000GPU時間が示した未来
AlphaGoによる”第37手”から9年と4ヶ月経った2025年7月にarXivに投稿された論文「AlphaGo Moment for Model Architecture Discovery」で、AIが自律的にモデル設計を行う可能性を示したとして、大きな関心を集めています1。論文の筆者はこれをASI-Arch(Artificial Superintelligence for Architecture)と名付け、1,773件の自律実験、20,000 GPU時間、106の新しい線形アテンションを発見したといった具体的な数字を報告しました。
このASI-Archは、従来の人間主導の設計探索を超え、AI自身が仮説を立て、その仮説に基づいてモデル構造を提案し、実験・評価を自ら繰り返す、仮説→実装→検証→改良の自律的なサイクルを回す能力を獲得したと示されています。具体的には、以下のようなプロセスが報告されています。
- 1: 1,773件に及ぶ自律実験を行い、結果によって設計仮説を継続的に修正
- 2: 実験に要した時間は20,000 GPU時間越えで、大規模な設計探索が裏で動いていたことが伺える
- 3: 結果として106個もの新たな線形アテンション構造が発見され、既存の設計を超える性能や特性を示した
- 4: 「発見の数」と「消費した計算資源(時間)」の間に、科学的発見のスケーリング則に類する関係が成立している可能性の示唆
これらによって、AIによる想像プロセスの定量的理解にも一石を投じています。
この報告から、設計プロセス自体がAIによって操られているという構造への驚きを感じました。AIが自ら問いを立てる、設計を提案し、検証し、次の問いへと繋げていくその姿には、人間が唯一担えるはずの「問いを立てる力」にAIが近づきつつある、未来の兆しのように見えたからです。
とはいえ、この報告は現時点でarXivに投稿されたプレプリントにすぎず、正式な査読を経たわけではない点に留保が必要です。その上で、複数の独立した研究チームが再現実験を行い、その有効性が検証されていく必要がある状況です。
9年と4ヶ月前、AlphaGoが示したのは“答えの意外性”でした。それに対してASI-Archが示すのは、答えに至る“設計のプロセス”をAIが自律的に回す姿かもしれません。このことにより「問いを立てる」ことの意味が曖昧になりつつあるように感じています。
今回は、AlphaGoが人間的な感受性を揺さぶった“創造らしさ”の象徴となった”第37手”から、ASI-Archの登場により、設計プロセスレベルで“創造らしさ”が再現される可能性が浮かび上がったことで、AIの創造性とは何だったのかを問い直す導入を目指しました。
ASI‑Archとは具体的にどのようなもので、なぜ注目を集めているのでしょうか。次回はRedditやHacker Newsといったコミュニティで起きている熱狂と懐疑の両面をたどりながら、背景を探っていきたいと思います。