京都大学大学院経済学研究科教授 依田高典氏に聞く
(1)行動経済学と機械学習で、人の「ココロ」がわかる?

FEATUREおすすめ
聞き手 都築 正明
IT批評編集部

バージョンアップした経済学で「原因と結果」を導き出す

これからの経済学は、どのように変わっていくとお考えですか。

依田 機械学習――広い意味で人工知能ですが――が非常に発展してきていて、 第 3 次人工知能ブームのなかにあります。ここには 2 つの潮流があって、 1 つは言うまでもなく、2012 年に大ブームとなったディープラーニングです。基礎研究は日本でも以前からありましたし、ヒントン1の発明もありましたが、 それが画像認識や音声認識で大きなブレイクスルーを果たしたのは間違いありません。 ただ、ディープラーニングは、経済学の分野で、今ひとつ役に立たないこともわかってきました。

それは、どうしてでしょう。

依田 ディープラーニングが役に立つのは、画像や音声のようなリッチなデータや稠密なデータです。ところが経済学で使うデータというのは、所得や年収、金利といった、数字に置き換えられた非常にスパース、つまりまばらなデータになっているのです。そうしたデータをディープラーニングやニューラルネットワークを用いて畳み込んでも、普通の回帰分析で得られるものと、さほど変わらないのです。

イメージとしてはわかります。では、既存の経済学のほかに機械学習が役立つ分野はあるのでしょうか。

依田 先ほど述べた因果推論の分野です。きちんと統制されたデータのなかで「原因と結果」の形式をたくさん見つける、因果推論的な機械学習が注目を浴びています。多次元のデータから因果関係を見つけようとする際には、古典的な機械学習のアルゴリズムがかなり役立ちます。機械学習のアルゴリズムでは、説明変数を選択したり、 母数の線形性やパラメトリック(分布)を仮定したりする必要がなく、大量の説明変数を同時に投入して、一気に推定することができます。これは従来の統計学、経済学を大きく補完するものです。

異質なものを介入した効果を測定しやすくなる、ということですね。

依田 そうなんです。その延長として出てくるのが、ポリシーターゲティングという流れです。ターゲティングという言葉は「ターゲティング広告」のように、対象を絞ることとして使われますよね。こうした 一人ひとりにどんな介入をすれば最も効果があるのか、という異質介入効果の識別に、機械学習的なアルゴリズムが役に立つことがかなりわかってきました。次の 10 年から 20 年以内には、ほぼ確実にこの分野にノーベル経済学賞が授与されることになると思います。

ミクロ経済学はまず、合理的個人を仮定しました。しかし、個人の原理だけでは解決できないこともあるので、そうしたことを国家単位で説明するマクロ経済学が登場しました。意思決定を考える行動経済学では、再び個人単位で物事を考えるようになっている、という理解でよいのですか。

依田 そうですね。そして残念なことに、マクロ経済学の存在意義が問われているのです。

どのような点においてでしょう。

依田 人間についてのデータがフィールド実験を通じて仮説検定ができるというのは、物理学で素粒子革命が起こったようなものです。原子のなかを解明するように、RCT(Randomized Controlled Trialrct:ランダム化試験)を通じて因果性を検証することができるわけです。そういう意味では、マクロ経済学で扱う事象――アベノミクスや黒田バズーカなど――について実験をすることはできないので、結局のところ水掛け論になってしまいます。たとえば、政府支出を増やせば定義的に経済成長になる、というような議論が盛んに行われていますが、賛成するにしても反対するにしても、 あくまで定義式的な問題で「こっちを増やせば、こっちがこうなる」なんてわからないわけです。 因果的な識別関係で、政府支出がどのようなかたちで国民所得に影響を及ぼすか、というのを RCT 的な実験で介入法効果として識別することは、現状においてはまだできていません。これは宇宙物理学において、実験的な手法が取れないために観測データのみで最先端の研究をするのと似ています。その意味において、現在のマクロ経済学は、実証革命がいまだ及んでいないという難しい立場にあります。

推論と聞くと第 3次人工知能ブーム以前のアルゴリズムである、探索木のようなものをイメージするのですが。

依田 慧眼ですね。たしかに具体的なアルゴリズムの種類区分でみると、ディープラーニングと因果推論はまったく別の起源を持ちます。ただし、ディープラーニング系の第 3 次人工知能ブームを、因果推論系の、いわば第 3.5 次人工知能ブームが継承しているのは間違いありません。デジタル化や IoT で、個々のデータがクラウドに集まってくるようになった 2000 年前後からの趨勢にあるという意味では、同じ潮流にあるものだと捉えられます。実際に、共通のデータを使うことも多いですから。

1 2 3