AIの発達により我々の生活・産業がどのように変わるのか
ものづくりへの活用で、競争力強化を
東京大学大学院工学系研究科
特任准教授
松尾 豊 氏
7月18日の東1ホールには、東京大学大学院工学系研究科特任准教授の松尾豊氏が登壇。人工知能、ウェブ、ビッグデータに関する研究がご専門の同氏より、ディープラーニングについて、紹介いただきました。
Googleの人工知能(アルファ碁)がプロ棋士を破る
Google DeepMindの人工知能アルファ碁が、2016年には韓国イ・セドルを、2017年には中国の柯潔9段を破りました。同年10月には、プロ棋士の棋譜データ(教師)なしでも、それまでのアルファ碁より強くなり、12月には将棋やチェスでも名人より強い既存のプログラムを破りました。アルファゼロは、ゼロの状態から学習を始め、わずか2時間で将棋名人を超えられる強さになっています。こうした技術の中心に使われているのが、ディープラーニングです。
AI(人工知能)と呼ばれるものは広義になっており、3つの意味が混在しています。1つ目は、従来からあるIT技術の擬人化で、IT技術で可能だったものです。2つ目は、たくさんのデータを使って学習させる機械学習や自然言語処理を中心とするもの、そして3つ目が本日ご紹介するディープラーニングです。ここ数年急激な革新が起こっている領域で、日本も競争力を発揮できる領域であると考えています。
ディープラーニングとは「入力を出力に写像するために、簡単な関数を組み合わせて表現力の高い関数をつくり、そのパラメータからデータを推定する方法」です。少しわかりにくいので、簡単に説明するとディープラーニングとは(a)画像認識ができる(b)運動の習熟ができる(c)言葉の意味の理解ができる、この3つが順番にできるようになっていく技術です。
(a)の画像認識は、画像に映っているものが、猫か犬か、また製品の製造工程において良品か不良品かの判定のことで、コンピュータには困難でした。しかし、画像判別のエラー率は、ディープラーニングの登場前後では、25.7%から16.4%へと下がり、2017年は2.3%となっています。一方、人間のエラー率は5.1%。この変化は、わずか5年で起きています。昔の画像認識技術では、どうやっても人間には追いつけませんでしたが、今では人間がどうやっても追いつけないレベルになっています。
(b)は2015年頃から画像認識技術とロボット技術を組み合わせた研究が進められています。
(c)の翻訳技術は、2016年にGoogle翻訳がディープラーニング同士に変わったことで精度が向上、人間に肉薄しています。英語からスペイン語への翻訳は、ほぼ人間と同じレベルとなり、2018年2月には英語から中国語への翻訳もマイクロソフトが「人間と同じレベルに達した」と発表しています。
ディープラーニングが行っていることはそれほど難しいものではありません。使っているのは最小二乗法です。例えば、Excelである日の気温と飲料の売り上げ散布図を描くと、点々が散らばり、近似曲線を追加すると線が引けます。この線を引くアルゴリズムが最小二乗法です。
重回帰分析(簡単な1次式でデータを近似する方法)と一緒ですが、違いは変数が多いこと、そして深い関数を使うことです。深いことが重要な理由は、私たちが住んでいる世界が階層的なため、関数も階層的なものが合っているからです。パラメータを減らしながら表現力を上げたいときに効率的な方法が、「簡単な関数を使って深くする」ことです。脳はそういうことを行っています。長年研究者たちがこの分野に取り組んできましたが、計算機パワーの向上とデータ量の増加によって実現できるようになりました。
ディープラーニングは「眼の誕生」
ディープラーニングを一言で表すと「眼の誕生」です。『眼の誕生』という、アンドリュー・パーカーがカンブリア紀について書いた本があります。カンブリア爆発には諸説ありますが、決着はついていません。それまでの生物には眼がなかったため、触角とか匂いを頼りに相手に近づき、ぶつかると食べる、ぶつかると逃げる、という緩慢な動きしかできませんでした。そこに史上初、三葉虫という眼をもつ生物が現れます。生存上、圧倒的に有利なため大繁殖しますが、そのうち逃げる方も眼をもち、生存戦略ができるようになりました。これと同じことが機械とロボットの間に起こってくると考えています。今までのテクノロジーはすべて眼が見えない中で作業をしていたのです。
労働集約的な分野における人手不足の原因は「眼(認識)」によるものです。第一次産業革命でも蒸気機関、内燃機関が生まれましたが、それまで力は人間の筋肉に紐づき、力を出すには人間の筋肉が必要でした。それが切り離され、必要な動力が必要なところに配置できるようになったのです。これからは、認識が人間から切り離されて、社会の必要なところに再配置されるようになります。
今後は家の中でも、製造現場でも、社会のさまざまなところで、認識能力+ハードウェアという技術が広がると予想しています。認識能力をもった洗濯機、冷蔵庫、炊飯器、エアコンなどの家電製品も、大きな流れとしてやってくるのではないでしょうか。
日本のものづくりの高さを考えると、ディープラーニングとの組み合わせはポテンシャルがとても大きいと考えていますが、その割に技術が浸透しないことを私は大変懸念しています。
医療機器は日本が強かったはずですが、この分野はほとんど決着がついています。今からやっても手遅れではないかと思うくらい、アメリカの企業が強く、画像認識の機械をどんどん開発しています。
顔認証分野でも日本、特にNECが非常に強かったのですが、中国企業の勢いが止まりません。テンセント(中国深セン)では、社員の入退出管理は顔認証、消費者金融の本人確認も顔認証、さらに中国全土には1億7000万台の監視カメラがあり、順次ディープラーニング化されています。監視カメラを対象とする中国のセンスタイム、WGBIなどは、ユニコーン(非上場巨大ベンチャー)企業で、急激な勢いで伸びています。顔認証は、データをたくさん集めれば結果が出せるので、それを実直に行っているのが中国企業、難しそうだと二の足を踏んでいるのが日本という状況になっています。
これから10年後、20年後を考えたときに、GoogleやFacebookに対抗できるようなディープラーニングをコアにした世界的な企業が現れるのではないでしょうか。
ディープラーニングの現況
従来の機械学習は浅い関数を使っていたため、浅い関数でやってきた人と深い関数でやっている現在とでは状況が全く違います。ディープラーニング主要論文の引用数順で、最も引用されているのが2012年のベンジオ(モントリオール大学)、2番目はヒントン、4番目はルカン(ニューヨーク大学)です。この3人の先生はカナディアンマフィアと呼ばれ、ディープラーニング分野を成功に導きました。彼ら以外は、20代後半から30代と若く、2010年以降に博士をとった人が並びます。
内容を理解してプログラミングが書ける人が大きな付加価値をもたらし、リストで300位前後でも年収5000万円、30位以内だと桁が一個上がる状況で、まるでサッカー選手のようです。トヨタのような大企業でさえディープラーニングの技術を使えるかどうかで命運が大きく変わってきます。データはすでにあるので、投資する策としては人しかないため、投資合戦が世界的に活発になっています。
翻って、日本の問題点に目を向けると、1つ目はディープラーニングをきちんと理解しておらず、進展についていけない、2つ目は動きが遅い、大きな企業になればなるほど意思決定ができていない、3つ目は人への投資になっていない。この3つを解決すれば、戦える状況になるのではないかと考えています。
「ディープラーニング×ものづくり」で大きなチャンスを
2017年に日本ディープラーニング協会(JDLA)を設立しました。ぜひディープラーニングの技術を身につけ、資格をとっていただきたいと思います。JDLAの会員はディープラーニングを提供するベンチャー企業が中心で経済産業省からの支援も受けています。
また英語が得意な方でしたら、Coursera(無料オンライン講座)のディープラーニング講義で学ぶという方法もあります。世界中の人がCourseraのディープラーニングで勉強しています。「Coursera deep learning」で検索してみてください。
「ディープラーニング×ものづくり」で大きなチャンスを迎えていますが、その一方で、スピード感を含め課題も多い。何とかこのチャンスをものにしていただき、高いものづくりのニーズに加え、ディープラーニングの技術をぜひ活用していただきたいと考えています。(完)