AI分析のプロが教えます、AIを使った画像解析を自分でやってみませんか?
日本電気株式会社
AI・アナリティクス事業部
マネージャー
祐成 光樹 氏
2日目である4月18日には日本電気株式会社のAI・アナリティクス事業部マネージャーである祐成 光樹氏が登壇。同社が開発した機械学習ソフトウェア、Rapidを事例を交えて紹介しながら、画像解析のススメ、AI導入成功の鍵についてご講演いただきました。
RAPID機械学習とは
本日は、NECが開発する「NEC Advanced Analytics – RAPID機械学習(以下 RAPID)」の製造業ユースケース、特に、製造工場における製品画像を用いた外観検査・検品工程への適用例についてお話しします。RAPIDは、先進AIアルゴリズムとして注目される「ディープラーニング」を搭載したエンタプライズ品質で活用できる機械学習ソフトウェアです。RAPIDは、分析対象データである、「画像」、「テキスト」、「時系列データ」に内在する「特徴量」をデータから自ら学習して、高精度な判断(分類、検知、推薦、予測 等)を実現する学習モデル(以下 モデル)を自動生成します。
RAPIDを利用しながら「自らデータ分析に取り組んでサービス化や業務改善を目指すお客さま」は、年々 増加傾向を辿って、その裾野も大学・研究機関といった先進技術の目利きをミッションとする組織から、「一般企業」の現場部門にまで拡大しています。これも、当初はプログラミングや複雑なパラメータチューニングが必要であったディープラーニングの敷居の高さを、GUIによるプログラムレス・チューニングレスで活用可能としたRAPIDの敷居の低さがお客さまに受け入れられた結果と考えています。
RAPIDを使ってデータサイエンティスト育成
お客さま主導でデータ分析作業を進める場合、その成功のカギを握るキーマンというものが存在します。それは、分析作業を主導、つまり、口はもちろん、手足を動かして汗をかいていただけるお客さま側の、データサイエンティストを擁立いただくことです。選出いただくデータサイエンティストは、AI専門家である必要はありませんが、やはり一定のITスキルを保有する方が望ましいです。そして、データサイエンティストに対して、分析作業に時間と労力といった一定工数を投入可能な環境作りにご配慮いただくことが重要となります。
このように、御社で分析官を擁立いただいた後、ぜひ業務課題を解決するために、NECのディープラーニング製品「RAPID機械学習」を採用いただければと考えています。RAPIDの特長を、検査・検品工程で製品画像から良品・不良品を分類する外観検査を想定して説明します。RAPIDは、画像データから良品・不良品の特徴を自ら学習します。具体的には、例えば、欠陥種別毎の画像を100枚、良品の画像を100枚準備いただき、RAPIDに投入すれば、欠陥と良品ワーク表面の差異を自ら学習して、良品・不良品を分類するためのモデル(RAPID上で実行可能は判断プログラム)を自動生成します。本モデルの注目ポイントは、一見すると欠陥のようにも見える「良品表面に存在する微細な紋様やオブジェクト」も、良品の特徴としてきちんと学習するため、人間の目視による官能検査に近い良品・不良品分類を実現できる点にあります。
はじめてデータ分析に携わるデータサイエンティストにとって、分析プロセスの1つ1つを簡単に、直感的に、スムーズに実行できることはとても重要です。RAPIDは、AIの専門家ではないお客さま部門で先進のディープラーニングを存分に現場活用いただくことを開発コンセプト(下記①②③)としており、お客さま社内のスピーディなデータサイエンティスト育成を目指した分析ソフトウェアとして最適です。
①学習データの管理から 学習・評価までの一連の分析プロセスを強力支援する判り易いユーザーインターフェース(GUI)をご提供します。
②ディープラーニングで活用ハードルとなるチューニング作業を大幅削減します。
③良品と不良品の両方を学習するのではなくて、良品だけを学習することで不良品を検出するワンクラスアルゴリズムという先進アルゴリズムを搭載しています。
RAPID分析カルテの一例
分析作業を成功に導くデータサイエンティストに注目して、その役割について具体的に分析カルテを通じてご紹介します。
本分析カルテは、良品・不良品の両方の画像データを学習するマルチクラスアルゴリズムで、メタル系ワークに潜む欠陥の位置を特定する検知案件です。実際に、ワーク自身を目視確認すると、欠点の視認性は高いにも関わらず、お客さま提供データをそのままRAPIDに投入すると、期待精度が出ない状態でした。具体的には、欠点を見逃してしまう検知漏れ率が38%、欠点でないものを欠点と言ってしまうオオカミ少年、つまり過検知率が65%という状態でした。
このような、パフォーマンスに対して、まずはデータマネージメントを徹底して、欠陥と非欠陥の判断境界線を明確化することが定石となります。つまり、何が欠陥で、何が非欠陥であるかを、定義して、その定義に従って学習データを厳密にラベリングすることが必要です。具体的には、明確に欠陥と視認できるワーク画像もあれば、許容可能な良品表面の変化のようにも見えて欠陥と定義して良いかに悩むグレーなワーク画像も存在します。この場合、まずは判断に悩む画像は削除した上で学習データを構成して、今後の精度改善の土台となるベーシックモデルを生成することが定石となります。
本分析では、ベーシックモデルに対して、「欠点の種別」、「画像コンテキスト(明度、形状、ノイズ 等)」を重要視しながら十分な学習データを確保することで、検知漏れ率6%、過検知率2%までパフォーマンス改善しました。このようにRAPIDを使いながら、データマネージメントを徹底することで、データサイエンティストの最も基本かつ重要な分析タスクとなります。
RAPIDの最新導入事例;JSR株式会社 様
AI導入成功の鍵は「業務価値」を考え抜くこと
AIをトライアル(PoC:Proof of Concept)で終わらせず、お客さま業務に実導入して定着させていく鍵は、プロジェクトスタートの上流フェーズでお客さまが目指す「業務価値」をきちんとゴール設定することです。そして、AIアルゴリズムを一つの価値創出手段として捉えて、AIアルゴリズムをシステム化するためのエンジニアリングや業務運用プロセス変更といった総合力で業務価値実現を目指すビジネスマインドが重要です。
AI導入に向けたトライアルや技術検証を推進し始めると、AIモデルの判断精度(検知漏れ率、過検知率 等)に意識を奪われがちになります。精度を探求することはもちろん重要なのですが、AIの現場導入をさらに加速するためには「現状の精度であればどんな業務価値を実現できるのか」という逆転の発想を持つことも忘れてはいけません。(終)