連載
» 2019年03月15日 10時00分 公開

分かったつもり? AI画像認識:3分で知る、ディープラーニングで「できること」「できないこと」

従来の機械学習に比べて、圧倒的な精度を誇る深層学習。しかし、なぜそれが可能なのでしょうか。その仕組みを知ると、深層学習の「できること」「できないこと」が見えてきます。

[中尾雅俊, 矢嶋 博,パナソニック ソリューションテクノロジー]

監修:中尾雅俊

パナソニック ソリューションテクノロジー AI・アナリティクス部ソリューション推進課 主事

2017年にNVIDIAとの協業を担当したことを皮切りに、AI・データ分析中心の業務を推進。初期投資や導入リスクが大きい、「人工知能の現場導入で失敗させない」活動としてセミナー講演など多数実施。受講者からは、「AIがよく理解できた」「そんなノウハウを話しても良いの」と心配されるほど。最近の趣味は実用を兼ねたDIYや果樹菜園など。

監修:矢嶋 博

パナソニック ソリューションテクノロジー 産業IoTSI部ソリューション推進課 係長

製造業向け「AI画像認識ソリューション」のSEとして、営業支援やPoC推進を担当。ソフトウェア開発からITインフラ構築まで、これまでの幅広い経験を生かし、AI画像認識システムの提案から導入、AI学習トレーニングまでを手掛けている。趣味の風景や家族写真撮影に加え、学習用画像収集をライフワークにしている。

 本連載では、AIやAI画像認識に対する過剰な期待やよくある誤解を「5つのミスジャッジ」として整理してご紹介してきました。では、そうしたミスジャッジを防いだとして、AI画像認識を現場に導入することで、どんなメリット、そしてデメリットを生むのでしょうか。次のテーマとして、AI画像認識の「真実」に迫ります。

 画像認識などの分野で、ときに人を超える認識精度を誇るディープラーニングですが、その仕組みから得意でない分野もあります。今回は、分かっているようで知らない、ディープラーニングの仕組みとその特徴を分かりやすく解説します。

ディープラーニングで「できること」「できないこと」

 AI画像認識のコア技術の1つにディープラーニング(深層学習)があります。ディープラーニングは、収集したデータから特徴を学習する工程を何層にもわたって繰り返すことで、高い認識精度を実現する技術です。画像認識・音声認識の領域では、すでに人を超える認識精度を実現しているケースも報告されています。

 これまでの画像認識では、画像に含まれる特徴的な部分を人間が判断し、人間が書いたアルゴリズムに沿って分類していく手法が一般的でした。例えば、「猫」を認識する場合、「とがった耳」「アーモンド型の目」「丸くなった背中」といった要素に対してアルゴリズムを設計し、記述していました。

 ただ、猫の耳はネズミにかじられて欠けているかもしれませんし、夜には目が丸型かもしれません。驚いて背筋がピンと伸び切った猫もいるでしょう。そうしたさまざまな要素を人が全て判断してアルゴリズムを設計することには限界があったのです。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

ホワイトペーパーや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。