特集
» 2019年03月04日 10時00分 公開

AI-OCRとは? OCRとの違い、選定ポイントと導入の注意点

AI-OCRは、機械学習や深層学習といったAI技術を活用するOCR(光学的文字認識)技術だ。RPAと連携することで自動化の範囲を押し広げるものとして注目が集まる。果たしてその実力とは? OCRとの違いや失敗しない製品選定のポイント、導入の注意点を解説する。

[吉村哲樹,オフィスティーワイ]

RPAとのセットで業務自動化を実現する「AI-OCR」

 企業の働き方改革や生産性向上を後押しする「RPA(Robotic Process Automation)」が注目を集めているが、それに伴い「AI-OCR」という技術も脚光を浴びるようになってきた。AI-OCRは、その名の通りOCR(Optical Character Recognition:光学的文字認識)にAI(人工知能)技術を組み合わせたもので、RPAと組み合わせることで広範な業務の自動化が可能になる。

 OCRとは、紙の書類をスキャンした画像データや、PDFなどの画像ファイルの中に含まれる文字(の画像)を自動的に読み取り、コンピュータで扱える文字データに変換する技術だ。例えば、紙の書類の内容を人間が読み取り、システムに入力するような業務の場合、OCRで書類の内容を自動的に読み取り、その結果をRPAでシステムに自動入力するという活用方法が考えられる。

 OCRの歴史は古く、既に多くの分野で実績を上げている。しかし、いまだ制約も多く、一般企業の業務に適用するには汎用性や費用対効果の面で課題もあった。AI-OCRは、近年発展が目覚ましいAIの技術、特に機械学習やディープラーニングの成果を応用することでOCRの精度や汎用性をさらに高め、より広範な用途への適用を目指す技術だ。

 本稿では、多くの企業においてOCRやRPAの導入を支援し、近年はセミナーやカンファレンス講師も務めるビッグツリーテクノロジー&コンサルティングの茅田宗宏氏に話を聞き、AI-OCRと従来のOCR技術との違いや製品選定のポイント、導入の注意点といった内容についてまとめた。

OCRの役割(出典:ビッグツリーテクノロジー&コンサルティング)

OCRの精度を決定付ける2つの要素

 OCRの機能を評価する際に、最も重要視されるのが「文字の読み取り精度」だ。ここでいう「精度」とはまず、活字や手書き文字をどれだけ正確に認識できるかを指す。文字認識の技術は既に長い歴史を持ち、少なくとも活字で記された文字の読み取りに関しては実用レベルに達している。

 紙の汚れが少なく、きれいにスキャンされた画像であれば、9割以上の精度で文字を正しく読み取れるのだ。後述するが、手書き文字に関しても、機械学習やディープラーニング技術の応用が進んだことで、急速に認識精度が向上しつつある。

 ただし、実用を考慮した場合のOCRの精度は、文字認識率だけでは決まらない。もう1つの要素である「場所特定率」も、最終的な読み取り精度を大きく左右する。場所特定率とは、その書類や帳票の中の「どの部分を読み取ればいいのか」を正しく特定できる確率を表す。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

ホワイトペーパーや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。