オートメーション道場

RPAツール「Automation 360」(旧Automation Anywhere A2019) の使い方についてまとめていきます。

IQ Botとは

IQ Botとは

Automation Anywhereには、RPAとよく一緒に組み合わせられるAI-OCRのような製品が同梱されています。この製品は「IQ Bot」と呼ばれます。この記事では、IQ Botの概要と、普通のAI-OCRとの違いについてみていきます。

 

目次

 

AI-OCRとは

OCR (オー・シー・アールと読む、Optical Character Recognitionの略)とは、日本語で言うと光学文字認識のことで、スキャナーと呼ばれるデバイスで読み込まれた紙の画像イメージから、書かれている文字そのものをテキスト情報として抜き出してくれる仕組みです。たとえば名刺をスキャナーにかけてデータ化してくれるのもOCRの機能です。

「AI-」がついているのは、「OCRの機能をAIを使った高度な処理で高機能に実現していますよ」というメーカーの主張でついているものです。いままでのOCRと大きく使い勝手が違うわけではありませんが、読み取り精度が向上していたり、製品によっては精度をあげるための独自の拡張機能を実装していたりします。また、文字等を読み取る中心的なプログラムの事をOCRエンジン」と呼びます。

 

主要なAI-OCRの種類は?

主要なAI-OCRには以下のような製品があります。

  • ABBYY: 最も広く普及しているOCRの老舗。業界最多210言語に対応。複合機搭載OCROEMも昔から行っています。実はロシアが本社。オンプレミス。
  • Tesseract OCR: フリーのOCRエンジン。フリーであるためRPAソフトに組み込まれている数は一番多い。オンプレミス。
  • Amazon Computer Vision API: AWSが提供するクラウドベースのOCRエンジン。
  • Google Cloud Vision APIGoogleが提供するクラウドベースのOCRエンジン。
  • Microsoft Computer Vision API: Microsoftが提供するクラウドベースのOCRエンジン。
  • DX Suite (AI Inside): 国内のベンチャー企業が提供するOCRエンジン。オンプレミス/クラウド両方可能。日本語の精度、特に手書きや帳票レイアウト読取に力を入れている。NTTの「AIよみと~る」をはじめ多くのOEM製品がある。
  • Tegaki (コージェントラボ): 国内のベンチャー企業が提供するOCRエンジン。オンプレミス/クラウド両方可能。日本語の精度、特に手書きや帳票レイアウト読取に力を入れている。
  • Flax Scanner (シナモン): 国内のベンチャー企業が提供するOCRエンジン。オンプレミス/クラウド両方可能。日本語の精度、特に手書きや帳票レイアウト読取に力を入れている。
  • CLOVA OCR (LINE Brain): LINEの各サービスで使われているクラウドベースのOCRエンジン。まだベータ版である。

 

IQ BotはAI-OCR?

IQ Botは上のリストには登場しませんでしたが、AI-OCRなのでしょうか?実は、IQ BotはAI-OCR「のような」製品、と最初に触れましたが、「ような」というのがポイントで、厳密に言うと横並びの製品ではありません。

一番大きな違いはOCRエンジン自体は提供せず、読み取り対象にあったOCRエンジンを使って、レイアウトや構造をAIで解析してビジネスユーザーが自分で読み取り精度を上げるフレームワークであることです。

文章だとちょっとわかりずらいので、一般のAI-OCRとIQ Botの違いを、図にしてみましょう。

一般のAI-OCRとIQ Botとの違い

一般のAI-OCRとIQ Botとの違い

このように、IQ BotはRPAの中にシームレスに統合されつつ、他のAI-OCRエンジンをうまく使って、さらにAIの力で読み取り精度を向上させます。想定としては大量の紙データがあり、ちょっとずつレイアウトが違うものがあるものを大量に処理する際に効率がよくなります。

IQ BotはABBYY、Tesseract OCRMicrosoft Computer Vision APIといったOCRエンジンが使えます。将来的にはGoogle Cloud Vision API、TegakiといったOCRエンジンも使えるようになる予定です。

IQ Botで対応しているOCRエンジン

IQ Botで対応しているOCRエンジン

 

IQ Botが得意とするデータのパターン

以下のような場合は、一般のAI-OCR製品を使うよりもIQ Botが向いているといわれています。

  • 業務自動化のために、紙に記載内容を単にPDFにするだけではなく、内容自体をテキストで抜き出しデータ化したい。
  • データ化したい帳票の種類が多い場合。
  • 帳票から取得したい項目が多い。
  • 帳票の中の明細の数が可変になっている場合にフレキシブルに対応したい。
  • 誤りチェックロジックを読取ロジックにカスタマイズして入れてしまいたい。

おおまかに図解すると以下の通りです。

OCR、AI-OCR、IQ Botのカバー範囲

OCR、AI-OCR、IQ Botのカバー範囲

また、IQ BotはAutomation AnywhereのRPAから直接呼び出せるため、密な連携を行うことができます。

autodojo.hatenablog.com

 

RPAが適用できる業務のうち、約半分は紙がかかわっているともいわれています。RPAと一緒にIQ Botを活用する場面も今後増えてくると思われます。

 

 

オートメーション道場