AI-OCRとOCRの決定的な違いとは?活用事例を紹介
OCRは、文字認識によってアナログデータのデジタル化を促進する技術です。また、近年はAIとの組合せにより精度が向上した「AI-OCR」が急速に広まっています。AI-OCRは単なる文字認識だけではなく、さまざまな業務の自動化・効率化のカギを握るツールとして期待されています。
そこで今回は、AI-OCRの概要やOCRとの違い、ビジネス領域での新しい活用事例などを紹介していきます。
目次
1.AI-CORとは?OCRとの違い
2.AI-OCR特有の使われ方
3.AI-OCRの課題
4.まとめ
1.AI-CORとは?OCRとの違い
高精度かつ学習可能なAI-OCR
OCRとは「Optical Character Recognition/Reader」の略称で、日本語では「光学的文字認識」と呼ばれます。手書きや印刷などで入力された文字情報を、デジタルな文字コードに変換する技術の総称です。紙やPDFファイルの書類を画像情報として読み取り、そこから文字情報を抽出するといった使われ方が一般的です。
このOCR技術をAIの力で強化したものが「AI-OCR」です。AI-OCRは、従来のOCR処理をAI技術の一要素である深層学習(ディープラーニング)によって強化したツールです。
一般的にOCRは、読み取りたい項目の場所や範囲を特定する「文字検出(レイアウト識別)」と、文字自体の判別を行うための「文字認識」という2つの技術要素で構成されます。AI-OCRでは、この2つを深層学習で強化し、従来型のOCRが苦手としていた状況であっても高い認識精度を実現しています。
具体的には、正解を含む学習データ(教師データ)を用いて、未知の情報に対応する「教師あり学習」(※)によって精度を高めていきます。AI-OCRは非常に高い文字認識の精度を誇り、最新のAI-OCRでは一般的に正読率が97~98%に達していると言われています。ちなみに従来型のOCRの場合、手書き文字の読取精度は10~70%程度になることもあるようです。さらにAI-OCRは、非定型帳票の読み取りでも高い正読率を実現します。
既存のOCRとの違いは?
一般的にOCR処理は以下6つのステップで進みます。
(1)画像取り込み
原稿や書類、写真などを画像として取り込む工程です。
(2)レイアウト解析
読取対象となる文字が記載されている場所や範囲を特定し、読み取り順序を決定します。
(3)行(項目)の切り出し
レイアウト解析で特定した場所、範囲を個別に切り出します。
(4)文字切り出し
行(項目)の切り出しで得た情報から、さらに読み取り対象とする文字を1文字ずつ切り出します。
(5)文字認識
切り出した文字について正規化、特徴抽出、パターンマッチング、知覚処理などを施して文字の確定作業を行います。これら複数の処理を経ることで、異なる大きさの文字が混在している、「つぶれ」や「かすれ」があるといった場合でも、正常に文字を認識することが可能です。
(6)出力
読み取ったデータを特定のフォーマットに対応する形式で出力します。近年のOCRソフトは、Word・Excel・PDF・HTMLなど複数のフォーマットに対応していることが一般的です。
AI-OCRは、深層学習(※)によって「レイアウト解析」「行(項目)の切り出し」「文字切り出し」「文字認識」の精度が向上しています。そのため「行や文字の接触」「かすれ文字」「文字の背景に情景画像がある」「取り消し線がある」といった場合でも文字の認識が可能です。
また、文字認識におけるパターンマッチング設計が不要といったメリットもあります。
※深層学習(ディープラーニング):AIの一種である機械学習(マシンラーニング)のための手法のひとつ。人間の神経細胞の仕組みを模したニューラルネットワークを用いて、画像・音声などさまざまなデータの学習を行う。
AI-OCRとOCRは強みが異なる
ただし、従来型のOCRもAI-OCRにはない強みがあります。それは「小規模かつ低コストで使い始められるため導入までの敷居が低い」という点です。
従来型のOCRは、AI-OCRのように巨大な学習データや学習のためのシステムが不要なことから、小規模な環境で実行できることが多いです。一方、AI-OCRは学習のためのコストが必要ではあるものの、手書き文字や隣合う文字と文字との間隔が必ずしも均一にではない読み取り領域(フリーピッチ)に対応するほか、学習による精度向上も見込めます。
つまり、「小規模かつローカルな環境で低コストに実行するならば従来型のOCR」「環境に投資して精度を高めていくならばAI-OCR」という使い分けが可能です。
2.AI-OCR特有の使われ方
AI-OCRの活用では、他システムとの連携やデータ同士の比較といった新しい使われ方も注目されています。
RPAとの連携による「読み取り・入力」の自動化
近年、AI-OCRによる高精度な文字認識とRPAによる文字入力の自動化を組み合わせたソリューションが続々と登場しています。AI-OCRとRPAの組み合わせにより、紙書類の情報を読み取りデジタルデータ化し自動的にシステムへ登録するなど、バックオフィス業務をワンストップで自動化することも可能です。
監査業務における突合作業
会計監査の分野では、種類の異なる2つの資料の内容を照らし合わせて事実や記録が一致していることを確認する業務があります。こうした業務は「証憑(しょうひょう)突合」や「帳簿突合」と呼ばれ、非常に多くの時間を要することで知られています。これら突合業務の効率化に使われてるのがAI-OCRです。
被監査会社から提出された紙書類をAI-OCRに読み込ませ、スプレッドシートごとに出力することで、紙の状態よりも突合作業が進めやすくなります。また、出力したデータに対して別のツールで差分比較を行えば、突合業務の自動化・効率化も期待できます。
文字間隔が均一ではない項目が多数存在する申告書データの取り込み
従来型のOCRが特に苦手としていた「フリーピッチ項目の手書き文字」の認識において、AI-OCRは高い読取精度を誇ります。フリーピッチ項目の帳票は「口座振替依頼書」や「税納付書」「自治体窓口に提出する申請書」などで採用されており、その大半が手書きです。また、こうした書類は項目の数が多いという特徴もあります。AI-OCRはフリーピッチ項目が多数存在(20以上)する手書き書類の取り込みで高い精度を発揮し、伊丹市の検証結果によれば税関係の申告書類において「項目単位で89%、文字単位で97%」の読取精度を誇ることが示されています。
参考:伊丹市「Smart Itami」AI等の技術革新や働き方改革の推進に関する調査研究 (PDF)
3.AI-OCRの課題
ただし、現状のAI-OCRは発展途上であり、次のようにいくつかの課題があります。
帳票によって認識精度が変化する
前述の伊丹市の検証結果では、帳票フォーマットによって読取精度が60%台~90%弱まで変動することが示されています。したがって、複数の帳票フォーマットを比較し、認識精度が高いフォーマットを標準化するといった対策が必要です。
連携システムの構築が不可欠
AI-OCRを運用するためには、前処理である画像補正や帳票識別、深層学習のためのシステムが必要です。こうした連携先システムの構築には、ノウハウを持ったベンダーの力が不可欠になるでしょう。
学習にかかるコスト
AI-OCRの恩恵を最大限に受けるためには、AIに対して「教師あり学習」(※)を重ねておく必要があります。この時ネックになるのが、学習用データの準備にかかるコストです。一般的にAIの学習用データは、一定以上の量と質を担保しなくてはなりません。そのため、手書き文字情報の収集やデータクレンジングといった事前作業に多くの時間を費やすことが想定されます。ただし、この点についてはクラウドサービスの活用による解決が可能です。クラウドサービスを使うことで、膨大な量のデータで学習したAI-OCRにより、導入後すぐに高精度な文字認識の恩恵を受けることができます。
(※)教師あり学習:学習データに正解を与えた状態で学習させる機械学習の学習手法の一つ。
4.まとめ
今回は、AI-OCRの概要やOCRとの違い、AI-OCRの課題などについて解説しました。AI-OCRは既存のOCRにディープラーニングが持つ学習要素を加え、高い認識精度を実現したツールです。ただし、OCRに比べるとシステムの規模が大きくなります。また帳票フォーマットの標準化や連携システムの構築、学習用データの準備が必要という課題もあります。こうした課題を早期に解決するために、クラウドサービスの活用などで外部からノウハウを取り入れることも検討してみてはいかがでしょうか。
DNPは顧客の真の課題を洗い出し、さまざまなツールやサービスを組み合わせて「個客」にとって最適な解決策をご提案します。
例えば、AI-OCRソリューションとDNPのBPRコンサルティングサービスを組み合わせていただくことで、電帳法(電子帳簿保存法)に対応しつつ業務全体の最適化を実現します。DNPのBPRコンサルティングサービスでは、業務内容、改善ニーズなどに応じて、実施・運用フェーズを見据えたプランニングを行います。業務の再構築やAI-OCR活用により、お客さまの時間資源の創出をご支援いたします。
AI-OCRの導入はもちろん、業務革新を検討される際にはぜひDNPにご相談ください。
※2022年11月時点の内容です。
おすすめコンテンツ
AI-OCRの選び方
~業務効率化につなげるための重要なポイントとは?~
精度の高さから、AI-OCRが注目されています。AI-OCRの導入効果を高めるためには、導入に合わせて業務プロセスを再検討する必要があります。業務効率化につながるAI-OCR製品の選び方について解説します。
電帳法改正に対応できていますか?
法改正に対応する書類管理の仕組みづくりとは
改正電子帳簿保存法やインボイス制度への対応などにより、書類管理業務の内容が変わろうとしています。書類管理業務に影響を与える制度改正の内容や、その対応方法を紹介します。
AI-OCRによる業務効率化
~不動産・住宅設備業界における導入事例~
デジタル技術を利用した業務への変革に有効なのがAI-OCRです。不動産・住宅設備業界における具体的な事例とともに、AI-OCRの活用領域について解説します。