新規事業・BPR・DXにおけるOCR・画像認識とは?

OCR(オプティカル・キャラクター・レコグニション)とは、文字を認識する技術のことです。AIの深層学習(ディープラーニング)によってその精度は高まっており、書類や帳票を自動的に読み取ってデータ化することで、さまざまな分野の業務改善に役立てられています。 文字だけでなく、画像内に写っているものが何かをコンピュータが認識する技術を画像認識といい、人の顔や文字など、コンピュータがその類似や差異を学習することにより、そこに写ったものを認識し、識別や分類を行います。この画像認識もAIの発達によって、その精度は飛躍的に向上しています。

Point.1 働き方改革の推進を加速するOCR

OCRの大きなメリットは、紙媒体のデジタル化にあります。紙として保存されている古い情報を効率よくデジタル化し、ネットワーク上で活用することは、BPRおよびDXにおける成功要因の一つです。 書類に書かれた情報をキーボードで入力するという、従来人が行っていた作業には時間と労力がかかります。OCRを使用することにより、認識結果を業務ソフトウェアと連携してデータ処理することができ、省スペース化や検索の迅速化が実現します。 紙ベースでのやりとりから脱却するためのOCRは、テレワークなどの働き方改革を進めるうえでも有効です。在宅ワークでは、会社にある紙の書類を確認することが困難なため、申込書や契約書など、業務に必要な資料がデジタル化されていれば、働く場所を選ばずに、情報の閲覧が可能です。OCRによって情報共有がスムーズになり、業務効率化を高めることができます。 また、従来のOCRは印刷された活字の識字率は高くても、手書き文字には弱いという面がありました。しかしAI技術の活用によって飛躍的に改善されており、手書きによる文字の認識も高いレベルで可能となっています。AI技術を活用したOCRのことを、「AI OCR」または「ICR(インテリジェント・キャラクター・レコグニション)」と呼びます。AIにより文字の補正結果を学習することで、識字率の向上が図られています。

Point.2 あらゆる分野に波及するAIの画像認識

AI技術は文字だけでなく、広く画像認識でも活用されています。画像認識の例として、カメラの画像から人の顔を認識する技術が知られています。AIは人の顔を構成するピクセル(画素)のパターンを大量に学習することで、画像の中から人の顔を認識することができます。 画像認識技術は、さまざまなビジネスシーンでも活用されています。例えばデジタル地図データの開発では、AIを用いてコンピュータに航空写真を分析させ、停止線と横断歩道を検出する試みが行われています。 小売業では、来店した客の行動をネットワークカメラによって分析し、マーケティングデータとして商品ディスプレイの変更などに生かしています。 画像の「認識」から、物体の「検知」を行う技術もさらに進化しています。工場の製造ラインなどの検品工程では、製品の正常な状態と異常な状態の画像データをAIに学習させ、不良品の検出を行っています。汚れや色ムラなどを検知して不良品の判別を自動で行うことで、ヒューマンエラーの低下や不良品の発見精度の向上を図っています。 また自動運転技術においても、物体検知は重要な役割を担うと期待されています。人や障害物などを認識・検知し、適切な判断が瞬時にできてこそ、自動車運転は実現に向けて大きく前進します。 このほかにもインフラ設備の保守・点検や、ドローンによる農薬散布など、画像認識の活用例はあらゆる分野に及んでいます。さまざまなビジネスの拡大、新規事業を図るうえで、さらに積極的に活用されていくと考えられます。

OCR・画像認識技術を活用したデジタルスタートアップ企業の最先端事例一覧をたった一文にまとめています