画像OCR検索
QuickSolutionは文字情報を含むファイルやデータだけではなく、画像ファイル(写真/イラスト/画面キャプチャ)や画像PDF(OCR未処理で文字情報を含まないPDF)に写っている文字も、自動的にOCR処理を行うことによって検索できます。ここでは、QuickSolutionによる画像検索と活用イメージについてご紹介します。
OCRとは
OCRとは、光学文字認識(英語では"Optical Character Recognition/Reader")のことで、画像から文字を読み取り、コンピュータが認識できる文字情報に変換する技術です。近年では機械学習や深層学習といったAI(人工知能)の発達により、非定型フォーマットの文字列や手書き文字列の識別率も向上してきました。誤認識があった場合には、正解データをAIにフィードバックすることにより、OCRの認識精度を上げることが可能になっているものもあります。
QuickSolutionで画像OCR検索
画像ファイル、Officeファイル内の画像をOCR検索
冒頭でもお伝えしたとおり、QuickSolutionでは文字情報を含むファイルやデータだけではなく、画像ファイル(写真/イラスト/画面キャプチャなど)に写っている文字も、自動的にOCR処理を行い検索することができます。さらにOfficeファイル(Word, Excel, PowerPoint)内に張り付けられた画像にも対応しています。別途OCR製品を用意していただく必要もありません。
画像PDFもOCR検索が可能
PDFはビューワがあれば簡単に文書を閲覧できるため、一般的によく使われています。PDFを作成する方法にはいくつかありますが、代表例としては下記が挙げられます。
- Officeソフトで文書を作成し、PDFに変換して保存
- 紙で保管していた文書や領収証などを、複合機でスキャンしてPDFとして保存
- 複合機の自動OCR機能で文字情報を付与されたPDF(文字情報付きPDF)
- 複合機でスキャンした画像をそのまま保存したPDF(画像PDF)
「1」と「2-1」はPDF内に文字情報を含んでいるため、一般的なソフトウェアでもファイルの内容を検索することは可能です。では、「2-2」の画像PDFはどうでしょうか。画像PDFには文字情報が付与されていないため、これを検索するためにはOCR処理を行って文字情報を抽出する必要があります。
QuickSolutionなら、このような画像PDFからも自動的にOCR処理を行い、検索対象にすることができます。これまで検索できなかった画像PDFでも、その中に含まれる文字で検索できるようになるため、情報資産として活用しやすくなり企業内の情報活用を促進します。
あいまい検索でOCRの誤認識を吸収
ここで気になるのがOCRの認識精度(OCR誤認識)の問題です。近年では認識精度は高まってきていますが、それでも一般的にはOCRの認識精度は100%ではなく、画像の品質や使用するフォント、OCRソフトの性能によって、その精度は変わってきます。たとえば、数字の「1(いち)」、英語の「l(エル)」、記号の「!(エクスクラメーションマーク)」は、文字の形状が似ているため誤認識しやすい文字の一例です。
この問題もQuickSolutionなら安心です。QuickSolutionのあいまい検索を活用すると、検索条件に完全に一致していなくても、検索にヒットさせることができるため、上述のOCR誤認識を吸収できます。
製品説明・トライアルも実施中
気軽にお問い合わせください
キャプション生成サービスとの連携
ここまではQuickSolutionの画像OCR検索について説明してきましたが、その他の画像認識技術と組み合わせることで、文字情報が含まれていない画像ファイルも検索対象にすることができます。ここからは、その一例について解説します。
カメラアプリの顔認識機能などに用いられる画像認識技術。AI技術の一分野であるディープラーニング(深層学習)の急速な発展により、この画像認識も著しい進化を遂げています。
入力画像を分析し自動的にキャプション(タグ)を生成するサービスやAPIも数多くありますが、その精度も飛躍的に向上しており実用レベルと言えるでしょう。画像認識により自動的に生成されたキャプション(タグ)は、画像検索やカテゴライズに役立つ有益な情報です。この情報をさらに効率よく活用する鍵がQuickSolutionにあります。
近年、画像認識の精度は非常に高くなっていますが、その認識率は100%ではありません。また、我々人間が想定するキーワードとは少し異なるキャプション(タグ)が付くこともあるでしょう。そのため、画像認識により付与されたキャプション(タグ)を完全一致検索した場合、検索漏れが生じる可能性も高いのです。
しかし、QuickSolutionの以下の機能を用いることで、欲しい情報を効率的に探し出すことが可能です。
- シソーラスなどの各種辞書を使用した検索が有効です。図の例の場合、同義語の「子供」と「こども」はQuickSolutionの異表記辞書に登録されているため同じ語として検索できます。
- あいまい検索では、検索クエリと完全一致しなくても類似したデータを検索することができるため、求める情報を漏れなく抽出することが可能になります。
- セマンティック検索を使うと、検索クエリの意味を理解し検索ユーザの意図・目的に合った検索結果を得ることができるため、より効率的に検索を行えます。セマンティック検索では構文解析・意味解析を行うため、図の例のように検索クエリと構文が一致し意味が近い(「育てる」≒「栽培する」)データは、検索結果上位に表示されます。
画像認識とQuickSolutionの組み合わせで業務の効率化を実現しましょう!