Home > コンピュータ > コンピュータ操作 > ソフトウェア > OCR

OCRアプリケーションを使用する

新規作成日 2022-12-17
最終更新日

文字が写っている画像から、文字をテキストデータに変換するアプリケーションが、OCRアプリケーションです。

印刷された住所録から、年賀状ソフトで使用する住所データを作成する場面など、紙に印刷された情報をコンピューターで利用する場合に、自分が手作業で文字を入力する作業を大幅に軽減できます。

そのほかにも、英語で執筆された紙の書籍を、インターネット翻訳で日本語で読もうとする場合には、英文をテキストデータで取得する必要があるため、必ず必要になります。

パソコンの使い方によっては、あまり活用する状況を思い浮かべることができない方もいるかと思います。

本格読取5

「本格読取5」は、ソースネクストが販売するOCRアプリケーションです。

他のソースネクストが販売している商品と同じように、ソースネクストのセールのページで、安く販売されていることがあります。購入を検討する際は、確認してみてください。

他のOCR製品と比較して安価です。しかし、体験版が存在しないので、実際の使い心地は購入して使用してみないとわかりません。

使ってみたところ、日本語の文章を認識する場合は、特に何も感じませんでしたが、英文を認識させるのであれば、他の製品を検討したほうが良いかと思います。

A4スキャナで取り込んだ画像を想定しているようで、A3スキャナなどで取り込んだ大きな画像だと認識させることができないことに注意が必要です。

読取革命 16

「読取革命 16」は、ソースネクストが販売しているOCRアプリケーションです。

他のソースネクストが販売している商品と同じように、ソースネクストのセールのページで、安く販売されていることがあります。購入を検討する際は、確認してみてください。

体験版が存在しないので、実際の使い心地は購入して使用してみないとわかりません。

ABBYY社製の英語OCRエンジンを搭載

「読取革命 16」を購入して使用してみた

英語で執筆された書籍を、翻訳ツールで、日本語に翻訳するために、書籍のそれぞれのページをスキャナ画像として取り込み、テキストデータに変換することを目的に使用した。

つまり、英文OCRとして使用した。その結果、十分な認識精度で認識されたので、かなり満足している。

O(英大文字のオー)と0(数字のゼロ)や、l(英小文字のl)とI(英大文字のアイ)、1(数字の一)などの誤認識は、当然発生するが、これは、テキストフォントによっては、形状からは区別できないものも存在するので単語として判断する必要があるため、誤認識は仕方ないと考えている。

汎用テキストエディタの正規表現を使用した検索置換リストによる検索置換を実行することで対処している。

それまで使用していた「eTypist Ver.10」と比較すると、購入しなかったこと自体を後悔するほど誤認識が少なくなった。発売年の古いOCRソフトを利用している場合、現行のOCRソフトの導入の検討をお勧めする。

「読取革命 16」は、ソースネクストのセールのページで、安く販売されていることがあるので、日本語と英語の文字認識のみが必要であれば、他の製品より安く利用できるメリットがある。

「本格読取5」A4スキャナで取り込んだ画像を想定しているようで、A3スキャナなどで取り込んだ大きな画像だと認識させることができないことに注意が必要です。改善してほしいです。

eTypist 15

「eTypist 15」は、メディアドライブが販売しているOCRアプリケーションです。

58か国語対応の「eTypist 15」と、英語と日本語に対応し、期間限定の利用権を購入する「eTypist One」があります。

また、5日間利用できる体験版があるので、使用してから購入するかどうかを判断することができます。「e.Typist v.15.0 体験版 【5日間】

e.Typist One 無料体験版

FineReader 15

FineReader 15」は、英語OCRアプリケーションに定評のあるABBYYのOCRアプリケーションです。192言語の読み取りに対応しています。

ソースネクストが販売しており、27500円です。

FineReader PDF Standard

FineReader PDF」は、ABBYYが販売するPDFアプリケーションです。画像テキストのテキストデータ化も行えます。

英文画像テキストのテキストデータ化には、定評があります。

販売形態は、パッケージの購入ではなく、サブスクリプションモデルで、期間の限定された利用権を購入する形になります。

個人向けプランでは、13530円/年、2195/月になります。

体験版が存在します。

Omnipage Standard

Omnipage Standard」は、PDFアプリケーションです。画像テキストのテキストデータ化も行えます。

OmniPage 18.0 Standard ¥18,567(為替の変動によって、価格も変動するようです)ページを離脱しようとすると、10%OFFクーポンが提示されました。

Readiris PDF Standard

Readiris PDF Standard」は、PDFアプリケーションです。画像テキストのテキストデータ化も行えます。

体験版が存在します。S129

Tesseract OCR 5.2

Tesseract OCR」は、オープンソースのOCRエンジンです。

単体で使用する場合は、コンソールアプリケーションとして機能します。アプリケーションに、OCR機能を搭載する際に組み込んで使用します。

画像パターンの学習方法も提示されており、様々な言語の認識辞書も提供されています。

Microsoft OCR

「Microsoft OCR」 Windows OSに搭載されているOCRエンジンです。プログラムを作成する際に利用するものです。

Windows.Media.Ocr 名前空間で利用できます。

このエントリーをはてなブックマークに追加