author avatar
  テストマネージャー  

概要
画像やPDFから文字を認識するには、OCRソフトが必要です。この記事は、使いやすく、流行りのOCRフリーソフトをすすめ、使い方を紹介します。



一、OCRとは

OCR(光学文字認識、英:Optical character recognition)は、活字、手書きテキストの画像を文字コードの列に変換するソフトであります。画像はイメージスキャナーや写真で取り込まれた文書、風景写真 (風景内の看板の文字など)、画像内の字幕が使われます。

OCRソフト

雑誌、書籍、契約書、新聞などを認識して、パソコンが読める電子ワードに変換し素早くパソコン入力したい場合は、OCRソフトを利用できます。手動入力せずに済むので、非常に便利です。

OCRの仕組み

OCRソフトを使用する時、まず画像の構造が分析され、ページがテキストブロック、表、画像などの複数のセクションに分割されます。単語と文字の分類が完了した後、一連の画像と比較し、多数の仮説を提案します。処理完了後、プログラムは最終的に認識可能なテキストを表示します。

OCRアルゴリズム:

  • マトリックスマッチング — 画像をピクセル単位で格納されたグリフと比較します。
  • 特徴検出 — グリフが線分、閉じたループ、線の方向、線の交差などの “フィーチャ (特徴)” に分解されます。検出機能は、表現の次元性を低下させ、認識プロセスを計算上効率的にします。これらのフィーチャは、文字の抽象的なベクトルのような表現と比較され、1つ以上のグリフプロトタイプに縮小されます。コンピュータビジョンにおける特徴検出の一般的なテクニックは、一般的にインテリジェント手書き文字認識と実際に最も近代的なOCRソフトウェアで使われます。
OCRの一番のメリットは時間を節約できることです。手動入力の入力ミスや仕事量を減ります。紙情報や画像のデータを編集できないが、OCRソフトにより、データを編集できるようになります。圧縮、結合、削除、画像追加などの処理も可能です。電子データの管理は、紙の書類の管理より簡単・安全です。

膨大な書類の中から必要な情報を探す場合、文書検索ができ大きな効率化につながるでしょう。コピペや編集も簡単に行えるため、紙資料で保管するよりも管理にかかる手間が大幅に減ります。共有が簡単になり安全性も高まります。OCR機能の活用で、仕事の効率が大幅に向上できます。

二、OCRフリーソフトのすすめ

1、Renee PDF Aide

Renee PDF AideはOCR機能があり、スキャンしたPDFや画像を編集可能な形式に変換できます。PDFをWord / Excel / PowerPoint / EPUB / Image / HTML / TXTなどの形式に変換できます。速度は200ページ/分に達します。一括変換も対応します。

日本語/英語/フランス語/ドイツ語/ロシア語/イタリア語/ポルトガル語など多言語変換に対応。OCRモードで言語を選択して、文字認識の成功率を高めることができます。

対応OS:Windows 10/8.1/8/7/Vista/XP(32bit/64bit)

多機能PDFツールRenee PDF Aide

メリット:
  • 複数言語を対応し、操作は簡単。
  • スキャンPDFと画像から文字認識可能。
  • 一括処理対応。
  • OCR精度が高い。
  • PDF編集機能もあります。

デメリット:

  • Windowsのみ対応します。

Renee PDF Aide - 初心者向けな多機能PDFツール多機能PDFツールRenee PDF Aide

使いやすい初心者も簡単に利用できます。

多機能PDF変換/暗号化/復号化/結合/透かし追加等。

安全性高いAES256暗号化アルゴリズムを使用し、PDFを保護します。

処理速度速い複数のファイルを同時に編集/変換できます。

複数形式対応 Excel/Text/PPT/EPUB/HTML/JPG等に変換可能。

多形式対応 Excel/Text/PPT/EPUB/HTML...

使いやすい初心者簡単に操作できます。

多機能PDF変換/暗号化/結合/透かし等。

無料体験無料体験 5632名のユーザー様に無料体験をしていただきました!

2、Microsoft OneNote

Microsoft OneNoteはWindows, macOS, Android, iOS, Windows Phone向けに公開しているフリーのデジタルノートアプリケーションです。テキストやメディアファイル等を挿入することができます。ファイルはOneNoteユーザー共有できます。このソフトもOCR機能があり、画像の文字を認識し、コピペできます。

OneNoteに画像を挿入し、画像を右クリックして、[テキストをコピー]をクリックすると、テキストをクリップボードに保存しコピーできます。印刷ファイルからテキストを抽出する場合も、操作は同じです。ページを右クリックして、[この印刷ページからテキストをコピー]をクリックします。

注意:OCR識別精度は画像の品質によって異なります。手書きの文字を識別する場合、OneNoteの精度が低いです。
対応:Windows 10/8.1/8/7/Vista/XP、Mac

Microsoft OneNote OCRソフト

メリット:
  • 単純なテキスト画像を処理する場合、精度は90%以上に達します。
  • スキャンPDFと画像の認識も対応。
  • 使いやすい。
  • フリーソフト。

デメリット:

  • フォームなどを含む複雑なファイルを認識するとき、精度が低い。
  • 一括処理はできません。
  • クラッシュすることがあります。

3、Simple OCR

SimpleOCRはフリーのOCRソフトです。画像やスキャンPDFをwordに変換できます。スキャンPDFや画像の変換は制限なく、無料利用dけいます。手書きの文字を認識するには、14日間を無料できます。SimpleOCRには、スペルチェッカーが組み込まれています。 さらに、スキャナーから直接読み取るように設定することもでき、出力ファイル形式はDOCまたはTXTにすることができます。

Microsoft OneNoteと同じ、OCR識別精度は画像の品質によって異なります。

対応OS:Windows 10 / 7 /8 /XP /Vista

SimpleOCR ソフト

メリット:
  • スペルチェッカーが組み込まれます。
  • 一括処理もできます。
  • フリーソフト。

デメリット:

  • 直接コピーできず、先にWordまたはテキストに出力する必要があります。
  • 機能が少ない。
  • 3つの言語のみ対応します。
  • フォントとフォーマットの検出はありません。
  • 画像(TIFF,JPG,BMP)のみ対応し、PDFを対応しません。

4、Boxoft Free OCR

Boxoft Free OCRは無料のOCRソフトです。英語/スペイン語/フランス語/ドイツ語/ロシア語/イタリア語/ポルトガル語など多言語変換に対応。また、さまざまな種類のスキャナーと直接接続できるため、紙の文書をスキャンして、スキャンした画像から直接テキストを抽出できます。

Boxoft Free OCRでテキストを編集できます。Microsoft Officeがなくても、OCRで認識されるテキストを編集できます。また、PDFページの修正、トリミング、回転などの最適化機能も提供します。

対応OS:Windows 2000/2003 / XP / Vista / 7 / 8 / 10

Boxoft Free OCR ソフト

メリット:
  • 指定ページを変換可能。
  • 操作は簡単。
  • 複数の言語を対応します。
  • OCR抽出した文字を編集可能。

デメリット:

  • Windowsのみ対応。
  • 更新はしていません。
  • 手書きの文字を認識できません。
  • PDF対応しません。

5、Free OCR

Free OCRは、Googleが管理しているTesseractエンジンを使用するWindows用のOCRプログラムです。OCR認識精度は高い。スキャンPDF以外、デジタルカメラやイメージスキャナーなどのTWAINデバイスもサポートします。 さらに、ほぼすべての画像、FAXドキュメント、TIFFファイルをサポートします。インターフェースはシンプルで使いやすいです。Free OCRの出力ファイルはプレーンテキストです。

対応OS:Windows 2000/2003 / XP / Vista / 7 / 8 / 10

FreeOCR ソフト

メリット:
  • フリーソフト。
  • 任意のスキャナーを対応します。
  • 画像を拡大できます。
  • Tesseract OCRエンジンの精度は高い。

デメリット:

  • PDFの最初のページのみ認識できます。
  • 1時間あたり10枚の写真/ファイルのみアップロードできます。
  • プレーンテキストのみ出力できます。
  • テキスト形式は保持できません。

6、Easy Screen OCR

Easy Screen OCRは任意の範囲のキャプチャーを取得し、Google のOCR機能を利用してテキストを抽出・編集できるようにするソフトです。ファイルをアップロードする必要がなく、認識したい部分をキャプチャすると、文字認識可能です。文字をほかの言語に翻訳する機能もあります。

ソフトは100以上の言語を認識でき、20の言語での翻訳をサポートします。最新バージョン(1.4.2以降)は、20回のみ無料利用できます。ただし、古いバージョンは引き続き無料で使用できます。

対応OS:Windows 10/8.1/8/7/Vista/XP、Mac

Easy Screen OCR ソフト

メリット:
  • 使いやすい。
  • 2つのOCRモードあり、100以上の言語を識別できます。
  • 識別した文字をほかの言語に翻訳できます。

デメリット:

  • キャプチャしたもののみ識別できます。
  • 認識した文字をほかの形式に変換できません。

7、gImageReader

gImageReaderはPDFや画像ファイルを読み込んで、指定された言語に基準としてOCR処理を行うTesseract OCRフロントエンド。ソフトを利用するには、Tesseractもインストールする必要があります。ソフトは、印刷されたドキュメントと手書きのコンテンツを認識できます。また、手動または自動の認識を選択することもできます。一括処理をサポートしています。 また、認識が完了すると、認識されたテキストと画像を比較して修正することができます。さらに、スペルチェッカーなどのさまざまなツールも提供します。

対応OS:Linux、Windows

gImageReader OCRソフト

メリット:
  • Tesseract OCRエンジンは高い精度があります。
  • 識別範囲を指定できます。
  • JPEG,GIF,PNG,TIFF画像、PDFを対応します。

デメリット:

  • TXTのみ出力できます。
  • Macを対応しません。
  • ほかの言語を識別する操作は複雑です。

8、Free OCR to Word

Free OCR to Wordは使いやすいOCRソフトで、精度も高いです。画像/スキャンPDFをWordに変換できます。ほとんど主流スキャナーと接続できるため、すべての紙の文書、雑誌、レポート、フォームを直接スキャンして、画像からテキストに変換できます。ファイルをデジタル化した後、データのバックアップと共有が便利です。JPG / JPEG、TIF / TIFF、BMP、GIF、PNG、EMF、WMF、JPE、ICO、JFIF、PCX、PSD、PCD、TGAなど、さまざまな画像からのテキストの抽出をサポートしています。

対応OS:Windows、Mac

Free OCR to Word ソフト

メリット:
  • 操作は簡単。
  • ほとんどのスキャナーと接続できます。

デメリット:

  • 文字フォントを識別できません。
  • PDFおよび複数ページのファイルはサポートしません。。
  • 英語のみ対応します。

9、PDFMate PDF Converter

PDFMate PDF ConverterはフリーのPDF形式変換ソフト。OCR機能もあります。スキャンしたPDFをWordに変換できます。OCR機能は制限あり、最大3ページを識別できます。また、PDFの作成、編集、変換、結合等の機能もあります。

対応OS:Windows、Mac

PDFMate PDF Converter OCRソフト

メリット:
  • 速度が速く、一括変換も対応。
  • 複数の言語を識別できます。
  • 複数のPDF編集機能があります。

デメリット:3ページのみ無料処理できます。

三、スキャンしたPDF/画像から文字認識・出力する方法

以上は認識のOCRフリーソフトです。必要に応じて選択してください。次にRenee PDF Aideを利用して、スキャンPDFから文字抽出して変換する操作方法を紹介します。
Renee PDF Aide - 初心者向けな多機能PDFツール多機能PDFツールRenee PDF Aide

使いやすい初心者も簡単に利用できます。

多機能PDF変換/暗号化/復号化/結合/透かし追加等。

安全性高いAES256暗号化アルゴリズムを使用し、PDFを保護します。

処理速度速い複数のファイルを同時に編集/変換できます。

複数形式対応 Excel/Text/PPT/EPUB/HTML/JPG等に変換可能。

多形式対応 Excel/Text/PPT/EPUB/HTML...

使いやすい初心者簡単に操作できます。

多機能PDF変換/暗号化/結合/透かし等。

無料体験無料体験 5632名のユーザー様に無料体験をしていただきました!
1、スキャンPDFを編集可能な形式に変換する方法

① Renee PDF Aideをダウンロードしてインストールし、ソフトウェアを実行して、Convert PDF部分を選択します。

多機能PDFツールRenee PDF Aide

② 上部の出力形式で「Word」を選択します。

PDFをWordに変換

③「ファイル追加」ボタンをクリックし、変換するページを指定できます。「OCRを使用」にチェックを入れ、「変換」ボタンをクリックします。

PDFをWordに変換

TipsOCRモードには3つの選択があります。

  • A:画像又はスキャナで読み取ったPDFから文字認識:このオプションは、スキャンされたPDFファイルまたは画像の変換に適しており、OC技術を利用して、テキスト認識の精度をさらに向上させることができます。
  • B:埋め込みフォントの認識(文字化け回避):このオプションは、フォーマット変換の完了後にファイル内の文字化けを回避するために、PDFソースファイルに埋め込みフォントがある状況に適用できます。
  • A+B(遅くなる):プログラムは、ファイル内のフォントが画像であるかPDF埋め込みフォントであるかを自動的に認識し、変換して出力します。 ただし、認識には時間がかかり、変換時間は長くなります。

2、画像から編集可能な形式に変換する方法

① Renee PDF Aideをダウンロードしてインストールし、ソフトウェアを実行して、Convert PDF部分を選択します。

多機能PDFツールRenee PDF Aide

② 上部のメニューバーでOCRを選択し、[ファイル追加]ボタンをクリックし、PDFファイルをインポートします。

ファイルを追加し、出力形式を選択

③ [OCR言語]で対応する言語を選択します。[その他言語をOCRで文字認識]ボタンをクリックして他の言語パックをダウンロードすることもできます。対応する言語パックを選択した後、[画像の向き]オプションで画像に対応する画像の方向を選択します。OCRが画像テキストをスムーズに認識できるようにするためです。

OCR言語

④ 出力場所を設定し、「開始」ボタンをクリックします。

出力場所を設定して出力

まとめ

以上は9つのOCRソフトを紹介しました。多機能やOCRの高精度の特徴があるRenee PDF Aideは一番おすすめです。PDF変換やPDF編集等の機能があります。

何かご不明な点がございますか?