【最新版】流行りのOCRフリーソフト9選

You are here:

ホーム
サポート
PDF変換
【最新版】流行りのOCRフリーソフト9選

Imori テストマネージャー 2021-4-6

概要
画像やPDFから文字を認識するには、OCRソフトが必要です。この記事は、使いやすく、流行りのOCRフリーソフトをすすめ、使い方を紹介します。

一、OCRとは
二、OCRフリーソフトのすすめ
三、スキャンしたPDF/画像から文字認識・出力する方法

一、OCRとは

OCR（光学文字認識、英:Optical character recognition）は、活字、手書きテキストの画像を文字コードの列に変換するソフトであります。画像はイメージスキャナーや写真で取り込まれた文書、風景写真 (風景内の看板の文字など)、画像内の字幕が使われます。

OCRソフト

雑誌、書籍、契約書、新聞などを認識して、パソコンが読める電子ワードに変換し素早くパソコン入力したい場合は、OCRソフトを利用できます。手動入力せずに済むので、非常に便利です。

OCRの仕組み

OCRソフトを使用する時、まず画像の構造が分析され、ページがテキストブロック、表、画像などの複数のセクションに分割されます。単語と文字の分類が完了した後、一連の画像と比較し、多数の仮説を提案します。処理完了後、プログラムは最終的に認識可能なテキストを表示します。

OCRアルゴリズム：

マトリックスマッチング — 画像をピクセル単位で格納されたグリフと比較します。
特徴検出 — グリフが線分、閉じたループ、線の方向、線の交差などの “フィーチャ (特徴)” に分解されます。検出機能は、表現の次元性を低下させ、認識プロセスを計算上効率的にします。これらのフィーチャは、文字の抽象的なベクトルのような表現と比較され、1つ以上のグリフプロトタイプに縮小されます。コンピュータビジョンにおける特徴検出の一般的なテクニックは、一般的にインテリジェント手書き文字認識と実際に最も近代的なOCRソフトウェアで使われます。

OCRの一番のメリットは時間を節約できることです。手動入力の入力ミスや仕事量を減ります。紙情報や画像のデータを編集できないが、OCRソフトにより、データを編集できるようになります。圧縮、結合、削除、画像追加などの処理も可能です。電子データの管理は、紙の書類の管理より簡単・安全です。

膨大な書類の中から必要な情報を探す場合、文書検索ができ大きな効率化につながるでしょう。コピペや編集も簡単に行えるため、紙資料で保管するよりも管理にかかる手間が大幅に減ります。共有が簡単になり安全性も高まります。OCR機能の活用で、仕事の効率が大幅に向上できます。

二、OCRフリーソフトのすすめ

1、Renee PDF Aide

Renee PDF AideはOCR機能があり、スキャンしたPDFや画像を編集可能な形式に変換できます。PDFをWord / Excel / PowerPoint / EPUB / Image / HTML / TXTなどの形式に変換できます。速度は200ページ/分に達します。一括変換も対応します。

日本語/英語/フランス語/ドイツ語/ロシア語/イタリア語/ポルトガル語など多言語変換に対応。OCRモードで言語を選択して、文字認識の成功率を高めることができます。

対応OS：Windows 10/8.1/8/7/Vista/XP（32bit/64bit）

多機能PDFツールRenee PDF Aide

メリット：

複数言語を対応し、操作は簡単。
スキャンPDFと画像から文字認識可能。
一括処理対応。
OCR精度が高い。
PDF編集機能もあります。

デメリット：

Windowsのみ対応します。

Renee PDF Aide　-　初心者向けな多機能PDFツール

使いやすい初心者も簡単に利用できます。

多機能PDF変換/暗号化/復号化/結合/透かし追加等。

安全性高いAES256暗号化アルゴリズムを使用し、PDFを保護します。

処理速度速い複数のファイルを同時に編集/変換できます。

複数形式対応 Excel/Text/PPT/EPUB/HTML/JPG等に変換可能。

多形式対応 Excel/Text/PPT/EPUB/HTML...

使いやすい初心者簡単に操作できます。

多機能PDF変換/暗号化/結合/透かし等。

無料体験無料体験 5632名のユーザー様に無料体験をしていただきました！

2、Microsoft OneNote

Microsoft OneNoteはWindows, macOS, Android, iOS, Windows Phone向けに公開しているフリーのデジタルノートアプリケーションです。テキストやメディアファイル等を挿入することができます。ファイルはOneNoteユーザー共有できます。このソフトもOCR機能があり、画像の文字を認識し、コピペできます。

OneNoteに画像を挿入し、画像を右クリックして、[テキストをコピー]をクリックすると、テキストをクリップボードに保存しコピーできます。印刷ファイルからテキストを抽出する場合も、操作は同じです。ページを右クリックして、[この印刷ページからテキストをコピー]をクリックします。

注意：OCR識別精度は画像の品質によって異なります。手書きの文字を識別する場合、OneNoteの精度が低いです。

対応：Windows 10/8.1/8/7/Vista/XP、Mac

Microsoft OneNote OCRソフト

メリット：

単純なテキスト画像を処理する場合、精度は90%以上に達します。
スキャンPDFと画像の認識も対応。
使いやすい。
フリーソフト。

デメリット：

フォームなどを含む複雑なファイルを認識するとき、精度が低い。
一括処理はできません。
クラッシュすることがあります。

3、Simple OCR

SimpleOCRはフリーのOCRソフトです。画像やスキャンPDFをwordに変換できます。スキャンPDFや画像の変換は制限なく、無料利用ｄけいます。手書きの文字を認識するには、14日間を無料できます。SimpleOCRには、スペルチェッカーが組み込まれています。さらに、スキャナーから直接読み取るように設定することもでき、出力ファイル形式はDOCまたはTXTにすることができます。

Microsoft OneNoteと同じ、OCR識別精度は画像の品質によって異なります。

対応OS：Windows 10 / 7 /8 /XP /Vista

SimpleOCR ソフト

メリット：

スペルチェッカーが組み込まれます。
一括処理もできます。
フリーソフト。

デメリット：

直接コピーできず、先にWordまたはテキストに出力する必要があります。
機能が少ない。
3つの言語のみ対応します。
フォントとフォーマットの検出はありません。
画像（TIFF，JPG，BMP）のみ対応し、PDFを対応しません。

4、Boxoft Free OCR

Boxoft Free OCRは無料のOCRソフトです。英語/スペイン語/フランス語/ドイツ語/ロシア語/イタリア語/ポルトガル語など多言語変換に対応。また、さまざまな種類のスキャナーと直接接続できるため、紙の文書をスキャンして、スキャンした画像から直接テキストを抽出できます。

Boxoft Free OCRでテキストを編集できます。Microsoft Officeがなくても、OCRで認識されるテキストを編集できます。また、PDFページの修正、トリミング、回転などの最適化機能も提供します。

対応OS：Windows 2000/2003 / XP / Vista / 7 / 8 / 10

Boxoft Free OCR ソフト

メリット：

指定ページを変換可能。
操作は簡単。
複数の言語を対応します。
OCR抽出した文字を編集可能。

デメリット：

Windowsのみ対応。
更新はしていません。
手書きの文字を認識できません。
PDF対応しません。

5、Free OCR

Free OCRは、Googleが管理しているTesseractエンジンを使用するWindows用のOCRプログラムです。OCR認識精度は高い。スキャンPDF以外、デジタルカメラやイメージスキャナーなどのTWAINデバイスもサポートします。さらに、ほぼすべての画像、FAXドキュメント、TIFFファイルをサポートします。インターフェースはシンプルで使いやすいです。Free OCRの出力ファイルはプレーンテキストです。

対応OS：Windows 2000/2003 / XP / Vista / 7 / 8 / 10

FreeOCR ソフト

メリット：

フリーソフト。
任意のスキャナーを対応します。
画像を拡大できます。
Tesseract OCRエンジンの精度は高い。

デメリット：

PDFの最初のページのみ認識できます。
1時間あたり10枚の写真/ファイルのみアップロードできます。
プレーンテキストのみ出力できます。
テキスト形式は保持できません。

6、Easy Screen OCR

Easy Screen OCRは任意の範囲のキャプチャーを取得し、Google のOCR機能を利用してテキストを抽出・編集できるようにするソフトです。ファイルをアップロードする必要がなく、認識したい部分をキャプチャすると、文字認識可能です。文字をほかの言語に翻訳する機能もあります。

ソフトは100以上の言語を認識でき、20の言語での翻訳をサポートします。最新バージョン（1.4.2以降）は、20回のみ無料利用できます。ただし、古いバージョンは引き続き無料で使用できます。

対応OS：Windows 10/8.1/8/7/Vista/XP、Mac

Easy Screen OCR ソフト

メリット：

使いやすい。
2つのOCRモードあり、100以上の言語を識別できます。
識別した文字をほかの言語に翻訳できます。

デメリット：

キャプチャしたもののみ識別できます。
認識した文字をほかの形式に変換できません。

7、gImageReader

gImageReaderはPDFや画像ファイルを読み込んで、指定された言語に基準としてOCR処理を行うTesseract OCRフロントエンド。ソフトを利用するには、Tesseractもインストールする必要があります。ソフトは、印刷されたドキュメントと手書きのコンテンツを認識できます。また、手動または自動の認識を選択することもできます。一括処理をサポートしています。また、認識が完了すると、認識されたテキストと画像を比較して修正することができます。さらに、スペルチェッカーなどのさまざまなツールも提供します。

対応OS：Linux、Windows

gImageReader OCRソフト

メリット：

Tesseract OCRエンジンは高い精度があります。
識別範囲を指定できます。
JPEG，GIF，PNG，TIFF画像、PDFを対応します。

デメリット：

TXTのみ出力できます。
Macを対応しません。
ほかの言語を識別する操作は複雑です。

8、Free OCR to Word

Free OCR to Wordは使いやすいOCRソフトで、精度も高いです。画像/スキャンPDFをWordに変換できます。ほとんど主流スキャナーと接続できるため、すべての紙の文書、雑誌、レポート、フォームを直接スキャンして、画像からテキストに変換できます。ファイルをデジタル化した後、データのバックアップと共有が便利です。JPG / JPEG、TIF / TIFF、BMP、GIF、PNG、EMF、WMF、JPE、ICO、JFIF、PCX、PSD、PCD、TGAなど、さまざまな画像からのテキストの抽出をサポートしています。

対応OS：Windows、Mac

Free OCR to Word ソフト

メリット：

操作は簡単。
ほとんどのスキャナーと接続できます。

デメリット：

文字フォントを識別できません。
PDFおよび複数ページのファイルはサポートしません。。
英語のみ対応します。

9、PDFMate PDF Converter

PDFMate PDF ConverterはフリーのPDF形式変換ソフト。OCR機能もあります。スキャンしたPDFをWordに変換できます。OCR機能は制限あり、最大3ページを識別できます。また、PDFの作成、編集、変換、結合等の機能もあります。

対応OS：Windows、Mac

PDFMate PDF Converter OCRソフト

メリット：

速度が速く、一括変換も対応。
複数の言語を識別できます。
複数のPDF編集機能があります。

デメリット：3ページのみ無料処理できます。

三、スキャンしたPDF/画像から文字認識・出力する方法

以上は認識のOCRフリーソフトです。必要に応じて選択してください。次にRenee PDF Aideを利用して、スキャンPDFから文字抽出して変換する操作方法を紹介します。

Renee PDF Aide　-　初心者向けな多機能PDFツール

使いやすい初心者も簡単に利用できます。

多機能PDF変換/暗号化/復号化/結合/透かし追加等。

安全性高いAES256暗号化アルゴリズムを使用し、PDFを保護します。

処理速度速い複数のファイルを同時に編集/変換できます。

複数形式対応 Excel/Text/PPT/EPUB/HTML/JPG等に変換可能。

多形式対応 Excel/Text/PPT/EPUB/HTML...

使いやすい初心者簡単に操作できます。

多機能PDF変換/暗号化/結合/透かし等。

無料体験無料体験 5632名のユーザー様に無料体験をしていただきました！

1、スキャンPDFを編集可能な形式に変換する方法

① Renee PDF Aideをダウンロードしてインストールし、ソフトウェアを実行して、Convert PDF部分を選択します。

多機能PDFツールRenee PDF Aide

② 上部の出力形式で「Word」を選択します。

PDFをWordに変換

③「ファイル追加」ボタンをクリックし、変換するページを指定できます。「OCRを使用」にチェックを入れ、「変換」ボタンをクリックします。

PDFをWordに変換

TipsOCRモードには3つの選択があります。

A：画像又はスキャナで読み取ったPDFから文字認識：このオプションは、スキャンされたPDFファイルまたは画像の変換に適しており、OC技術を利用して、テキスト認識の精度をさらに向上させることができます。
B：埋め込みフォントの認識（文字化け回避）：このオプションは、フォーマット変換の完了後にファイル内の文字化けを回避するために、PDFソースファイルに埋め込みフォントがある状況に適用できます。
A+B（遅くなる）：プログラムは、ファイル内のフォントが画像であるかPDF埋め込みフォントであるかを自動的に認識し、変換して出力します。ただし、認識には時間がかかり、変換時間は長くなります。

2、画像から編集可能な形式に変換する方法

① Renee PDF Aideをダウンロードしてインストールし、ソフトウェアを実行して、Convert PDF部分を選択します。

多機能PDFツールRenee PDF Aide

② 上部のメニューバーでOCRを選択し、[ファイル追加]ボタンをクリックし、PDFファイルをインポートします。

ファイルを追加し、出力形式を選択

③ [OCR言語]で対応する言語を選択します。[その他言語をOCRで文字認識]ボタンをクリックして他の言語パックをダウンロードすることもできます。対応する言語パックを選択した後、[画像の向き]オプションで画像に対応する画像の方向を選択します。OCRが画像テキストをスムーズに認識できるようにするためです。

OCR言語