◆ドイツ語本を解読する!◆ | |||||||||||||
|
ドイツの飼育技術はァァ世界一ィィ…なのかどうかはわかりませんが、ことペット関係の書籍の充実っぷりは目を見張るものがあります。 |
||||||||||||
|
使用するOCRソフトはドイツ語対応で無ければいけません。フリーウェアで探したところ2つ見つかり、両方試したところsofti free OCRが圧倒的に正確に認識してくれました。そのためsofti free OCRがお勧め、、、なのですがこのソフトは現在配布されておりません…。数年前はフリーウェアだったのですが、現在は配布が停止され後継のプログラムがシェアウェアになっています。 |
||||||||||||
![]() ファイルの名前とサイズ はこんな感じです |
![]() 通常、softiOCRのインストールには以下のアプリケーションが必要であることを書くの忘れていました。自分のパソコンを再インストールした時にようやく気付いた次第です。いずれもフリーのアプリケーションです。 インストーラ WindowsInstaller-KB893803-v2-x86.exe DOTNETFIX dotnetfx.exe |
||||||||||||
![]() |
freeOCRの準備はこんな感じです。まずfreeOCRをインストールすると、インストール先のtesseractフォルダ内にtessdataフォルダができますので、 |
||||||||||||
![]() 初期状態では英語のライブラリ(eng.〜)があるかもです |
そこにtesseract-2.00.deu.tar.gzをし解凍したファイルたちを投入します。tar.gz形式のファイルを解凍できるソフトが必要ですね。これも、ちょっと探せばフリーの解凍ソフトが見つかると思います。これで準備は完了です。 | ||||||||||||
![]() 。 |
次に画像の準備です。TWO-Pは解像度400dpi・白黒モードでスキャンしました。もっと低い解像度でも大丈夫かもしれません。カラーモードより白黒モードの方が認識率が高いです。 | ||||||||||||
![]() 。 |
画像処理ソフトで文章以外の部分を消去し、傾きがある場合は修正して文を水平にします。傾きが大きくなるに従い認識率が下がるようです。 | ||||||||||||
![]() |
freeOCRを起動してfile→openで画像ファイルを開き、language(赤丸の部分)をengからdeuに変えてOCRをクリック。 |
||||||||||||
|
|||||||||||||
|