ブログトップ | ログイン

竹林軒出張所

chikrinken.exblog.jp

MacでOCRを使う

 またまたパソコンの話です。
 前に書いたように、Macの世界では良いOCRがあまりなく、日本語OCRについては皆無の状態であった(竹林軒出張所『エミュレータでOCRを使う』を参照)。そのためエミュレータでWindowsを動かし、その中でWindows用のOCRを動かすことで何とか急場を凌いでいた。ここまでが前回の話。
b0189364_8271995.jpg ところがつい先日、ABBYY FineReader Pro for MacというOCRがソースネクストから販売されているという情報を掴んだ。このOCRは、これまでWindowsバージョンがあって、前にWindows版OmniPageを買ったときもFineReaderにするかOmniPageにするか悩んだというそういうソフトである。そのMac版が登場、しかも価格は5千円ちょいということで(現在はキャンペーン価格のようでいずれ12,000円超になるらしい)、これはもう手に入れずんばあらじということで即購入した。
 このFineReader、元々国産ではないため日本語の読み取りについてはあまり考えていなかったが、日本語の認識もできるということが後に判明。さっそく日本語の識別をしてみた。結論を言えば、日本語でもそれなりに実用になる。少なくとも前に使っていたe.Typistよりははるかに認識成績が良い。しかも縦書きも自動で識別できるという誠にありがたい仕様である。Macで動くというだけでもうれしいのに日本語も読み取れるとは、なんということでしょう。ということで、Windows版OCRのOmniPageは、当分出番がなくなった。
b0189364_22281426.jpg なおこのFineReaderだが、最初に現れるウィンドウに「テキストへの変換」という項目が出てこない。テキストへの変換もできなくはないが、少しだけ作業が煩雑になる。デフォルトで出てくる変換には「PDFへの変換」や「Excelへの変換」など計4種類があるが、「Excelへの変換」なんかまず使うことはないんで、こういうのを「テキストへの変換」に置き換えるオプションがあるのかと思ったらそれもなさそうである。b0189364_22283642.jpgもっともろくにマニュアルも読まずに使っているので、実は何かそういう手段があるにもかかわらず、それに気付いていないだけなのかも知れない。しようがないので現在では「PDFへの変換」を実行した後、PDFファイルに出力されたテキストを全コピーして活用するという方法を利用している。OCRについてはテキスト変換さえあれば良いんで使いやすくカスタマイズしたいところだが、こういうところがなんだか融通が効かず、いかにもWindowsの面影が漂っていると言ったらおしかりを受けるか。もちろんそうは言っても、ほとんど唯一の実用になるMac版OCRということで、大いに評価しているのは言うまでもない。

参考:
竹林軒出張所『エミュレータでOCRを使う』
ABBYYジャパン「ABBYY FineReader Pro for Mac」
ソースネクストABBYY FineReader販売ページ
by chikurinken | 2016-09-03 07:27 | パソコン
<< 『眠りの科学』(ドキュメンタリー) エルキャピタンって何すか? >>