おはようございます。デザイン事務所「グラッドワークス」です。
Mac用のOCRはあまりない?
本などをスキャンして画像にしたものをコンピュータで読み取ってテキストデータに変換してくれるソフトを「OCRソフト」と呼びますが、Mac用のOCRソフトはGoogleなどで検索してもあまり出て来ません。
が、Adobe AcrobatでOCRができます。
私はAdobe CS5.5Design Premium 付属のAdobe Acrobat を利用しました。デザイン制作に携わる人なら普通に持っているソフトですね。
無料配布しているAcrobat Reder(最近はAdobe Readerと呼ぶようですが)では無理なんですが、有料版でもスキャナにセットで付いていたりするので持っている方は試してみられては如何でしょう?
スキャナで取り込んでからPDF化して「テキスト認識」させればOK
大まかな流れとしてはスキャナで書類を取り込んで、その画像をPDF化。
次に文字認識をさせるというもの。
表示>ツール>テキスト認識>このファイル内で「テキスト認識」のダイアログが開きますので設定を確認の上「OK」をクリックでOCRを開始します。なお、テキスト認識させるデータが100MBを超えるとウチの環境では途中でエラーになってしまいます。そういう時は元データを複製して、それぞれ後半と前半のページを削除して100MB以下にしたものをテキスト認識させて、あとから分割したデータを結合させればOK。
Acrobatに文字を認識させても、見た目には何も起こっていないように見えるのですが、
マウスポインタでクリックすると、文字としてのカーソルに変わるので、認識できている事が分かります。
認識した文字を選択してテキストエディットなどにコピペすればテキストデータとして使えます。
前述の通りデザイン用ソフトのAdobe CS5.5に付属していたAdobe Acrobat ProではOCRに成功しました。スタンダード版もあり、OCR機能は同等という情報もあるのですが、こちらはちょっと確認できておりません。新規に購入される場合はご確認される事をお勧めします。
電子書籍の自炊にもおすすめです
読み取りエラーも所々あるので、ちゃんとチェックは必要ですが、すべての文章をキーボードで入力する手間を考えれば遥かにラク、という事で。電子書籍の自炊にもおすすめです。
↓最新版のAcrobat Proはこちら。
デバイス連携機能やスキャン文書からのPDF作成機能など機能てんこ盛り。
テキスト認識機能もあるとのこと。
↓クリエイティブアプリが丸ごと使える
「Adobe Creative Cloud コンプリート」というのもあります。
ただしサブスクリプション(期間契約)製品なので、定期的に支払いが発生します。
複数のアプリを使い倒す人向けですね。
会社案内、パンフレット、折込チラシなど印刷物全般のデザイン制作承ります。会社やお店の顔となるロゴデザイン、名刺、看板なども制作実例多数あり。広告宣伝ツールのレベルアップをお考えの方は、ぜひご相談ください。
→横浜〜川崎エリアの印刷物&ウェブデザイン制作と写真撮影はグラッドワークスへ