ただのプリンタと無料のiphoneアプリで高精度OCR付きPDFをつくる方法

2017年8月29日

アイキャッチ

なら雑誌のスクラップ、現代ではカメラアプリでスキャンしてないですか?

CamScannerやGoogle Driveでやってみるんですが、でも思ってるほど精度が高くないんですよね。

それならと普通のスキャナーでスキャンして、webサービスでOCRをつけることもできますが、そちらも期待していたほどの精度ではありませんでした。

そこで編み出した、ただのスキャナと無料のiphoneアプリなどを使って精度の高いOCRスキャンをする方法です。ちょっとひと手間かけますが、精度は一番高いです。

スポンサードリンク

お金はかけないけど高精度OCRスキャンする方法の流れ

OCRスキャンできるプリンタは持っていない。スキャンアプリの精度には満足いかない。

そんなときのただのプリンタでスキャンして、スキャンアプリでOCRをつける方法のざっくりした流れはこうなります。

ただのプリンタで画像スキャンする

アプリを使ってPCからスマホに一気にデータを転送

スキャンアプリを使ってOCR付きのPDFデータでクラウドに保存

OCRがついたPDFデータをPCに保存

こんな流れで進めます。

記事中アイコン

ただのプリンタで画像スキャンする

まずはただのプリンタを使ってスキャンしましょう。

カメラでスキャンする場合、基本的にはただの撮影なので、光の当たり具合やスキャンする書類の張り具合、角度なんかが読み取りの失敗を招く原因になりますよね。

プリンタを使えば、そんなことはないので、文字を認識する精度は確実に上がります。

注意すべきは画像データとしてスキャンをすることです。

プリンタの設定によってスキャンする際のデータをいくつか選べると思います。

中にはPDFデータも選択できるのではないかと思います。

今回の目的も最終的にはOCRのついているPDFデータの形式で保存することが目標ですが、最初にスキャンする段階ではjpegなどの画像データで保存します。

PDFでスキャンしない理由は、OCRをつけるときにiphoneアプリを使うのですが、画像データでないと認識しないからですね。(※詳しくは後述です)

ちなみにプリンタのスキャンは付属のプリンタドライバを使ってもできますし、macにもともとついているイメージキャプチャを使ってもできます。

ぼくはいつもイメージキャプチャ派ですね。シンプルで使いやすいです。

記事中アイコン

アプリを使ってデータをPCからiphoneに送る

プリンタでスキャンしたデータを一度iphoneに送ります。

PCに保存されているデータをiphoneに送る方法はいくつかあるのだと思いますが、iTuneを使った同期とか、iCloudとか使い方や設定がよくわからない、もしくは昔失敗したしたことがあるという人もいるのではないでしょうか。
(ぼくはもう昔同期の失敗でiphone上の写真がすべて置き換わってしまったりしたこともあるんで、できれば避けたい…)

そんな方にオススメが、画像データの転送に使えるアプリImage Transferです。

PCに保存した画像ファイルを、Image Transferを使ってiphoneに転送しましょう。

使い方は、ダウンロード後アプリを立ち上げて「PCから転送」を選択。するとアドレスが表示されるので、PCのブラウザからアクセスしましょう。

ブラウザにPCに保存してある画像データをドラッグ&ドロップして、ちょっと待てば転送終了です。

100MBサイズでも時間はかからなかったですね。

iphoneに取り込んだデータはカメラロールに保存されます。

Image Transferができるのは画像や動画ファイルをiphoneのカメラロールに転送したり、その逆にiphoneのカメラロールに保存されているものをPCに転送したりすることです。

iphoneのカメラロールにはPDFデータを保存しておくことはできないんですね。

ですので、プリンタを使ってスキャンするときは画像データにしておくことが必要になります。

Image Transferを使う時にもうひとつ注意すべきポイントが。

Image Transferを利用するときは、Wi-Fi経由が必要です。

お使いのiphoneとmacを同じWi-Fiに接続させておいてください。そうすれば問題なしです。

スポンサードリンク

記事中アイコン

スキャンアプリを使ってOCR付きPDFデータにして、クラウドに保存

続いて、いよいよ本丸。

iphoneに送った画像データをOCRがついたPDFデータにしていきましょう。

iphoneのスキャンアプリはたくさんありますが、なんでもいいわけではありません。

今回使うアプリはAdobe Scanです。

Adobe Scanを選ばないといけないポイントは3つあります。

ひとつは、文字認識の精度

photoshopやillustratorなどでクリエイターにはおなじみのAdobe社のアプリは精度も高くて優秀です。

ふたつめは、認識するファイルをカメラロールに保存されているデータから選択できること。

カメラを使ってスキャンを行うスキャンアプリの中には、撮影したもののスキャンは行えるけどカメラロールに保存されているものから選べないものがあります。

みっつめは、スキャンしたデータをクラウドにアップできること。

Adobe Scanでスキャンしたデータをクラウド上の自分のアカウントにすぐにアップすることができ、Adobe document cloudで管理することができます。

クラウド上から自分のPCにダウンロードするのもクリック一発です。

Adobe Scanを最初に起動させた時に、adobeIDアカウントの登録を求められると思います。

ぜひdocument cloud以外も使える機能が満載ですので、IDを作って活用してみてください。

ここでもまた注意点があります。

Adobe Scanを使ってOCR付きのPDFデータを作る場合、複数のデータをひとつにまとめてPDF化することができます。

Adobe Scanに取り込む際に画像データを複数選択するだけでこれは簡単なのですが、OCRをつけて文字認識できるPDFデータにする場合、その取り込む画像の枚数に上限があります。

OCR付きデータにできるのは25枚までなので、それ以上の場合は何回かにわけて作業しましょう。

OCRつきのPDFデータをダウンロードする

Adobe Scanを使ってクラウドにアップしたら、adobe document cloudに保存されているはずですので確認してみましょう。

Adobe Scanなどは非常に便利なのですが、adobeIDのページは詳しくないと非常に使いづらい気がします。

保存したデータがあるのはdocument cloudというサービスのリンク先になりますが、そこにたどり着くにはadobeIDで自分のアカウントページにログイン後、

上部メニューバーにある「自分の名前」>「Document Cloudファイル」

を選択しましょう。

ページ上部にある「メニュー」からは保存したデータにはたどり着けないので注意してください。

Document Cloudファイルに移動すると、OCRをつけてクラウドにアップしたデータの一覧が表示されると思います。

名前を選択すれば、PDFデータが表示されます。

環境によって異なるかもしれませんが、ぼくの場合、webブラウザ上では文字の選択・ハイライトができませんでした。

なので、一度ダウンロードして文字の選択をする必要がありました。

ダウンロードしたデータをプレビューとかで開くと、文字を選択できるようになっています。

記事中アイコン

まとめ

いままでの流れをまとめてみます。

プリンタで画像データとしてスキャンする

Image Transferを使ってデータをPCからiphoneに送る

Adobe Scanを使ってOCR付きPDFデータにして、Document Cloudに保存

OCRつきのPDFデータをダウンロードする

以上で、通常のスマホアプリを使ったものよりも高精度のOCR付きPDFデータの出来上がりです。

記事中アイコン

残念ながらここまでやっても…

複雑な文字組のされている雑誌ページの活字でも、かなりの精度でOCR認識をしてくれました。

ただ、写真がメインになっているようなページの中にある文字に関してはどうしても認識できませんでした。

背景に写真があり、その上に文字があるようなものの場合、文字の形を認識してくれないのでしょうか?

次はさらに精度の高いスキャン方法を探してみたいと思います。(いつできることやら…)

スポンサードリンク

この記事が気に入ったら
いいね!しよう

Twitter で

PAGE TOP