odd_hatchの読書ノート

エントリーは2200を超えているので、記事一覧よりもカテゴリー「INDEX」をご覧ください。

自炊PDFをAmazonKINDLEで読んでみた (4)スキャニング

ScanSnapのセットアップとアプリのインストールは省略。それくらいは自力で解決してね。

ScanSnapOrganizerを立ち上げると、次のような画面になる。すでにスキャン済の書籍があるのはご愛嬌。

左上のアプリケーションボタンをクリックして、設定を確認。この設定にはいろいろと話題になっている。

自分が行っているのは、
1.文字だけの場合 ・・・ カラーモードは白黒
2.文字とイラストの場合 ・・・  カラーモードは白黒
3.口絵に写真が載っている場合 ・・・ 本体のカラーモードは白黒。口絵だけカラーでスキャンし、あとでファイルを統合する。
4.本文に写真が載っている場合 ・・・ カラーモードはカラー。
※ 写真はモノクロの場合。カラー写真は当然カラーモードで。
※ マンガは作風によって変える。書き込みの少ない人(「いしいひさいち」さんとか「川原正敏さん」とか)は白黒で、細かい線や背景を丹念に描く人(多数)はカラーで、など。

5.白紙ページの自動削除、文字列の傾きを自動補正にチェックをいれる。
  例外があり、カラー写真ばかりで文字がないとき(雑誌など)は文字列の傾きの自動補正のチェックを外す。
※ 原稿の向きの自動補正は、自分にはうまくいかなかった。ときどきあるページだけ90度傾いているなどということがあったので。


人によっては全部カラーでスキャンしAdobeAcrobatで白黒にするのがいいとか、紙は横にセッティングしあとで90度回転するのがいいとか、いろいろあるみたい。
好き好きなので試してみてください。
なぜ自分がこのように設定したかというと
(1)ほとんどは文字しかない文学やエンタメ本は白黒で充分だよ。たいていのマンガでも白黒で、はっきりくっきりだ。
(2)カラーモードにすると、ファイルサイズが白黒の2-3倍になる。1冊が50MBを越えるのはやだなあ。
(3)カラーモードにすると、紙の色も読み取るんだよね。古い本をスキャンすると、赤茶けた色まで再現される。これって嫌だよ。
(4)カラーモードにすると、紙の表面と裏面で感度が違うんだよね(スキャナーの仕様)。ページをめくると、背景色がかわるって、嫌だよ。
という具合。


スキャナーに紙をセッティング。本体のボタンを押してスキャン開始。

スキャン中はモニターに、こんなポップアップがでてくる。

※ ScanSnapManagerは定期的にバージョンアップしているようだ。最新版になると早いし、見やすいしで、ちゃんとアップデートしてね。


エマージェンシー! エマージェンシー! 

「ピンチにあったぞ、発信だ! 緊急連絡 10-3-4!」


ジャミングその他でスキャンに異常が発生すると、このようなメッセージがでて、動作が停止する。
起こることは
1.ジャミング(紙詰まり)
2.2枚重ねでスキャン(こんな薄い紙の厚さを感知するんだ)
3.紙が滑って2枚を1枚と認識

原因は
1.紙が糊でつながっている。
・裁断面が接着面から充分に離れていない
・折りと折りの間を接着している(1980年以前の本に多い)
2.紙が乾きすぎていて、ローラーが滑る
・古い本(赤茶けたもの)は要注意。

対策は
1.裁断あとに、しっかりと捌く。
・接着面だけでなく別の方向でも捌いたほうがよい。
・折りと折りの間の接着は、丁寧にはがすしかないね。
2.ウェットティッシュでローラーを掃除
・あわせて、スキャンするガラス面も掃除しておこう。まれに、糊がガラス面に張り付いて、PDFに汚い筋が出てくることがある。
・またスキャナーの中には紙埃がたまりやすい。10冊スキャンしたら掃除するようにしたい。


問題が起きたら、そのつど対応すること。
紙つまりを直し、スキャンが正常終了したところを確認し、紙をセッティングしてやり直し。このときジャミングしたページは「残さない」を選択するように。
※ 理由はわからないが、「残す」のままスキャンを再開したとき、重複ページはマージ(一枚にまとめる)を自動的に行っているみたい。ただしScanSnapManagerの最新バージョンの話。

一度にセットできる紙は50-60枚くらい。当然、一冊の本はそれ以上のページ数なので、一度ではスキャンは終わらない。
慣れると、スキャンの途中に給紙できるようになる。でもそれは薦めない。セットした紙のスキャンが終わってから、紙を追加したほうがよい。
なぜかというと、途中で給紙したときに
1.スキャナーが紙のサイズを誤って認識する
(スキャン完了後に「用紙のサイズが不明で最大サイズでスキャンしました」みたいなメッセージが出てくるときだ)
2.文字列がずれたりする
3.ジャミングの原因になる
などを発生するから。


すべてのページのスキャンが完了すると、このポップアップウィンドウになる。「読み取り終了」をクリック。

ScanSnapOrganizerのインストールと同時に「マイドキュメント」に「ScanSnap」フォルダができて、そこに保管される。

ScanSnapOrganizerに新規ファイルが作成される。ファイル名は日付と時刻。

ファイル名を変更しよう。自分は「著者名」_「タイトル」_「出版社」としている。まあ、お好きなように。

ついでに上中下など巻が分かれているときには、タイトルのあとに「01」「02」などをノンブルを打っている。JISコード順では「上」「中」「下」の順番にならないから。
これを応用すると、作者の発表順に並べることもできるね。そのときは著者名のうしろに「01」「02」などとつける。


自分のPCでは、300ページの本をスキャンし、PDFファイルに変換するのに、7-8分かかる。
これ以上かかることもあった。原因は不明だがHDDのデフラグ実行後はスムーズに行くようになった。最近の大容量PCだとデフラグに12時間以上かかることもあるが、定期的に行っておきたい。また、レジストリーや一時保管ファイルなどPCのメンテナンスもあわせて定期的に実行しよう。


本文のスキャンが完了したら、今度はカバーをスキャン。

※ カバーを一冊ごとにスキャンすると、ファイル数がふえて管理が面倒になるので、まとめてスキャンしよう。のちにPDFからJPEGに名前を変えて保管すると、1枚ごとのファイルができる。

以上でスキャン作業終了。ここは時間がかかるし、ジャミングその他のエマージェンシーに対応しないといけないので、ほぼつきっきり。しかも1時間で6-7冊くらいしか完了しない。休日にまとめてやるもよし、毎日少量ずつ実行するもよし、ライフスタイルにあわせて作業してください。

スキャニングを終えた書籍。卒塔婆がいくつも並んでいるみたいだ。

面倒くさいと思うなら、外注業者に発注しなさいな。品質に責任は持たないよ。
俺に言わせりゃ、こういう手仕事は積極的にやるもんだぜ。レヴィー=ストロースの「プリコラージュ」を実践すると考えるもよし、マルクスの「労働の疎外」を回復することと思ってもいいし、トヨタの「カイゼン」を体験学習しているつもりでもいいし。俺はたんにこういう作業が好きなんだ。

次回は、PDFの加工についてだ。