私にみえている世界

こんにちは。

書籍の自炊(電子化)のコツ

お疲れ様です、yasusususuです。

 

今日は、私が行っている書籍の自炊(紙媒体の本を裁断し、スキャン、PDFにすること)の方法を紹介します。私は、この方法で、200冊以上(もっと多いかもしれませんが少なくともこのくらい)の本を電子化してきましたので、ある程度形式的で汎用性のある方法だと考えます。

簡単な流れとしては、①本の裁断→②裁断したもののスキャン→③スキャンしたデータの編集→④データの保管とダブレット等への移動です。

以下この順番で説明していきます。

なお、この説明を実演した下記記事も併せてご覧ください。

書籍の自炊(電子書籍化)の実演

 

 

①裁断する

本を裁断することは、はじめてだと結構勇気がいるし、時間的・体力的にもしんどいことだと思います。

しかし、本を処分し、スペースを作れること、どこでも電子書籍として自炊した本を読めるようになることというメリットを享受するためには、乗り越えなければならないステップです。

 

(1)まずは、カッターナイフと、カッターマットを用意し、本にナイフを入れていきます。私は、百円均一で買ったものを使っています。

私は、後に使う裁断機との関係で、本の紙の分厚さにもよりますが、約50ページずつに切り分けていきます。本を目一杯開いて、ページとページの境目にカッターの刃を入れると、簡単にきれいにカットできます。カッターの刃の流れのガイドのために定規をあてることも考えられますが、そんなことをしなくても簡単に切り分けられます。300ページくらいの文庫本であれば、表紙カバー、本の帯、およそ6つの50ページの束に分解されたことになります。

 

(2)次に私は、裁断機を使います。私が使っているのは、カール事務器のディスクカッターです。 

カール事務器 ディスクカッター A4サイズ DC-210N ブラック

新品価格
¥9,150から
(2015/2/11 17:46時点)

これで、50ページくらいの束の端の糊付けされた部分をカットしていきます。気をつけたいのは、カットする幅を狭くしすぎるとうまくばらけないということです。紙がうまくばらけないと、スキャナーで紙詰まりを起こすことがあります。

あと、これが私としては、絶望的にめんどくさいのですが、うまく紙がばらけていないことで、2枚の紙が1枚の紙として読みとられることによって、2枚の紙に閉じられた間の紙に印刷されている2ページが読み取られないことがあります。データになった時に、本来は、2枚の紙を読み取ったとき、1、2、3、4ページと読み取られているはずが、紙がばらけておらずこれが起こると、1、4ページとしか読み取られておらず、間の2、3ページは読み取られていません。正しく1、2、3、4ページとつながったデータを作成するためには、結局この1、2、3、4ページの印刷されている2枚の紙をもう一度読み取り、1、2、3、4ページのデータを作成した上、もともと読み取っていた、1、4ページのデータを削除した上、ここに新たに読み取ったデータを挿入するという作業を行わなければならなくなります。

このような面倒なことにならないために、糊付けされた部分のカットは、大胆に幅をとって行うようにしています。

なお、このディスクカッターを使わなくとも、定規とカッターナイフで糊付け部分をカットすることも可能だと思うのですが、一度やってみて、私の不器用さゆえにうまくいかない上、時間がかかって仕方がなかったので、上記裁断機を導入するに至りました。

 

(3)その他、カットの段階で悩ましい点として、表紙カバー、本の帯、本に挟まれている書類(広告等)の処理をどうするかということがあります。

私は、文庫本などで、表紙カバーのイラストが表表紙、背表紙、裏表紙とつながっているときは、端のカバーで本を閉じるために織り込まれている部分だけを裁断機でカットします。

それ以外の時は、表紙、裏表紙、折り込み部分に分け、背表紙の部分は、表表紙か裏表紙のどちらかにくっつくようにカットするようにしています。背表紙は細く、これだけをスキャナーで読み取ることが難しいし、データにした時の扱いに困るからです。

本の帯については、表紙カバーとのデザインとの関係で一体的なデザインを構成していて重要な場合は、一旦表紙カバーにテープなどで貼り付け、スキャナーで読み取ったうえ、はがして、表紙カバーのみを読み取るようにしています。

本に挟まれている書類は、自分にとって重要かどうかで判断し、二度と見ないと思ったものはすぐに捨てます。

 

②裁断した紙をスキャンする

ここで、スキャナーを使います。

私が使っているのは、FUJITSU ScanSnap S1300i(Fi-S1300A)です。 

FUJITSU ScanSnap S1300i FI-S1300A

新品価格
¥23,000から
(2015/2/11 18:19時点)

色々なメーカーからスキャナーが出ていますが、自炊でググった時に一番紹介されているのがScanSnapシリーズだったので、私はこのモデルに決めました。私が選んだものは、いわゆるエントリーモデルというもののようです。もっとお金を出して上位機である、ScanSnap iX500(FI-IX500)を買うことを夢見ています。

富士通 FUJITSU ScanSnap iX500 (A4/両面/Wi-Fi対応) FI-IX500A

新品価格
¥45,882から
(2015/4/6 17:08時点)

私が使っているS1300iと上位機のiX500との違いは、一度に読み取れる紙の量、読み込みスピード、設定できる最高画質、読み取れる紙の大きさです。私は、S1300iの読み込みスピードのみに不満を持っていて、時短のために5万円を支払うかどうかをずっと悩んでいます。

以下、スキャンについて説明していきます。

 

(1)読み取り設定をする

ScanSnapシリーズには、FUJITSU製のScanSnapManagerというソフトが用意されていて、これを用いて本体の読み取り設定をします。

設定→読み取りモードでの設定が非常に重要で、私が検討を重ねた結果、ベストと考える設定は、「画質」スーパーファイン(カラー/グレー 300dpi相当)、「カラーモードの選択」カラー、「読み取り面の選択」両面読み取り、「継続読み取りを有効にする」にチェック、「オプション」の「文字をくっきりします」のみにチェック、それ以外の「白紙ページを自動的に削除します」「文字列の傾きを自動的に補正します」「原稿の向きを自動的に補正します」のチェックを外す。「ファイルサイズ」タブ、圧縮率4です。

画質についてはさらに上のエクセレントがありますが、タブレットで本を読むことを考えたとき、300dpi以上の画質にしても、タブレットの方がそれ以上の画質を表示する機能をもっていないので、スーパーファインで十分です。画質を上げるとその分ファイルも重くなりますし、不必要に重いファイルを作るとタブレットやPC、オンラインストレージ等の容量との関係でも問題が生じます。

継続読み取りは、初期設定では無効になっているのですが、これを有効にしないと、例えば、50ページずつスキャンして行ったとき、一度紙がスキャナーからなくなるとそこで1つのPDFファイルとして勝手に完結してしまい、本が300ページあった場合、6つのPDFファイルをつなげなければならないという非常に面倒な作業をすることになってしまいます。

白紙ページは、不要と思われる方もいるかと思いますが、ほとんどの本には白紙ページがあり、このページをも含めてページ数(ページの左右下隅に印刷されているもの)が設定されているので、読み取ったページの数と本に印刷されているページ数が合わなくなるという問題が起き、アプリのページ数検索や目次をみて、読みたいページに移動するときにズレが生じてこれが結構なストレスになるのです。

 

(2)実際にスキャンする

私の使っているS1300iは、一度に読み取れる紙の枚数は、15枚程度と説明書には書いてあります。しかし、実際は、トレイに一度に50枚(100ページ)置いてもスムーズに読み取ってくれます。

まず、15枚ほどの紙をトレイに置き、スタートボタンを押し、読み取りが始まったら、紙を足していく。この作業をひたすら繰り返します。

無事に全部の紙を読み取り終わったら、ひとまずスキャンの作業は完了です。

しかし、安心して読み取った紙を捨てるなどということは絶対にしてはいけません

 

③データを編集する

私は、MacBookAir(early 2014)を使っているのですが、読み取ったファイルの編集は、プレビューというアプリで行います。

プレビューのアプリの設定「単一ページ」「サムネール」にチェックして、あとはひたすら読み取りミスがないか、不要なページがないかを探していきます。

→キーをクリックしてページ数の飛びがないかを確認していきます。また、表紙カバーの裏の白紙のように不要なページはdeleteキーをクリックして削除します。

私は、→キーを10回押してちゃんと印刷されたページが10進んでいるかを確認することで、読み取り損ねを防止しています。

かなり自炊になれたと思われる私でも、1冊の本を読み取る時に、1、2箇所は読み取り損ねます。そのときは、落ち着いて読み取れていないページを再度スキャンして、プレビューアプリの編集→挿入→ファイルの挿入で補っていきます。

この確認作業を終えれば、自炊作業はひと通り完了です。

OCRをかけるかどうかは好みによると思いますが、私はかけません。ipadのアプリで本を読むとき、OCRをかけていると、少しタップが長くなると、文字列を認識しコピーペースト等のキーが表示されて動作が重くなるなど、読書の邪魔になること、また、OCRは完璧ではないので、OCRに頼った検索等は思ったほどうまくいかないこと(もちろんOCRの結果認識した文字を自力で修正すれば完璧なものになりますが、私の読書には必要性を感じません)が理由です。

神経を使うのは、本の裁断とファイルの確認作業で、文庫本であれば、約30分でPDFにすることができます。そのうち20分くらいは、スキャナーが動いている時間なので、紙をトレイに置くという作業以外は、他のことをすることができます。

なお、スキャナの上位機種iX500だと読み取りにかかる時間を3分の1位に短縮できるそうです。私は、家電量販店でデモを見たのですが、読み取る動きの早さの違いに驚愕しました。Youtubeでも紹介動画が多くありますので、興味を持った方はご覧になると私の気持ちがわかっていただけるのではないかと思います。

 

④データの保管とタブレットへの移動

データの保管は、まず、PDFファイルに本のタイトルをつけ、作者別、試験科目別、書籍のタイプ別等にフォルダ分けをして、HDDに保存して行います。私は、HDDが故障することを想定して、オンラインストレージにも同様に保管しています。

次に、タブレットへの移動ですが、私は、ipadの以前紹介したi文庫HDというアプリを使っていて、かつHDDをNAS化しているので、HDDから直接i文庫HDに移します。

i文庫HD - 私にみえている世界

 

 

最後に、このように自炊にはお金、時間がかかりますが、本が部屋からなくなると非常にすっきりします。また、どこでも、自分の蔵書の全てを閲覧できるというのは、思いの外メリットが大きいです。人と話しているときに本の話題になった時などに、すぐさま本を見せることができるなど、スマートです。

 

ぜひ、皆様も自炊に挑戦してみてください。