書籍の電子化についてまとめ

1PDF化してPCやPadで読む

これは簡単。書籍をバラバラにできるなら、ScanSnapを使えば簡単に短時間でできる。
できたファイルをDropBoxなどクラウドに置けば、Padで読める。
ただし、読書専用機(例えばKindle Paperwhite)で読むには不適だ。それにはPDFをテキスト化する必要がある。

2PDFをOCRでテキスト化する。

方法として以下の二つがある。

1ScanSnap同梱のツールを使いwordに書き出す。
2Googleドキュメントを使い、テキスト化する。

3その上で電子ブック形式(Kindle Paperwhiteなら.mobi)に変換する

ただしコンテンツと機器によって方法が異なる

文字種が比較的単純で、横書きの場合は

Mac PCを使うなら、Pagesにテキストを読み込ませて、epub形式に出力させる。
Win PCを使うなら、Wordにテキストを読み込ませて、そのまま保存する。
その上で、どちらもKindle Previewerを使って、.mobiにエクスポートする。

文字種が比較的単純で、縦書きの場合は

Mac PCを使うなら、Pagesにテキストを読み込ませて、epub形式に出力させて
epub内のcssを編集した上でもう一度epub形式に出力させる。(この方法はググってみてね)
Win PCを使うなら、フリーソフトを使い、縦書きのepub形式のブックに出力させる。
その上で、どちらもKindle Previewerを使って、.mobiにエクスポートする。

文字種が複雑で、縦書きの場合は

OCRの精度が問題となるので、かなりの校正をしなければならない。
しかもルビ等についても配慮しなければならない。
この場合はwordの校正機能を使ったり、エディタの置換機能を使ったりし、
最終的には「青空文庫」のテキスト形式を作成すると良い。(この件は「青空文庫」のサイトを参照)
その上で、AozoraEpub3というツールを使い、電子ブック化する。(この方法は別記事
以上

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です