什麼是自炊呢?自炊是來自日本的用語,意思是把紙本書電子化(book digitization / book scanning)。近年出版的書,不同領域的電子出版比例不一;早年的電子化比例又更低。一定會有書沒有電子版,如果想要全面電子化,一定會需要自炊。 需要自炊的情況:
掃描紙本書電子化有三種方法:
三種方法比較:
速度方面:
拆書掃描一本書通常十分鐘內自動掃完,只需要補紙到進紙匣;而拍照或平台需要兩三倍以上的時間,而且要全程參與手動操作。 選擇時的考量點:
拆書拆書有幾種方法:
掃描後的處理掃描完後一般是做成 PDF 或圖片,可以再透過 OCR(optical character recognition)辨識文字,轉為文字檔(EPUB 或 TXT)或是雙層 PDF。
※ 雙層 PDF:將辨識的文字覆蓋在掃描圖片上,做成透明文字層,兼具原始排版的特色與文字可選取、可搜尋的方便。 不過因為每個人的藏書內容不同,辨識的準確率建議自己嘗試,常見的軟體例如 Adobe Acrobat 跟 ABBYY Fine Reader。 個人經驗是除非很需要選取或搜尋,不然沒必要特別轉為文字檔,額外增加辨識與校正的工作量。 舉例來說,轉 EPUB 的通常有以下麻煩點:
常見的一種自炊需求是不用動腦的小說或雜誌,這類書籍個人覺得光前三點就沒必要轉文字檔,除非很堅持要流動版面但又買不到電子版的話再自己克服難關。 延伸:自炊相關的著作權議題 http://www.copyrightnote.org/ArticleContent.aspx?ID=9&aid=2751 |
Categories
全部
Archives
八月 2024
|