「知のアーカイブ」の拡充を目指して
昨日、グーグルニュースを見ていたら『イースト、 PDFからの構造化テキスト抽出に成功、岩波新書をEPUB化』というリンクを見つけました。
そのページに飛んでみたところ専門用語満載の難しい文章が表されていましたが、要は、比較的容易な作業で刊行されている岩波新書の電子書籍版が出来るというものです。近年出版されたもののなかで印刷会社が製版データを保存していればという条件は付くものの、このテクノロジーを活用して絶版になっている書籍もEPUB形式で復刻できるワケです。
……………
これまでにも古文書のデータ化は行われてきましたが、商業刊行物で版権が成立している出版物に関しては新しく書き起こされたものがほとんどで、資料として手に入れたいが専門的な古書店でも見つけにくい書籍を手に取るのは─国会図書館のアーカイブに保存されているもの以外─絶望的な状況だったといっても過言ではありません。
……………
しかし、今回の技術開発で状況は一気に変わってきたようです。
活版や写植で作成された数十年前のものはいうに及ばず、高密度のPDFで保存された印刷データを活用した復刻はエラー覚悟のものでした。簡単に言えば、EPUBに対応したレイアウトソフトで保存されているでないと復刻は難しいものだっのです。
それがPDFからEPUB用データに変換できるソフトの完成によって書物のデジタル化がスムースに行えるようになりました。
たとえば、学術書や論文など初版限りで絶版になっていたものや、自社でデータ保存するには荷が重すぎるとされている新聞でも「知のアーカイブ」であったり「歴史の証言者」としてデジタル保存出来るようになったんだと僕は捉えています。
平たく言えば、このソフトウェアを使えば「知の蓄積と考えれば重要だが、売れないから重版も復刻もしなかった本」にも改めて光が当たる日が来る、ということです。
岩波書店の刊行済新書のEPUB化を端緒として、数多くの「知」が復刻されることいなるでしょう。いや、そうなってほしいのです。
[3181]