高速ロボットがページをめくってスキャン
ここ数年、e-Bookや電子書籍、電子出版という言葉をよく耳にするようになった。昨年末、インターネットの検索エンジン大手グーグル(Google)=米国カリフォルニア州=は、図書館の蔵書を対象に全文検索を行うウェブ上のサービス「グーグル・プリント(Google Print)」を開始した。グーグルが資金と技術を提供し、図書館の蔵書をデジタル化して書籍の中身をオンラインで読めるようにしたものだ。このプロジェクトには米国のハーバード大学、スタンフォード大学、ミシガン大学、ニューヨーク公立図書館や英国のオックスフォード大学が参加し、数年間のうちに合計1500万冊以上の蔵書や関連書類をデジタル化する予定だ。
このプロジェクトの推進役の一人がマイケル・ケラー氏。同氏が図書館長をつとめるスタンフォード大学では、800万冊に及ぶ蔵書すべてのデジタル化を目指している。「本の未来・未来の本についてのシンポジウム」(国立情報学研究所主催)に招かれた同氏は、進行中のデジタル化の具体的な方法や著作権の問題などについて指摘した。
これまでも蔵書のデジタル化は一部の大学で行われてきたが、時間と費用がかかりすぎるのがネックだった。しかし、今回のプロジェクトでは図書館側にとっては、グーグルがデジタル化の費用を肩代わりしてくれることで、類のない本の情報提供が可能になった。一方、グーグルでは検索対象の拡大と広告収入が見込めるというメリットがあり、双方の利害が一致した。
デジタル化の方法は、紙の書籍をスキャン用のロボットが高速でページをめくりスキャンをする。人間が手でページをめくるよりも数倍速く、本を傷つけずに作業ができるため、スタンフォード大学では当初想定していたよりも早く作業が終了しそうだという。
今後は、こうした書籍のデジタル化の作業がさらに進むと思われるが、その過程にはいくつか課題や疑問が残されている。その一つが著作権の問題。スタンフォード大学が提供している書籍も、1922年以前に出版されたパブリック・ドメイン(著作権が放棄または消滅していることを指す)に限られている。1923年以降の書籍については、著作権者に無断でインターネット上で公開することは著作権法により違法とされ、本文の1ページと書誌情報の表示にとどまっている。
加えて、デジタル化される書籍の選別が米国主導で行われることへの恐れも指摘されていることをケラー氏は紹介した。今回のプロジェクトに参加している大学図書館は英語圏のみ。将来の世代に米国の視点を押し付け、それ以外の視点を持つ機会を奪うことにつながるのではという声があるというのだ。
さらに、デジタル化が進めば、紙の書籍が読まれなくなるのではないかという懸念が出版業界や知識人の間にある。こうした懸念を裏付けるのが昨今の出版事情である。
たとえば、日本では1996年をピークに出版業界の売り上げ総額が下降線をたどっている。一方で、電子ペーパーの登場によりハード面の整備が整ってきたことなどで、本格的な電子出版を始めようという機運が高まり、2004年には日本初のネットの貸本屋「Timebook Town」がオープンした。このサイトからダウンロードする電子書籍を読むための専用端末(ソニー製の「リブリエ」など)も発売された。これらは、紙の書籍の感覚に近く長時間の読書にも耐えられる。端末のサイズや使い勝手に改良すべき点があるものの、デジタル書籍の「新しいかたち」を示している。ケラー氏も日本で入手したリブリエ端末に、早速BBeB形式の英語版コンテンツをダウンロードしてみて、文字の美しさに感動したと話していた。
Timebook Townを運営する(株)パブリッシングリンク(東京都千代田区)社長の松田哲夫氏は、「電子出版が、紙の本の出版を補完、刺激し、出版界全体の活性化につながれば」と語る。
80億のウェブページは氷山の一角
これらの動向をみると、「将来、紙の書籍は消滅するのか?」という疑問が湧き上がるのは当然かもしれない。この点について、千葉大学文学部行動科学科教授の土屋俊氏は、「紙にインクで印刷され製本された近代の本という媒体は、知識の選別と伝達と保存のための最良の様態だったかもしれないが、インターネットの登場により、紙に制約される必然性はなくなった」と言う。
たとえば紙の書籍では、目次、脚注、索引、引用、参考文献といった情報は、本文とは別のページにまとめて編集され、ページをめくって読まなければならない。これがインターネットなら、目次から本文、本文から引用へとハイパーリンクで次々にたどることができる。さらに、文字だけでなく、画像、音楽、映像での伝達が可能となれば、インターネットの利便性は高まる。
ところがインターネットには、情報の選別、評価が情報の受け手に委ねられているという問題がある。誰もが書籍を作る手間を経由せず自ら発信する自由を得たことは、インターネットの最大の功績だが情報の質は千差万別だ。
今回のシンポジウムを企画した、同研究所ソフトウエア研究系教授の高野明彦氏は「溢れかえる情報の海で溺れてしまわないように適切なナビゲート機能が望まれている」と言う。現在、グーグルは80億ページをインデックスしているが、これは全体の一部だといわれており今後もウェブページが爆発的に増え続けることは疑いない。
そのとき、紙の書籍がもつ情報の正確さという利点は、これまで以上に価値を増していくのではないかと高野氏も指摘する。紙の書籍が消滅すると判断するのは、現時点で時期尚早といえるのは、いうまでもない。まずは、図書館に眠っている貴重な書籍をオンラインで読むことのできるメリットを享受してみてはどうだろうか。
(編集部)
グーグル・プリントの使い方
日本のGoogle.co.jpではサービスを開始していなが、米Google.comでは、出版社から提供された書籍を対象に、書籍の抜粋を検索・閲覧・購入することができる。
たとえば、検索ボックスに「Information Technology」と入力すると、検索結果の2件目に、本のアイコンが付いた「Book results for information technology」という「グーグル・プリント」へのリンクが表示される。このリンクをクリックすると、「Information Technology」という言葉を含む書籍のページ一覧が得られる。
その中から読みたい本を選ぶと、そのページのイメージが表示され、画像中で検索に使われた言葉が黄色くマークアップされる。画面左には、本の表紙画像が表示され、著者、出版社、ページ数、概要(レビュー、目次)などの書誌情報も示される。その書籍のページに限定した検索機能も提供されている。本によっては、他の本文ページを順に読むこともできる。「Buy this book」という項目には、オンライン書店(Amazon.comやBarnes & Noble.comなど)の一覧が示され、リンクを辿るだけでその本を簡単に購入できる。
ケラー氏推薦サイト
|
TopicMap |
トピックで論文を検索するビジュアルインタフェース。 HighWire Pressが作成したトピックの木を辿って検索できる。 |
|
Grokker at Stanford |
Web検索結果を自動的に分類して美しいグラフィカルイメージで見せるビジュアルサーチエンジン。 スタンフォード大学ではWeb以外のデータベースも検索可能にしている。 |
|