風
 
 
 
 
 
 
[知ることの価値と楽しさを求める人のために 連想出版がつくるWEB マガジン
蔵書全文デジタル化の先に見える図書館の未来
 デジタルパブリッシングや電子ブックリーダーの波が押し寄せるなか、本を取り巻く環境はどう変わっていくのか、本の未来はどうなっていくのか。この大テーマのもと今年3月、国立情報学研究所でスタンフォード大学図書館長のMichael A. Keller(マイケル・ケラー)氏が「蔵書全文デジタル化の先に見える図書館の未来」と題し講演をおこなった。ケラー氏はこれまでに1000タイトル以上のジャーナルを電子化して出版。また、同氏が推進したロボットの自働ページめくりつきのスキャナーを使ったRobotic Book Scanning Project(ロボットによるスキャニング・プロジェクト)は、Google Booksのサービスに影響を与えたとも言われる。図書館全体のデジタル化という大きな流れを作った張本人でもある同氏による講演の内容を、3回にわたって紹介する。
1
新しいツールによって開かれる可能性
これからのライブラリアンに求められる役割
学術情報の保存とアクセス
資料の選択・入手とアクセスの提供
新しいツールによって開かれる可能性
 新しいツールと方法について、私のスタンフォードと国立情報学研究所での経験からお話したいと思います。スタンフォードで今注目されているのは地形情報システムのデジタル地図の開発です。経済や商業情報、人口統計と文化事業、特定の地域の物流についての情報などを地図上に表す試みが進められています。
 こうしたデジタル地図は自由に重ね合わせることが可能です。たとえば、非常に古い手描きの地図をデジタル化し、サテライトから取った最新の地図と重ね合わせれば、新しい情報や洞察を得られるかもしれません。この地形情報システムの発達のおかげで、新しい表現や表示方法が生まれ、都市計画や選挙、環境問題等に応用されています。

 自然言語処理は最新の方法というわけではありませんが、きわめて重要です。会場にいる長尾真先生(国立国会図書館長)がこの専門家でいらっしゃいますが、この方法は単語やフレーズ、文などの単位で文章を理解しようとする新しい可能性を模索するもので、大量の文章を処理することが可能です。そこから新しい仮説ができ、その仮説を表現するための新しい方法が生まれています。例えば、ヒト生物学に関して、多様な言語で記された膨大な量のテキストを処理することも可能となったため、新しい治療法を模索する場合に、一つの地域の伝統的な治療法を別の地域で応用することができるようになったのです。これは自然言語処理が私たちの生活にとってどれほど有益であるかの好例だと思います。
 また世界の別の動向として、すでに少しふれた低コストでのメモリ増強があげられます。メモリが安価になれば、それだけ処理が早くなり、より多くの情報を扱うことができるので、私たちの脳に記憶しておかなくてはならない情報量は減少します。より大きいメモリ、より早いスピードのおかげでメモリの全体の容量は絶大なものとなっています。
 さらに、言葉や文字によって表現される意味や思考を解析するための新しい手段である、連想検索やセマンティック検索が登場してきました。これらは異なる言語で書かれた様々な文章の意味を比較することができる点で、従来の自然言語処理とは異なります。つまるところ、言語間の相違を超越する技術はすべての検索/分析方法にとってもっとも困難な問題なのです。

 過去15~20年間で画像を分析する技術の開発も進んでいます。例えば、小さな湖や小川、山などの風景の画像を探しているとします。年代順に並べた黄色い花の画像や、過去数十年分の日本の桜の画像が必要となることもあるかもしれません。このように以前は考えられなかった方法で画像を見たり、情報を取り出したり分析したりする可能性がひらかれてきています。そして、大量の画像を扱う際、脚注をつける機能によって画像にコメントや解説をつけて、テキストによっても画像へのアクセスが可能となりました。
 こうした検索エンジンや検索方法の開発のおかげで私たちは文化のより詳細な部分へと目を向けるようになりました。言葉やフレーズからハイパーリンクを貼って、その意味を調べたり、使い方や文学作品における使用例を知ることができるようになったのです。本をデジタル化することによって、すべての単語から辞書の定義にリンクを貼ることができるようになり、もともと私たちの脳のなかで自動的に行われている文化的分析のようなものを、幅広い分野にまたがる膨大な情報に対して行うことができるようになったのです。
 また、こうした異なるいくつかの方法を比較したり相互利用したりする試みも進んでいます。作品から筆者や作者の意図を推察するのに、新しい表現の中で、新しい情報が生成されるプロセスを知ることができるようになりました。類似したジャンルや文書に触れたり、特に相関性の高い文学の世界においては、同時代の他の作家の作品を参照したりすることが重要です。しかし、制作年代の古い作品では、作者の意図を正確に把握するというのは非常に困難な作業です。十分なメモリのもとで、自然言語処理、連想検索、セマンティック検索を組合せて駆使することによって、はじめて作者の意図について知り、仮説を立てることが可能となります。こうして、私たちは私たち自身の文化について理解を深めることができるのです。
サンフランシスコの地図
1(左上)、2(右上)、3(左下)、4(右下)
 地理情報システムディスプレイの簡単な例をご紹介しましょう。ここにおそらく1860年から70年代に制作されたとされるサンフランシスコの地図1があります。さらに19世紀末頃の同じ場所の地図2、20世紀の地図3があります。これらを現代の地図4と並べてみると、都市のこの特定の地域の過去60~70年にわたる変遷を目で追うことができます。またこれらを重ねて表示することもできます。
これからのライブラリアンに求められる役割
 はじめに、これからの本のデジタル化社会において、私たちは単なる「ライブラリアン(図書館司書)」ではなく、「サイブラリアン(Cybrarian)」なのだという点を強調しておきたいと思います。私は敬意をもってこの言葉を選びました。私たちライブラリアンは依然として、私たちの文化そのものと見なされる紙の書籍に責務を負っているからです。私の考えるサイブラリアンとは、紙の文書とデジタル化した文書の両方を扱う仕事なのです。もちろん50年後はデジタル情報にさらに力点が置かれ、本や雑誌、評論や新聞などがデジタル版として出版され、販売されることでしょう。そして、実際の書物などは文化としての機能から、単に印刷された本やポスター、地図として見なされ、価値や意義が低減されるでしょう。それゆえに、私たちはデジタル化への対応力を身につけなくてはいけません。現存する書物を保護していく義務と同様に、デジタルシステムの発展が望まれているのです。
 従来の図書館についての原則は実際にはデジタル図書館にも応用ができますが、ライブラリアンたちの役割とは何でしょうか? 私たちは入手した資料を選択し、その資料への知的アクセスを提供し、その利用を助けます。地域や個人の利用者にアクセスを再分配します。デジタル化した新システムでは、資料が利用された際の持ち主の情報および情報が誰によってどのように利用されたかが分かり、資料の利用促進や学問的貢献、著者や発行者への著作料を支払うために役立ちます。私はこうした再利用と報償の数的指標評価システムが非常に重要であると考えています。私たちは通訳と情報サービスを提供し、図書館のルールがあまり良くわからない利用者が、生徒や読者に対してより容易にアイデアを伝えられるよう、関連書籍を探す手助けをしたり、ウェブ上で情報を整理するのをサポートしたりします。そして最後に、ライブラリアンたちは本や原稿などの実際の印刷資料を長期的に保存し、またデジタル情報を長期的に保存することに責務があります。EジャーナルやEブック、デジタル映像などを長期的にオリジナルの保存状態のままで利用者に提供できるように保存しなくてはいけません。実際の資料と同じように、デジタル資料も様々な文脈で利用されるのです。
学術情報の保存とアクセス
 これらをふまえて学術情報に関するフローチャートを作成すると、「研究とEサイエンス」、「学習と教育」、「サービス」と研究と情報によって裏付けられる「Eジャーナル」という4つの要素に分けられます。情報とジャーナルは出版社とサービスによって集約され、学習と教育に活用されます。そしてその循環サイクルの中心部にはデジタル倉庫としてのデジタル図書館があって、年代順に文書やジャーナルが保存され、アクセス可能な状態にします。
 現在はネットワークでの文献管理が可能な新しい環境となり、非常に情報が豊富になった反面、図書館がすべてのアウトプットを引き受けるようになり、問題にもなっています。図書館はツイッターやYouTube上にあるものまですべてを収集する必要はもちろんありませんが、例えば、国立生物工学情報センターや癌生物医学情報科学グリッドの情報はすべて適切に保存されるべきでしょう。つまり、いくつかの情報は非常に作為的に選択されているということです。精密に収集されるのはごく一部の情報で、あとは総合的に処理されているというのが現状です。
 ウェブ上にある何十億もの情報の関係性を図に示してみると、それぞれが結節点のようなつながりをもつことが分かります。これはメタデータの関連データグリッドと呼ばれ、リンクや文献、人、場所、もの、出来事などの事象によって織り上げられた布のようなイメージとして捉えられています。あらゆる情報はそれぞれ別の情報と何らかのつながりがあるとする考え方です。
資料の選択・入手とアクセスの提供
 ここでは図書館の原理と機能についてふれ、ライブラリアンたちは何を収集するべきなのかについてみていきましょう。私たちは特定のジャンルの、特定の主題にしぼって深く掘り下げて選択していくべきです。そしてまたウェブを活用し、記憶機関のマトリックスを最大限に活用して、世界中のあらゆるトピックを網羅することも必要でしょう。ライブラリアンにとって、主題が明確であること、地域と国家の関係を重視すること、言語に精通していることは非常に大切なのです。
 スタンフォードでは35人の資料収集者がいます。多くの人はPh.D.保有者であり、その分野のスペシャリストで、資料を調達する国の出身者もたくさんいます。私たちは毎年世界135カ国から資料を選び、入手しています。
 資料収集者達は絶えず学者や学者グループ、研究所、様々なプロジェクト、学術関連施設や学会と交流を持つことが大切です。情報産業に精通し、グローバルな規模で情報トレードを行い、適切な資料を選んで記憶施設に持ち込まなくてはなりません。
 そうした記憶施設の筆頭とも言えるのが、図書館や地域社会のサービス需品課、購買部などです。それらは推薦された書籍や選択された資料を入手し、ビジネスの物流に乗せます。資料へアクセスし、実際に実物を記憶機関へともたらします。そして、届けられた商品は正しく注文し請求したものであることを確認する必要があります。これは需品課の大切な役割です。

 私たちライブラリアンは情報の知的アクセスも提供します。自己文書化機能があり、自動インデックス機能のある情報管理方法が登場しています。人間が費やす時間より短い時間で、情報を管理し、読者やユーザに提供します。そのようなメタデータグリッドの構築が進み、すべての情報の関係が明確になるようなデータ間のリンクの方法と環境を整える試みが進んでいます。ただ、これらはまだ実験段階で試作品がいくつかあるにすぎないので、今後より大規模なシステムの開発が望まれています。
 資料に関しては正式な専門用語を用いて関係性を記述したフレームワークを使用します。例えば「マイケル・ケラーはスタンフォード大学のライブラリアンである」というのは一つの関係を表しており、私がスタンフォードと特別な関係を結んでいることになります。この関係についての情報を詳細にしていくのです。私たちが多くのデジタル書籍を手にすれば、何百万という本や論文の言葉やフレーズで、それらのコンセプトについて調べたり、アイデアを表現することが可能となるのです。そして、それはそうした様々な言葉やフレーズの組合せを理解し、特定の瞬間に特に必要となる、最も関係性の高い情報をこれらの組合せによって摘出することができるということを意味します。

 私たちライブラリアンは情報と記憶を扱う機関にとって情報の分配者、再分配者として従事します。ある意味出版社のような役割を果たすのです。出版社は出版するべき本を選びます。私たちライブラリアンは文化の収集として、出版された書物から保存する対象を選び、長期にわたって利用ができるようにします。この二つの選択過程は、実際にはそれぞれ独立して意思決定を行っていて、その結果として文化資産が保存されることとなります。私たちライブラリアンは出版業界と図書館業界の両方に従事していて、人々は読みたい本や出版したい本について意見をのべることができます。近年スタンフォード図書館組織は、論文と学位論文の出版という新しい役割も担っています。

 情報の社会的役割は、市民が情報へアクセスできるかどうか次第だと言えます。政府や社会のリーダーシップによる統制がきびしく、情報へのアクセスが制限され、思想統制が行われている社会ではどうでしょうか。たとえばミャンマーなどではどれくらいの人がインターネットにアクセスできるでしょうか? 決して多くはないはずです。しかし、日本やアメリカではインターネットは自由に利用されています。制限があるとすれば、自分だけのブロードバンド接続ができるか、自分専用のネットワークへの接続環境があって、自分のパソコンを買う経済的余裕があるか、あるいは図書館へ行って、そこにある設備を利用するかでしょう。
 私たちライブラリアンは学術図書館施設で学術論文および参考文献として何が読まれ、利用されているかについても絶えず注意を払っていなくてはいけません。これは公共図書館においては最重要事項とはみなされませんが、ソーシャルネットワーキング効果の結果として評価されるべきでしょう。どのような場合にも公共図書館は利用者が何を読むかを把握し、それに関連するようなトピックや同一著者が記した書籍を提供することを目指しています。
<< PAGE TOP
1 2
PROFILE

Michael A. Keller

1993 年から現在まで、スタンフォード大学図書館長(Ida M. Green University Librarian)。1995 年にHighWirePress を設立、今では世界中の1000タイトル以上の学術誌の電子出版を手がけるその非営利団体の創立者・出版人である。その活動を通じて学術誌の電子化が商業出版社の利益追求の道具とされることに一貫して抵抗してきた。2000 年からは、スタンフォード大学出版の発行人も兼任している。

 
<< PAGE TOP
Copyright(C) Association Press. All Rights Reserved.
著作権及びリンクについて