風
 
 
 
 
 
 
[知ることの価値と楽しさを求める人のために 連想出版がつくるWEB マガジン
蔵書全文デジタル化の先に見える図書館の未来(3) (3)
2
情報と検索
横断検索エンジン「xsearch」
連想検索
情報無料化への警告
情報と検索
 私と同様の職業あるいは他の記憶機関に従事する人々にとっての課題は、多種多様な情報に対して普遍的なアクセスを提供することです。ここで私は、現在進行形で行われている対策についてご紹介したいと思います。こうした取り組みは、ひとりひとりが、今後利用可能となっていく膨大な量の集積データ情報のなかから関連性の高い情報を探し出すために有効な手段であると信じています。 
 まず、Googleの効果と問題点について考えてみましょう。私たちがGoogleの検索サイトを使うとき、少しの文字やいくつかのキーワードを入力すれば何千もの結果が返ってきます。結果は「ページランキング」と呼ばれる関連ランキングシステムに基づいて順位づけされます。そのページランキングの原理はGoogle社の人々以外には門外不出とされています。5000件のヒットがあれば、それらを実際に一つ一つ見て検討し、もっとも自分の興味に関連する情報を探さなくてはいけません。
 そこで私たちは、個人のニーズにより正確に応えている情報を提供するための方法を模索しなくてはいけませんが、まさにその対策の第一段階として現在取り組みの進んでいるのが、スタンフォード大学の蔵書コレクションのためのオンラインカタログの新しいインターフェイスです(http://searchworks.stanford.edu)。現在コレクションには550万タイトルが登録され、800から900万冊もの蔵書を取り扱っています。
 ここで仮に「日本と茶」と入れて検索にかけてみると、このウェブカタログから136冊の本が選び出されます。これらの本はさまざまな方法から絞り込みができます。これらの本の多くは図書館にあり、6冊はオンラインで読むことができます。また、フォーマット(形式)によっても整理が可能で、123冊は本、8本のビデオ、3つは定期刊行物、2つは音声記録、1つは議事進行録です。
 また著者によっても分類可能です。出版年、トピック、所在する図書館(スタンフォードには20もの図書館があります)、請求番号、書棚、組織、地域、本の扱う時代、言語によっても分類ができます。出版年を例にとってみると、例えば過去3年間に出版されたものとして絞り込みをかけると本の冊数がしぼられてきます。日本語で書かれた書物もあるようです。
 これらのうちから、検索の結果、最初に出てきた本を見てみましょう。スタンフォード大学図書館のサイト上で一冊の本を選択すると、私たちはさらなる情報を得ることができます。例えば、本の表紙デザインです。また、本の背表紙もわかります。つまり、オンライン上で本を探すのは、まるで図書館の中で書棚を行ったり来たりして、最も興味深い本を探し出すのと同じなのです。そして、請求番号順に並べられた図書館の書架と同じように、その本の右隣と左隣の本が何かを知ることもできます。たとえば1979年に出版された本を選んでみると、それについてのより多くの情報を得られます。こうしたインターフェイスはまったく新しいデータというわけではありません。そうではなくて、新しいデータの整理法であり、プレゼンテーションの方法なのです。
横断検索エンジン「xsearch」
 次にxsearch(クロスサーチ)という検索エンジンついてお話しします。xsearchは、ジャーナル(雑誌)の記事情報からなるデータベースの集積の検索を可能にします。異なる雑誌および出版社がそれぞれ異なる検索エンジンを持っていることが問題になるときがあります。
 それぞれのデータベースでは、情報がインデックス化されていることもありますが、限られた主題しかカバーされていません。そのため主題と出版社を横断して適切な記事を見つける技術が求められています。さらにこれはあくまで「雑誌」の検索であり、「書籍」ではありません。この二つの検索機能をどうやって組み合わせるかは将来取り組むべき別の課題と言えそうです。
 とにかく本の場合でやったのと同様に「日本と茶」という単語を入力して検索してみましょう。すると20ものインデックスと要旨、出典がでてきます。このインデックスの一覧から1000近くの記事が選択され、はじめのページには、はじめの28項目が表示されています。徐々に検索結果数が増えていき、最終的に1400件もヒットしました。ここでは食べ物、本、方法などトピックごとに分類ができます。食べ物を選択するとヒット数は1632になりました。それでも多いので、今度は著者をみていくことにします。タイトルによっても選択が可能です。また興味を引きそうなテーマにあわせて検索結果をぐっと狭くしぼっていくこともできます。
 最終的にしぼったところで見てみましょう。日本茶を給仕するロボットの発達についての記事がありました。これはIEEE International Conferenceという国際学会によって出版されている論文で、選択して読み込んでみると、実際に記事をオンラインで入手して読むことができます。この検索エンジンは最先端の技術です。というのも、一つの質問に対して、26もの異なる出典を見つけることができるからです。
 以前は26のすべてのデータベースの一つ一つにあたり、実際にそれぞれのデータベースを検索してメタ情報を果てしなく集めなくてはならなかったからです。現在スタンフォードには1000以上のコレクションがあるので26というのは大きな数ではありません。これらのデータベースを統合した検索機能の充実に対してはさらなる努力が必要です。
連想検索
 高野先生および彼のチームが開発した連想検索およびサイト(Webcat Plus)に私が非常に感動し関心を寄せているのはすでにお気づきでしょう。先生自身も後に言及されることとは思いますが、個人にとってより関連のある結果をもたらす検索機能は、私のライブラリアンとしての長い経験の中でも最も重要な開発の一つです。
 もう一度「日本と茶」の単語を使ってみましょう。この検索エンジンは日本の主要な図書館からの蔵書情報で、雑誌を除いて、この検索語によって68,718冊もの関連書籍が出てきましたが、最初に出てきた本は『茶の文化と日本』というタイトルで、それだけ見ても非常に関連がありそうです。新しい検索語を入れて結果を絞り込んでいくこともできますが、これはキーワード検索とは異なります。連想検索とは、検索されたテキストデータにおいてこの二つの単語が相互に密接に関連しているものを検索できるシステムであり、次世代につながる非常に優れた機能なのです。
 最後に、情報を他の文章と相関させて検索する方法の例としてFreebaseというサイトをご紹介します。ファイルには1000万もの関連トピックがあり、何十億もの文章と関係性を検索することができます。ここでも「日本と茶」を入れてみましょう。60ものトピックがヒットしたので、私も大好きで世界中のどこよりも日本で美味しくいただける「緑茶」を選択してみましょう。するとまた様々な種類の情報を得ることができます。化学成分や栄養情報、緑茶はどうやって作れているのか、なぜ緑色かなど、緑茶に関する出典と情報をこのメカニズムを利用して入手することができます。このシステムは関連性をもつ記述や情報を持つようなすべての情報が集められているため、個人のニーズに適した情報を非常に便利よく手に入れられるのです。
 私が検索機能において重要だと考えるもう一つの特徴は、読者がウェブページや文書や情報に注釈をつけられるという機能です。さらにこうした情報を自分たち自身の目的のために保存し活用して、友人や同僚と共有することができます。それは教育と学習に役立ち、研究の発展にも貢献します。さらに単語や段落、さらに文書全体を使った検索によるソーシャルネットワーキングへの応用へも可能です。このようなサービスを提供するもののうち特に私が注目している一つに、私の近所に住む知人の息子さんが開発したreframeit.comというサイトがありますので、機会があれば一度ご覧いただきたいと思います。
情報無料化への警告
 最後にこのトピックに関連してお話ししたいのは、情報が無料であるべきか否かということです。もちろんタダのものは存在しません。問題は誰がその料金を支払うかという問題です。「情報は本来無料であるべきである」という主張について、私の友人でもあるStewart Brandも、「多くの人々はより多くの情報がより多くの人々、市民に提供されるべきであると望んでいる」と述べています。私もこの意見に大いに賛同します。
 しかしながら、実際のところ情報というのは何らかのコストを伴います。誰かが情報に投資しなければ、情報は利用可能にはなりません。そのため、Stewart Brandの言葉をさらに借用して、応用させるならば、「情報は無料で提供されるべきだが、必要な時に手に入る関連性の高い情報は重宝され高価にもなりうる」ということなのだと思います。この情報の価値という視点はしばしば忘れられ、情報の市場価格といったものも現代の社会では存在しません。しかし、情報が無料となってしまうと、政府や宗教などの単一独裁的な情報源のみから、大量の情報が提供されるという危機的な事態にもなりかねません。これは情報無料化の主張に対する警告であると思います。
(翻訳:今井 祥子)
<< PAGE TOP
2
PROFILE

Michael A. Keller

1993 年から現在まで、スタンフォード大学図書館長(Ida M. Green University Librarian)。1995 年にHighWirePress を設立、今では世界中の1000タイトル以上の学術誌の電子出版を手がけるその非営利団体の創立者・出版人である。その活動を通じて学術誌の電子化が商業出版社の利益追求の道具とされることに一貫して抵抗してきた。2000 年からは、スタンフォード大学出版の発行人も兼任している。

<< PAGE TOP
Copyright(C) Association Press. All Rights Reserved.
著作権及びリンクについて