風
 
 
 
 
 
 
[知ることの価値と楽しさを求める人のために 連想出版がつくるWEB マガジン
Googleはすべてを集めてはいない! (2)
2
4. グーグルが検索エンジンの“発想”を変えた!
5. 「Google」と「Powered by Google」は別物!
6. グーグルがカバーしているのは世界のたった4分の1
4
グーグルが検索エンジンの“発想”を変えた!
――
「検索エンジンの勝負はついた」と思われていたとの話がありましたが、その後、グーグルが誕生しましたね。なぜあえて検索エンジンの開発がなされたのでしょうか? その背景などを教えてください。
高野
 ポータルサイトの限界みたいなものに、ユーザーもサービス提供者も気付き始めたということでしょうね。ポータルサイトというのは、パッケージで売り出して、いろんなサービスやコンテンツが入っている、いわば幕の内弁当みたいなもの。しかし、例えば天気予報であればどこどこのサービスがいいけれど、地図はこっちのポータルがいい。あるいは乗換案内であれば、それ専門のWebサイトの方が便利だとか。つまりひとつの幕の内弁当では満足できなくなってきて、いろんな幕の内を試してみたい、専門店の味も味わってみたい。そういうニーズが生まれてきたんです。それはユーザーの成熟ともいえると思います。
  そうしたなかで、アルタビスタやインクトミなどの検索エンジンは、それまでポータルの裏方として定着していたけれど、検索エンジンこそが、そういう専門店を見つける有効な手だてだと認識されるようになった。そこにグーグルが登場する背景があったんだろうと思いますね。
――
グーグルが、他の検索エンジンを凌駕したのはなぜでしょう?
高野
 グーグルの開発者、ラリー・ページとセルゲイ・ブリンは、技術者的思考で「今の検索エンジンでは、いずれ破綻する」と見抜いたんです。破綻すると言うのは、当初、5千万〜1億ページだったWebページが、どんどん何十倍と増え続けていた。そうすると、クローラーの集めてくるページが膨大になり、それだけの膨大なページを検索した結果をすぐに返さないといけない。Webページの増加にコンピュータの性能向上が追いつかなくなる。
 また、検索結果の数が膨大になるにつれ、大して内容のないページが検索結果の1ページ目を埋め尽くすことが増えてきました。これでは、自分に必要な情報になかなか到達できない。「検索範囲が増加すると、検索エンジンが役に立たなくなる」というジレンマに陥りつつあったのです。
 だから根本的に、検索エンジンの“発想”を変えないといけないと考えたのです。当時、最大のエンジンでも数億ページを集めているだけだったので、それより多く10億ページくらいを集めるところから始めました。Webページを集めながら、後でページの重要度評価に使うリンク情報を集約し、検索のためのインデックスを生成し…と、非常によく考えられたシステムをすべて自作したのです。
 そして、どういう順番で検索結果を返すかをとても重視した。いわゆるページランクの発想です。検索結果のランキングこそが重要な価値だとして、Web検索技術を一から再構築したこと、そこにグーグルが成功した理由があると思います。
――
しかし、当初はYahoo!の方が一般的でしたよね?
高野
 今でも日本ではそうですね。相変わらず、日本ではYahoo!が強い。今や、検索エンジンではグーグルと喧嘩しようとする人はいない感じですが、Yahoo!は、一時期グーグルに頼っていたウェブ検索を、Yahoo Search Technologyという独自エンジンに切り替えています。日本語に強い検索エンジンに国産サービスのgoo()があります。ここではクロールについてはグーグルに頼っているようですが、検索については独自技術が使われています。

goo:NTTレゾナント社が運営しているポータルサイト。サービスの中核となる「検索サービス」では、「日本人が日本語を利用して検索する際に最も便利な検索サービスの提供」を標榜しており、日本人のためのポータルサイトとして注目されている。
<< PAGE TOP
5
「Google」と「Powered by Google」は別物!
――
“ものを調べる”ということに限れば、例えば言葉を調べるのは、以前だと広辞苑に代表されるように、「これ!」というのがありました。その意味で、こうした旧来の情報源と同等なポータルサイトと言えば、グーグルかYahoo!になるのでしょうか?
高野
 いや、他にもポータルサイトはいろいろあります。「これが一般的です!」とは言えないでしょうね。とはいえ、多くのポータルサイトが「Powered by Google」としてグーグルの検索エンジンを用いているのも事実です。一見、ディレクトリ型が残っているポータルサイトでも、検索機能についてはグーグルに頼っているということも多いですね。
  ただ、他のサイト向けに「Powered by Google」として出している検索エンジンとグーグル本家の検索エンジンとで、検索結果が同じかというとそうではない、というのが一般的です。例えば、ライブドアにある検索エンジンは「Powered by Google」ですが、そこで「新書」を検索すると37万件しか見つかりませんが、グーグル本家で同じ「新書」を検索すると5300万件以上ヒットします。つまり、検索対象となっているWebページの数が100倍以上も違うんです。
――
同じ「Google」のロゴを見ると、一般の人たちは同じ結果が得られると思いますよね?
高野
 そうでしょうね。しかし、同じグーグル提供のものでも、入り口によってずいぶん違うものなのです。それに気づくと、“ものを調べる”という目的で検索をするとしたら、最初からグーグル本体に行きたくなりますね(笑)
――
検索エンジンとして優秀なグーグルが存在すると、Webページへの入口はグーグルで十分ではないかと思えてしまいます。ウェブディレクトリなどを提供しているポータルサイトの存在価値はどこにあるのでしょうか?
高野
 例えば、何かものを買いたいという場合は、楽天やアマゾンのような商店街がある。天気予報を知りたい、コンサートの日程を知りたい、地図を調べたいなど、普通に思いつく欲求について便利なものを作れば、これだけユーザーが増えたので、とりあえず何万人、何十万人とユーザーがつく訳です。ポータルサイトはそういう最大公約数的な、人々の欲望を満たしてくれるサイトだといえます。しかも5分で確実に調べられるように、情報を整理して提供しているところに価値がありますね。
 しかし、やはりそういう決まりきったサービスだけでは満足できないユーザーがいる訳です。例えば、旅行だったら、ほとんどは出張なので、安くて駅から至便な距離にあるホテルだけが見つかればいいけど、そこから、自分なりの関心で旅程を考えたいとか、自分の好きな料理を提供してくれるお店を見つけたいなど、何かをプランニングしたいという欲求については、今のポータルサイトでは非力だということです。ポータルサイトでカバーしきれないものについて、どこが受け止めてくれるかというと、グーグルが引き受けている。ありとあらゆるWebページを収集して、このような個別の要求に答える情報をカバーしていることがグーグルの魅力です。
――
となると、ポータルサイトは、雑誌とかなり近い存在ですね。
高野
 そうですね。それぞれのポータルが、独自の売りを持っています。たとえばYahoo! はディレクトリサービスとして始まったので、やはり分類されたリンク集は洗練しているし、充実している。楽天は、商店街ですから、商品やお店の情報が強い。それぞれのポータルがそれぞれの強みを出そうとしていることも、雑誌と同じ感じがしますね。
  しかも、雑誌はなかなか全部買って比べる訳にはいかないけれど、Web上のサービスであれば、気軽にいろいろと比べてみることができる。そこが雑誌とは違って便利ですね。
  比べるときは例えば、自分が得意とする知識や情報を例題にして、ディレクトリを追いかけたり、検索したりするといい。そうして自分が得たい情報がどれだけ早く見つかるかとか、得意分野であるにもかかわらず、自分が知らなかった情報にたどり着けるかなどが判断材料となって、自分好みのサイトを見つけることができます。
<< PAGE TOP
6
グーグルがカバーしているのは世界のたった4分の1
――
そうしたポータルでは得られない情報は、グーグルで調べるということですね?
高野
 そうですね。ポータルで適当な答えが見つからなかった事柄についてインターネットで調べたいときは、今はWebページ検索に頼ることになりますね。その分野でのナンバー1がグーグルだし、最近はgooも頑張っていると思います。
  グーグルは、世界中の100億ページぐらいはカバーしています。しかし、ここで気をつけたいのは、世界中でWebページは少なくとも400億はあるだろうということです。つまりグーグルがカバーしているのは、あんなに頑張っていても、たかだか4分の1なんです。つまり、Webページを最も集めている最大の検索エンジンでさえ、全体の2〜3割。グーグルで検索すると、何でもすべて入っていると思っている人がいますが、それは大きな間違いです。
  それから、グーグルが集めているページと他の検索エンジンが集めているページは、必ずしも一致しません。それぞれの方式でページを集めているので、グーグルでは検索できないページでも、他の検索エンジンであれば出てくることがあります。
  だから、本気で“ものを調べる”のであれば、グーグルだけでなく他の検索エンジンも使って引き比べてみるといいですね。
――
そもそもWebページを集めるというのは具体的にどういう仕組みになっているのですか?
高野
 先ほども話しましたが、検索対象となるWebページは、クローラーというプログラムが集めています。それを大規模に上手くやっているのがグーグルだし、ノルウェーで作られた「AlltheWeb」なども独自のクローラーを誇っていました。集めたページのテキストを機械が読んで、どんな単語がどこに現われたかを記録する索引を作る。そうして初めて検索が可能になります。  全く同じ内容のページなのに別のアドレスだとか、アドレスはあるけど白紙のページだとか、そういうページはどんどん排除して、ユーザーにとって意味のあるページのみを残していく。そしてそれをグーグルは数十万台のサーバにため込んでいるといわれています。当初は、3万台のサーバを用意していると聞いて、私たちはビックリしたものですが(笑)
――
検索結果をランクづけして、より信用度の高いWebページが検索結果の上位にくるようにしたシステムが、グーグルを大きくしたということでしたが、具体的にはどういうことでしょうか?
高野
 アルタビスタがなぜ廃れたのか。アルタビスタは、Scooterというクローラーを開発してWebページを大量に集め、それを強力なサーバで高速に検索できるようにすることには成功しました。しかし、その検索結果を出す順番に工夫がなかった。集める数では抜きんでていたのですが、1ページ目に出てくるサイトが、「なんだよ、これ?」というサイトばかりがくるようになったのです。
  Webページがまだ少ない時には、信用のある機関や研究所などがページを作っていた訳ですから、そもそもある程度の信頼性が保証されていた。それが、どんどんサイトが増えたため、その分、検索結果に“ゴミ”が含まれるようになりました。グーグルが偉かったのは、その問題を解決しない限り検索エンジンの未来はないと見抜いたことです。もっとも、アルタビスタの惨状をみてそう思った人間は、私も含めてたくさんいましたが(笑)
  とにかく、どういう順番で検索結果を返すかを決めることに価値を見いだして、ページランクと呼ばれるページの重要度を測る新しい尺度を提案して画期的なシステムを作ったのです。まさに発想の転換でした。簡単に言いますと、Webページが、どれだけ他のWebページからリンクされているか、その数が多い順にランクづけするという方法です。リンクが張られているということを、他のサイトが“推薦”しているという風に考えるようにしたのです。その推薦度の度合いでランキングを決めた。
――
そのシステムが功を奏したのですね?
高野
 それまでのWebページの重要度評価では、タイトルに出ているキーワードには多くの点数を付けるとか、フォントが大きいキーワードの点数をあげようとか、ある意味、思いつきで場当たり的な方法が主流でした。それに比べて、グーグルのページランクはとてもシンプルで、かつコンピュータで高速処理しやすい尺度でした。これは凄いぞということになったんです。
1 3
  新書マップ参考テーマ

<< PAGE TOP
Copyright(C) Association Press. All Rights Reserved.
著作権及びリンクについて