logo.gif

つれづれなるままに

Googleで上位ヒットの謎

 「自分の文章がヒットするのは・・・」にも書きましたが、インターネットで検索をすると、自分の書いた文章がヒットしてしまうことがたまにあります。例えば、よく使うGoogleで検索した結果、結構上の方でヒットしてしまいます。
 2005年3月19日現在、次の言葉をGoogleで検索すると、d-infサイトが上位にヒットします。
スーパーアスピリン
http://www.google.co.jp/search?hl=ja&q=%E3%82%B9%E3%83%BC%E3%83%91%E3%83%BC%E3%82%A2%E3%82%B9%E3%83%94%E3%83%AA%E3%83%B3&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=
イレッサ
http://www.google.co.jp/search?hl=ja&q=%E3%82%A4%E3%83%AC%E3%83%83%E3%82%B5&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=
サリドマイド
http://www.google.co.jp/search?hl=ja&q=%E3%82%B5%E3%83%AA%E3%83%89%E3%83%9E%E3%82%A4%E3%83%89&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=
抗生物質 皮内反応(抗生物質 皮内反応 の検索結果 約 24,700 件中、一番上でヒットします
http://www.google.co.jp/search?hl=ja&q=%E6%8A%97%E7%94%9F%E7%89%A9%E8%B3%AA%E3%80%80%E7%9A%AE%E5%86%85%E5%8F%8D%E5%BF%9C&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=
患者 プライバシー
http://www.google.co.jp/search?hl=ja&q=%E6%82%A3%E8%80%85%E3%80%80%E3%83%97%E3%83%A9%E3%82%A4%E3%83%90%E3%82%B7%E3%83%BC&lr=
後発医薬品
http://www.google.co.jp/search?hl=ja&q=%E5%BE%8C%E7%99%BA%E5%8C%BB%E8%96%AC%E5%93%81&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=
ウインドウピリオド(ウインドウピリオド の検索結果 約 3,580 件中、一番上でヒットします
http://www.google.co.jp/search?hl=ja&q=%E3%82%A6%E3%82%A4%E3%83%B3%E3%83%89%E3%82%A6%E3%83%94%E3%83%AA%E3%82%AA%E3%83%89&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=
コンビニ 薬
http://www.google.co.jp/search?hl=ja&q=%E3%82%B3%E3%83%B3%E3%83%93%E3%83%8B%E3%80%80%E8%96%AC&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=
 ちなみにちょっと前までは、「スティーブンス・ジョンソン症候群」「薬学部 6年制」を検索しても上位にヒットしていましたが、現在ではd-infサイトは上位ではヒットしません。Googleによると、「インデックスは 4週間ごとに更新されます。Web ページのデータベースを更新するたびに、新しいサイトが追加され、いくつかのサイトは破棄され、サイトの順位が変更されます。当然のことながら、サイトの順位は他のサイトの順位変更の影響を受けます。特定のサイトの順位を上げるために検索結果を調整することは、だれにもできない仕組みになっています。Google の検索結果の表示順位は、PageRank アルゴリズムなどのいくつかの要因によって自動的に決定されます。」とのことです。検索結果もどんどんと変わっていくということです。
Google
 さてそもそもGoogleで検索したときの表示順位は、どうやって決まっているのだろうかという疑問が湧いてきます。私が自分の個人サイトをヒットさせて欲しくて、Googleに大金を払っているわけではありません。企業サイトならともかく、個人でそんなことをするわけないじゃないですか。かといって、Googleに登録して検索しやすくしているわけでもありません。そのキーワードは上に書いてある「PageRank」という概念にあるようです。
 Googleの中をいろいろのぞいてみると、こんなページがありました。
 ●Google:PageRank についての情報
 http://www.google.co.jp/webmasters/4.html
 Google の検索結果の表示順位は、PageRank アルゴリズムを含む、100 以上もある要因によって自動的に決定されます。詳細については、Google の人気の秘密をご参照ください。
 ということで、「Google の人気の秘密」をみてみると
 ●Google:Google の人気の秘密
 http://www.google.co.jp/why_use.html
 PageRankTM は、Webの膨大なリンク構造を用いて、その特性を生かします。ページAからページBへのリンクをページAによるページBへの支持投票とみなし、Googleはこの投票数によりそのページの重要性を判断します。しかしGoogleは単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていくのです。
 こうした分析によって高評価を得た重要なページには高いPageRankTM (ページ順位)が与えられ、検索結果内の順位も高くなります。PageRankTM はGoogleにおけるページの重要度を示す総合的な指標であり、各検索に影響されるものではありません。むしろ、PageRankTM は複雑なアルゴリズムにしたがったリンク構造の分析にもとづく、各Webページそのものの特性です。
 簡単に言うと、PageRankはGoogle特有の機能で、ページの重要度を示すそうで、我がd-inf.orgは、5/10つまり10点中5点だということです。それがいいのか悪いのかよくわからないので、他のサイトの点数を見てみると・・・
検索系では
yahoo.co.jpは、6/10
yahoo.comは、10/10
google.co.jpは、8/10
google.comは、10/10
新聞系では
朝日新聞は、7/10
毎日新聞は、7/10
読売新聞は、7/10
医薬品情報では
厚生労働省は、8/10
医薬品医療機器情報提供ホームページは、7/10
日本薬剤師会番は、6/10
日本病院薬剤師会は、5/10
おくすり110番は、5/10
 PageRankはどうやってわかるかというと、Googleツールバーをインストールするとわかります。http://toolbar.google.com/intl/ja/ Microsoft Internet Explorer version 5 以降(Microsoft Windows 95/98/ME/NT/2000/XP)にツールバーとしてつけられます。
Google Toolbar
 このことから、GoogleのPageRankという考えでは、「日本病院薬剤師会」や「おくすり110番」と肩を並べてしまうという大それたことになってしまうようです。ですから、検索すると、上位にヒットしてしまうという現象が起きているということらしいです。ちなみに、another side of "d-inf"は、新しいせいか、いまのところ0/10です、トホホ・・・
 いろいろな人が検索エンジンから来られているという状況も頷けますが、それだけにいい加減なことが書けないような状況になりつつあります。

(2005/03/19)

 つれづれなるままに next:30万アクセス

 

saty@d-inf.org

制作・著作: 佐藤賛治

(http://d-inf.org/iroiro/)