脳ざらし紀行


2003-04-04

_ [ネット] のナゾ

oreniyayakoshiikotowoiuna の話題。つづき

との検索結果が微妙に違うという話。検索の語順により、結果が変わってくる。

適当に複数の単語を入力して検索ボタンを押した後、検索オプションをクリックする。すると、検索単語が「すべてのキーワードを含む」と「フレーズを含む」に振り分けられる。そこから、oreniyayakoshiikotowoiuna では Google の内部実装を推測している。

ちなみに、「フレーズで検索」というのは、入力した文字列に完全に一致するページを検索する。

_ [ネット] Googleの辞書にはサップという文字がある

僕も考えてみて以下の結論に達した。

普通に検索した場合と、検索オプションから検索した場合では結果が違う。 は検索オプションでキーワード:モーニング娘、フレーズ:紺野あさ美に分類されるが、この時の検索ボタンを押してみる と検索結果が違ってしまう。つまり、「検索オプションの単語の振り分け方」は「語順によって検索結果が違うこと」とは無関係

ただし、検索オプションの振り分け方にはつぎのような規則性がある。

  1. 句読点などを除去
  2. Google内部の日本語辞書に載っている単語ならキーワードに。それ以外はフレーズに分類。
  3. ただし、フレーズにすでに単語がある場合はキーワードに分類。
  4. 最初に戻る。

例えば、 では、サップがキーワードにミルコがフレーズに分類される。サップはGoogleの辞書に載っているが、ミルコは載っていないということらしい。またフレーズに入る単語は常にひとつ。

で、検索の語順により、結果が変わってくるのは

  1. 単語にマッチするページを検索。この時ページ毎のPageRankはすでに計算されていて静的に決まっている。
  2. 検索単語が複数の場合は、前の単語によりマッチするページのPageRankを少し水増し。
  3. 検索結果をソートして出力。

てなことをやっているのでしょう。たぶん。Googleで複数の単語を入力する時は、重要な単語を前に置いて検索しましょう。

■追記:そう大して変わらないけどね。

_ [国際] 彼らのテロリズム、我らのテロリズム

アフマドが1998年に行なった演説。ビン・ラディンとその存在が引き起こすであろう事態について、驚くほど正確に論じている。

お名前:
E-mail:
コメント:
本日のリンク元

最近のコメント

2003|01|02|03|04|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|04|05|
2011|04|
2012|03|07|
2013|01|02|07|
トップ «前の日記(2003-04-03) 最新 次の日記(2003-04-05)» 編集