検索力

ちょうど一年くらい前からいろいろとメモを取り始めた。
説明会に行ったときに記録しておいた方がいいと思ったことが増えてきたから。
近頃は本や雑誌を読みながらメモを取ることもある。家にネット環境がないので
メモっておいて明日学校で調べようとかいう感じ。紙媒体では検索するのが
大変なので少しずつblogにピックアップしていこうかと思う。


以前どこかのblogで「テクノラティとかnamaanとかいろいろblog検索が
あるけど、blogを排除した検索をしたい」とかいうエントリーがあった。
3月5日に参加した百式とyahooの第二回検索会議でそのやり方は知ったので
そのイベントの内容と合わせて今更ながら紹介してみよう。
手元にあるメモから頭の中でイベント全体が再構築できて非常に楽しい。


学生編とビジネス編と検索エンジニア編みたいなのに分かれていて、学生編に参加した。
中身に触れる前にさっそくここで知った「blogを排除した検索」の方法を紹介。
yahooとかgoogleで調べたい語の後で「 -trackback」をつけるだけ。
「-」というのはそういう言葉が含まれるものを排除するという意味。
blogの定義にもよるが基本的にtrackback機能はどれでもついているはずなので
調べたいものの中からトラックバックという文字列が含まれるものを排除できるので
blog以外のサイトの中から検索できる。当たり前だけどなるほどと思った。


このイベントの趣旨としては、これからは検索をするスキルがあるかないかで
大きく差がついてくるので、yahoo社員自ら検索のコツを教えますというようなもの。
興味深かったのをいくつかピックアップしてみる。まずyahoo限定だが、

サイトの説明は「。」で終わる。登録サイトで「。」を探せば合計がわかる

というもの。これは知らなかった。今日は496,682だった。
一日300から400登録しているそうだ。今はどうかわからないけど。


独特なフレーズを探すというのもいい
「以下甲という」で検索すると契約書の中身に引っかかるようだ。 
検索の基本は出てくる結果を想定してキーワードを選ぶことらしい。
たとえば「そばの出前の値段」を知りたいとき
よくありがちなのは

そば 出前 値段

のように自分の質問を切り刻んでしまう。これではうまくいかない。
自分が期待している検索結果というのはそばの出前の料金表だから
出てくると思われる料金表に必ず含まれるものをキーワードとする。

かけ もり たぬき 円

もしそばの出前の料金表が存在するなら、メニューの中に「かけ」とか
「もり」とかそういう言葉はかなり高い確率で入ってくる。
そして重要なのは「円」。料金表なんだから値段が書いてないわけがない。
ここで「メニュー」という言葉をキーワードにしなかったのには理由がある。
メニューではなくお品書きかもしれないし、おしながきかもしれない。
検索というのはノイズを減らしつつ、シグナルを減らさないことが重要なので
そういうあいまいさが残るものについてはキーワードから外すのが望ましい。


もう一つ例を挙げると「東京都の区の人口」が知りたいときどうするか。

東京 区別 人口

とやってはいけないわけで

人口 杉並区 大田区

とすると良いそうだ。ファイルタイプとかドメインの指定もできる。

始末書 filetype:msword

こんな感じがいいらしい。


最後に橋本氏が言ってたTips
「(会社名) 長年のお世話」で検索して
ライバル会社の不幸をほくそ笑み
「(会社名) 明日から開始」で自分の会社もがんばろうと
やる気を出すとか言ってたような言ってなかったような。


もっと詳しくこのイベントについて知りたい人は以下のリンク先を参照して欲しい。
検索会議2005:YAHOO!をいじりまわすのが今年のトレンドに?
http://www.ringolab.com/note/daiya/archives/003119.html
検索会議2005
http://web.sfc.keio.ac.jp/~t04520st/blog/archives/2005/03/000003.php
検索会議2005のログ
http://www.ne.senshu-u.ac.jp/~n130151/archives/2005/03/post_32.html


あと、昨日のエントリーで4つほど2chのスレを紹介したが関連するのが大量にあった。
○○だけど、なんか質問ある?リンク集
http://kakebosi.blog36.fc2.com/blog-entry-11.html
というか「ゾフィーだけど」ってなんだよ。いきなりゾフィーか