ページの先頭です。
[記事本文へショートカット]


感動から始まる

全ての創造は

ふるぱ-しゃる

不定期更新 ふるぱ!


ご案内

ここは個別記事ページです。

サイトのトップへ戻る

Web拍手

一言連絡などにもどうぞ。

WEB拍手

サイト内検索


お気に入りサイト

英数字・記号 特殊

--

イラスト投稿

ネタ成分多めです。

--

このサイトのバナー

お持ちかえりバナー200×40

リンクフリーです。

--

同人サイトのバナー

お持ちかえりバナー200×40

更新情報載せてます。

--

DL販売始めました

やおよろ堂|digiket やおよろ堂|メロンブックス やおよろ堂|dlsite.com やおよろ堂|とらのあな やおよろ堂|DMM同人

好評発売中です!


2008/01/25(金)

カテゴリ『WEB』

検索技術「Clustering 2.0」が凄い。

先日、ITPROで見つけた記事を詳しく読んでみたので紹介。
アメリカのVivisimo社が開発し、同社のサイト(Clusty.com)に
実装し公開している検索エンジンがかなり便利そうです。

細かい説明は読んでも退屈だし判りづらいと思うので、
先ずは百聞は一見にしかず。上記検索エンジンで
ハヤテのごとく!と入力して検索した結果を見て下さい。

Clusty検索結果「ハヤテのごとく!」
画像クリックでこのサイトへ飛べます。

(このサイトは日本語にも対応しています!)
画面左側の「clusters」というタブの中にジャンル分けされた
情報が自動分類項目として並んでいます。
自動分類に気に入った項目が無ければ「remix」というボタンを
押す事で改めて自動分類が行われます。

さて、これの何が凄いのか?
それは一言で言うと、検索能力のアップ・想像力の補完だと思います。

この検索エンジンの立ち位置は
Yahoo検索とGoogle検索の中間的存在、だと秋月は考えます。

では説明の為に、Yahoo検索とGoogleの違いについて私見を述べます。
(若干長いので続きは記事の折り返しで書きます。)


・Yahoo検索
非常に有名なディレクトリ型検索エンジンです。
WEBサイトのリンクを大量に集め、分野別に分類してあり、
リンクをたどる事で意図する情報に行き着きやすくしてあります。
扱う情報を人間が精査する、という一手間がかけてある事により、
メリットとして「検索といってもどこから手をつけていいか判らない」
という初心者にとって使い勝手がいい、操作が易しいというのがあります。
デメリットとしては、探し出したい情報の分母が(絶対量)が
後述するロボット型検索エンジンに劣る、という事です。

・Google検索
こちらは非常に有名なロボット型検索エンジンです。
(検索エンジンの仕様は人間の手による、という揚げ足取りはおいておくとして)
情報の分類は人間が行いませんし、集めた情報のカテゴライズはされません。
使用にはコツが必要であり、求める情報の検索結果をあらかじめ
想像して複数ワードなどで絞り込んで検索しなければ
目的の情報を見つけ出す事が難しい、という特性があります。

この「目的の情報にアタリをつけてから探す」という行為が
検索の精度とスピードを上げる最大のキモであるといえます。

そしてその性質上、二つの検索エンジンでの探し方は異なります。

例えばYahooならトップディレクトリから次々とリンクをクリックして
情報を探していくのは探す内容が簡単なら楽(というより人気の情報、
や旬の情報ほどクリックされ易くなっているので目的の情報を探す、
というよりはテレビを見て共通の話題を持つ、に近いかもしれません。)、
ただしコアな情報、きめウチで特定のサイトの情報を探すのは難しい。
yahooでJavascriptのソースを探してカナダや中国のサイトに
迷い込むことはまずないと思います。

次にGoogleは基本的にトップページは白紙。
全ては検索する人間の想像力にかかっています。
また欲しい情報が見つかりさえすれば、ヒットするページは
カナダでも中国でも構わない、と思える方には向いていると思います。


で、話はそろそろClusty検索エンジンに戻るのですが、
ClustyはGoogleのように多くの情報を提供し、
かつ検索された結果に対してYahooのようにカテゴリ分けした
情報をも提供してくれます。
これだと、Googleのように初めからある程度のアタリをつけなくても
シンプルな単語で検索してからカテゴリを見て、
検索結果を絞り込んでいく事が可能です。
またYahooのように初めから情報の絶対量が絞られる分けでもありません。

いやー、これは面白いです。
さっそくウチのブラウザの検索結果をClustyの検索エンジンに
引き渡して結果をブラウザに返せるようにいじくろうと思います。


コメント

コメントの投稿 検索技術「Clustering 2.0」が凄い。への最初のコメントをどうぞ。





太字 打ち消し線 イタリック アンダーライン

※ コメントにURLを含む場合は承認後に記事に反映されます。

JavaScriptが有効な場合ここにプレビューが表示されます。

上記内容でよろしければ投稿して下さい。→


現在スタイルシートが読み込まれていない状態です。
スタイルシートはサイトのデザインを定義しています。