情報検索における関連情報の構造的視覚化
西田研究室 中野 健一
1. はじめに
近年のインターネットの発展に伴い取得できる情報量が増加しており,莫大な情報の中から適切なページを検索することが困難になっている.多くのサーチエンジンを利用した検索結果(URL)は縦ならびに表示されることが多く,望ましいページの優先順位が低く評価される場合には,参照できるはずの情報が有効に利用されない場合がある.また,目的とする情報の取得も重要であるが,ユーザが情報検索の過程で刺激を受けて興味の湧いたことに関しての情報をあわせて取得できることが望ましい.本研究では検索された情報を視覚化し全体の構造を見せ,構造変化から受けたユーザの興味を引き出すような関連情報を取得することを目指す.
2. システム構成
システムの構造は,
- Webページの取得されたテキスト量により入力ベクトルを作るモジュール
- 生成された入力ベクトルを自己組織化マップ(Self-Organizing Map)により可視化するモジュール
に分けられる.自己組織化マップは多次元上に存在するベクトルの相互関係を保存したまま2次元に写像するという特徴を持っており,取得されたWebページ集合を可視化するのに適している.自己組織化マップ構築部に対し,ユーザーは表示されたWebのタイトルに対しクラスタ分けを行い,自分の欲しいクラスタのみを指定し,再び自己組織化を行う.この操作を繰り返すことにより,目的の情報とともに自分が興味を持った領域の情報も取得することが可能になると期待される.また,ユーザの入力に対してシステムの自己組織化マップがここで構造的変化を見せることにより,ユーザが検索当初に持っていた目的が変化し,興味を広げていくことが期待される.
3. 評価実験
提案したシステムをDos/Vマシン上にC++builderを用いて実装し,学生(4人)を被験者として、システムに対する評価実験を行った.今回の実験では既存の検索エンジンとしてgooを採用した.同じキーワードに対し検索エンジンのみで検索を先に行ってもらい,その後システムを用いて検索を行うという実験を行った.検索する際には,被験者には目的意識を持ってもらい,実験ではその目的意識の変化を検証し,また,キーワードに対する事前の知識量の影響による興味の変遷の違いを検証した.さらに,クラスタをユーザに作らせることは表示されたタイトルを集団化することである種強制していることに対応するため,クラスタ分けの効果も検討した.
4. 結論
本研究では検索された情報の構造を視覚化しその構造変化を通じてユーザの興味を引き出すような関連情報を取得する手法を提案した.
今後の課題として,全体的に時間を必要とするため入力ベクトル部は先に構成したため,実際の検索エンジンとの実験においてタイムラグが存在する.また自己組織化にも大きな時間がかかるため今後高速化に取り組む予定である.