説明

情報処理装置、プログラム及び情報検索システム

【課題】ユーザの能力(リテラシー)に応じた適切なユーザーインターフェース情報(UI)を検索結果の提示と共に提供する。
【解決手段】情報処理装置は、検索履歴情報から、ユーザの識別情報、検索クエリー情報、検索結果URL情報、閲覧URL情報を識別情報に対応付けて抽出し、ユーザログ情報とする手段と、ユーザログ情報に含まれる検索クエリー情報の構成、及び検索結果URL情報と前記閲覧URL情報との対応関係の少なくとも一つを含む判定基準に従ってユーザの能力判定値を付与するリテラシー分析手段と、能力判定値に応じたユーザーインターフェース情報を提示するUI提示処理手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報検索サービスを提供する情報処理装置、情報処理装置に搭載されるプログラム、及び情報検索システムに関する。
【背景技術】
【0002】
多くのユーザ(利用者)は、関心のある事象に関する情報を入手する場合、例えばブラウザ機能を備えるPC(Personal computer)等の端末装置からインターネット等に接続
し、検索サービスを提供する各種検索サイトでその情報の特徴を表すキーワードを入力し、クエリー(照会)を行う。検索サイトの検索エンジン等は、入力された検索クエリーに沿って各種Webサイトの検索を行い、検索結果をブラウザに表示する。ユーザはブラウザに表示されたURL(Uniform Resource Locator)を辿り、各種Webサイトに開示され
た情報を入手する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−181186号公報
【特許文献2】特開2008−40636号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
各種検索サイトからユーザ装置に提示される出力情報は、基本的に入力されたキーワードによる情報検索結果だけで決定される。出力情報である検索結果は、ユーザの端末装置に検索結果画面として表示されるが、この検索結果画面については、例えば、検索サービスを利用するユーザの情報を評価・識別する能力(リテラシー)等は考慮されていなかった。
【0005】
例えば、表示された検索結果を自身が利用しやすいようにブラウザ機能のオプション設定を調整できるユーザにとっては、検索結果画面の構成や表示形態が煩わしく感じるケースがある。一方、同じ検索結果画面が表示される場合であっても、検索に不慣れな初心者にとっては、不親切に感じるケースがあり、検索サービスの満足度は十分なものではなかった。
【0006】
開示の技術の課題は、検索サービスを利用するユーザの能力(リテラシー)に応じた適切なユーザーインターフェース(UI)情報を検索結果の提示と共に提供することを目的とする。
【課題を解決するための手段】
【0007】
開示の技術の一側面は、次の情報処理装置の構成によって例示される。すなわち、本情報処理装置は、情報処理装置に接続される記憶装置に格納された検索履歴情報から、検索要求を行ったユーザの識別情報と、検索要求で受け付けた検索クエリー情報と、検索クエリー情報に応じて検索された検索結果URL情報と、検索結果URL情報から閲覧要求が行われた閲覧URL情報とをユーザの識別情報に対応付けて抽出し、ユーザログ情報として記憶装置に格納する手段と、ユーザログ情報に含まれる検索クエリー情報の構成、及び検索結果URL情報と閲覧URL情報との対応関係の少なくとも一つを含む判定基準に従ってユーザの能力判定値を付与するリテラシー分析手段と、能力判定値に応じたユーザーインターフェース情報を提示するUI提示処理手段とを備える。
【0008】
その結果、ユーザの能力(リテラシー)に応じて適切なユーザーインターフェース情報が提示できる。
【発明の効果】
【0009】
本情報処理装置によれば、検索サービスを利用するユーザのリテラシーに応じた適切なユーザーインターフェース(UI)情報を検索結果の提示と共に提供できる。
【図面の簡単な説明】
【0010】
【図1】図1は、情報検索システムの一例を示す図である。
【図2】図2は、情報処理装置のハードウェア構成を例示する図である。
【図3】図3は、検索クエリーログを例示する図である。
【図4】図4は、クリックURLログを例示する図である。
【図5】図5は、検索結果表示ログを例示する図である。
【図6】図6は、ユーザログテーブルを例示する図である。
【図7】図7は、検索リテラシー算出テーブルを例示する図である。
【図8】図8は、情報検索システムのシーケンスを例示する図である。
【図9】図9は、検索リテラシーの分析処理の説明図である。
【図10】図10は、検索リテラシーの分析処理の説明図である。
【図11】図11は、情報検索システムのフローチャートを例示する図である。
【図12】図12は、情報検索システムのフローチャートを例示する図である。
【図13】図13は、情報検索システムのフローチャートを例示する図である。
【図14】図14は、UI提示処理のフローチャートを例示する図である。
【図15】図15は、提示されたUIの例示である。
【図16】図16は、提示されたUIの例示である。
【発明を実施するための形態】
【0011】
以下、図面を参照して、一実施形態に係る情報検索システムを説明する。以下の実施形態の構成は例示であり、本情報検索システムは実施形態の構成には限定されない。
【実施例】
【0012】
以下、図1から図16の図面に基づいて、実施例に係る情報検索システムを説明する。〔システム構成〕
図1に、情報検索システムの一例を示す。図1に例示する情報検索システム10は、例えば、個々のユーザ装置20,20aに検索サービスを提供するシステムである。
【0013】
図1に例示される情報検索システム10は、ユーザ装置20,20a、検索サーバ装置30、記憶装置40、解析サーバ装置100、記憶装置200を含む。ユーザ装置20は、ネットワークNを介して検索サーバ装置30に接続し、ユーザ装置20aは、ネットワークNを介して検索サーバ装置30に接続する。検索サーバ装置30は記憶装置40と接続する。解析サーバ装置100は、ネットワークNを介して検索サーバ装置30に接続する。解析サーバ装置100は記憶装置200と接続する。尚、検索サーバ装置30には、ネットワークNを介して複数のユーザ装置20,20aが接続され得る。また、検索サーバ装置30は、ネットワークNを介して図示しない複数の情報処理装置に接続する。複数の情報処理装置としては、例えば、SNSやソーシャルメディア等のように、Web上に構築されたネットワークを利用して各種情報を発信する情報処理装置を例示できる。
【0014】
検索サーバ装置30は記憶装置40を含んでもよい。また、解析サーバ装置100は記憶装置200を含んでもよい。検索サーバ装置30、解析サーバ装置100、記憶装置40、記憶装置200は、例えば、インターネット上のコンピュータ群であるクラウドの一部を構成するものであってもよい。ネットワークNは、インターネット等の公衆ネットワ
ーク、携帯電話網等の無線ネットワーク、LAN(Local Area Network)、WAN(Wide
Area Network)等の内部ネットワークを含む。
【0015】
記憶装置200は、検索ログDB210,ユーザログ220、検索リテラシーDB230を含む。検索ログDB210には、検索クエリーログ211、クリックURLログ212、検索結果表示ログ213が含まれる。検索ログDB210に含まれる各ログは、後述するように、検索ログ取得部110の処理により、検索履歴DB410から抽出された履歴データである。検索クエリーログ211には、本情報検索システム10が受け付けた、検索要求を行ったユーザの検索クエリー情報が格納される。クリックURLログ212には、ユーザに提示した検索結果URL情報から閲覧要求が生じた閲覧URL情報が格納される。検索結果表示ログ213には、検索クエリー情報に基づいてネットワーク検索を行った結果の検索結果URL情報が格納される。
【0016】
ユーザログDB220には、ユーザログテーブル221が含まれる。ユーザログテーブル221は、後述するように、検索ログ処理部120の処理により、検索クエリーログ211、クリックURLログ212、検索結果表示ログ213が結合されたものである。
【0017】
検索リテラシーDB230には、検索リテラシー算出テーブル231が含まれる。検索リテラシー算出テーブル231は、後述するように、検索リテラシー分析部130により付与された、採点情報(指標値)が格納される。採点情報は、検索クエリーに含まれるキーワードに対して付与される。検索リテラシー算出テーブル231は、検索要求を行った全てのユーザに対するキーワード毎のレコードを有する。さらに検索リテラシー算出テーブル231には、後述するように、検索リテラシー判定部140によって算出されたユーザ毎の、検索操作全般に対する能力判定値が付加される。検索操作全般に対する能力判定値は、例えば、各ユーザの全キーワードに対する採点情報(指標値)の平均値として算出される。
【0018】
ユーザ装置20,20aは、パーソナルコンピュータ(PC、Personal Computer)、
タブレットPC、PDA(Personal Digital Assistant)のような専用または汎用のコンピュータ、あるいは、コンピュータを搭載した電子機器を使用して実現可能である。また、ユーザ装置20,20aは、スマートフォン(多機能携帯電話)、携帯電話、カーナビゲーション装置のような専用または汎用のコンピュータ、あるいは、コンピュータを搭載した電子機器を使用して実現可能である。
【0019】
検索サーバ装置30,解析サーバ装置100は、PC等の汎用のコンピュータまたはサーバマシン等の専用のコンピュータを使用して実現可能である。記憶装置40及び200は、各種プログラムおよび各種データを格納する記憶媒体を備えた記憶装置である。記憶装置40及び200は、外部記憶装置とも呼ばれる。記憶装置40及び200としては、例えば、ソリッドステートドライブ装置、ハードディスクドライブ装置、CD(Compact Disc)ドライブ装置、DVD(Digital Versatile Disk)ドライブ装置、+R/+RWドライブ装置、HD DVD(High-Definition Digital Versatile Disk)ドライブ装置、または、BD(Blu-ray Disk)ドライブ装置がある。また、記憶装置40及び200は、リムーバブルメディア、即ち可搬記録媒体を含むことができる。
【0020】
図2に、情報処理装置のハードウェア構成を例示する。図2に例示する情報処理装置300は、コンピュータである。図1に例示する、ユーザ装置20,20a、検索サーバ装置30,解析サーバ装置100は、例えば、図2に例示する情報処理装置300によって実現される。
【0021】
情報処理装置300は、接続バスによって相互に接続されたCPU(Central Processi
ng Unit)301、メモリ302、記憶部303、入力部304、出力部305、通信部
306を有する。情報処理装置300は、CPU301が記憶部303に記憶されたプログラムをメモリ302の作業領域に実行可能に展開し、プログラムの実行を通じて周辺機器の制御を行う。これにより、情報処理装置300は、所定の目的に合致した機能を実現することができる。メモリ302および記憶部303は、コンピュータである情報処理装置300が読み取り可能な記録媒体である。
【0022】
CPU301は、情報処理装置300全体の制御を行う中央処理演算装置である。CPU301は、記憶部303に格納されたプログラムに従って処理を行う。メモリ302は、CPU301がプログラムやデータをキャッシュしたり、作業領域を展開したりする記憶媒体である。メモリ302は、例えば、RAM(Random Access Memory)やROM(Read Only Memory)を含む。
【0023】
記憶部303は、各種のプログラム及び各種のデータを読み書き自在に記録媒体に格納する。記憶部303は、例えば、EPROM(Erasable Programmable ROM)、ソリッド
ステートドライブ装置、ハードディスクドライブ(HDD、Hard Disk Drive)装置等で
ある。また、記憶部303としては、例えば、CDドライブ装置、DVDドライブ装置、+R/+RWドライブ装置、HD DVDドライブ装置、BDドライブ装置等が例示できる。記録媒体としては、例えば、不揮発性半導体メモリ(フラッシュメモリ)を含むシリコンディスク、ハードディスク、CD、DVD、+R/+RW、HD DVD、または、BD等がある。CDとしては、CD−R(Recordable)、CD−RW(Rewritable)、CD−ROMがある。DVDとしては、DVD−R、DVD−RAM(Random Access Memory)がある。BDとしては、BD−R、BD−RE(Rewritable)、BD−ROM等がある。また、記憶部303は、リムーバブルメディア等の可搬記録媒体を含むことができる。リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、あるいは、CDやDVDのようなディスク記録媒体が例示できる。
【0024】
入力部304は、ユーザ等からの操作指示等を受け付ける。入力部304は、入力ボタン、キーボード、ポインティングデバイス、ワイヤレスリモコン、マイクロフォン、カメラ等の入力デバイスである。入力部304から入力された情報は、接続バスを介してCPU301に通知される。
【0025】
出力部305は、CPU301で処理されるデータやメモリ302に記憶されるデータを出力する。出力部305は、CRT(Cathode Ray Tube)ディスプレイ、LCD(Liquid Crystal Display)、PDP(Plasma Display Panel)、EL(Electroluminescence
)パネル、プリンタ、スピーカ等の出力デバイスである。通信部306は、ネットワークNとのインターフェースである。
【0026】
情報処理装置300は、記憶部303に、オペレーティングシステム(Operating System :OS)、各種プログラム、各種テーブル等を記憶している。OSは、ソフトウェアとハードウェアとの仲介、メモリ空間の管理、ファイル管理、プロセスやタスクの管理を行うソフトウェアである。OSは、通信インターフェースを含む。通信インターフェースは、通信部306を介して接続される外部装置等とデータのやり取りを行うプログラムである。外部装置等には、例えば、他の情報処理装置、記憶装置が含まれる。
【0027】
ユーザ装置20,20aを実現する情報処理装置300は、CPU301が記憶部303に記憶されている各種プログラムや各種データをメモリ302に読み出して実行することにより、ブラウザ機能を実現する。ブラウザ機能を有するユーザ装置20,20aは、例えば、ネットワークNを介して接続された検索サーバ装置30に対し、入力された検索キーワードに基づく検索クエリー(照会)を行う。また、ブラウザ機能を有するユーザ装
置20,20aは、例えば、ネットワークNを介して接続された検索サーバ装置30から検索結果を受け取り、出力部305に出力表示する。また、ブラウザ機能を有するユーザ装置20,20aは、例えば、出力部305に出力表示されたURL(Uniform Resource Locator)等を辿り、ネットワークNを介して接続された各種Webサイトの情報処理装置
が配信する各種コンテンツ情報や記事情報を閲覧することができる。
【0028】
検索サーバ装置30を実現する情報処理装置300は、CPU301が記憶部303に記憶されている各種プログラムや各種データをメモリ302に読み出して実行することにより、受け付けた検索クエリーに沿った情報検索機能を実現する。情報検索機能として例えば、種々の公知な検索エンジン等が例示できる。情報検索機能を有する検索サーバ装置30は、例えば、検索クエリーに含まれるキーワード等に沿って、インターネットNを介して接続された各種Webサイトに登録された配信情報や各種コンテンツ情報の検索を実行する。また、例えば、検索サーバ装置30は、検索結果に対してクリック操作(閲覧要求)された各種WebサイトのURL情報等を含んだ、一連の検索処理履歴を検索履歴DB410(Data Base: データベース)として記憶装置40に格納する。検索履歴DB4
10は、検索履歴情報の一例である。記憶装置40は、検索履歴DB410を含む。
【0029】
解析サーバ装置100を実現する情報処理装置300は、CPU301が記憶部303に記憶されている各種プログラムや各種データをメモリ302に読み出して実行することにより、検索ログ取得部110、検索ログ処理部120、検索リテラシー分析部130、検索リテラシー判定部140、UI提示処理部150としての機能を実現する。
【0030】
図1に戻り、解析サーバ装置100は、検索ログ取得部110、検索ログ処理部120、検索リテラシー分析部130、検索リテラシー判定部140、UI提示処理部150を含む。各部のうち、いずれかが、他のサーバ装置に含まれてもよい。例えば、検索ログ取得部110を含むサーバ装置と、検索ログ処理部120を含むサーバ装置と、検索リテラシー分析部130を含むサーバ装置と、検索リテラシー判定部140を含むサーバ装置と、UI提示処理部150を含むサーバ装置とが、ネットワーク等を介して接続されることにより、解析サーバ装置100として機能してもよい。解析サーバ装置100は、複数のサーバ装置に機能を分散し、各処理部が実現されることで、負荷が軽減される。
【0031】
検索ログ取得部110は、解析サーバ装置100が接続されたネットワークNを介して記憶装置40に格納された検索履歴の取得を行う。検索履歴の取得は、例えば所定の周期で定期的に実行される。所定周期として、時間単位、日単位、週単位、月単位等が例示できる。検索履歴の取得間隔は、情報検索システムが要求される運用精度、システムの規模、データベースが構築される外部記憶装置の容量等によって適正なものが選択できる。
【0032】
検索ログ取得部110は、検索履歴DB410に含まれるユーザID、日時、検索クエリー、セッションID等を抽出し、検索クエリーログ211として検索ログDB210に格納する。また、検索ログ取得部110は、検索履歴DB410に含まれるユーザID、日時、検索結果から閲覧要求が行われた閲覧URL、セッションID等を抽出し、クリックURLログ212として検索ログDB210に格納する。さらに、検索ログ取得部110は、検索履歴DB410に含まれるユーザID、日時、検索結果として得られた検索結果URL、セッションID等を抽出し、検索結果表示ログ213として検索ログDB210に格納する。
【0033】
検索ログ処理部120は、検索クエリーログ211,クリックURLログ212,検索結果表示ログ213のファイル結合を行う。そして、検索ログ処理部120は、結合した結果検索ログ情報(ユーザログ情報)をユーザログテーブル221としてユーザログDB220に格納する。検索クエリーログ211、クリックURLログ212、検索結果表示
ログ213は、それぞれ複数のログファイルを含み、各ログファイルはセッションIDを有する。検索ログ処理部120は、同一のユーザIDを有する検索クエリーログ211、クリックURLログ212、検索結果表示ログ213から、含まれるセッションIDを結合キーとして、同一のセッションIDを有する各ログファイルを結合する。検索ログ情報には、セッションIDを除く、結合された各ログファイルの情報が含まれる。
【0034】
検索リテラシー分析部130は、ユーザログDB220に格納されたユーザログテーブル211を取得し、入力された検索クエリー毎に採点処理を実行する。検索リテラシー分析部130の採点処理は、検索クエリーに含まれる検索キーワードに対して実行される。検索リテラシー分析部130は、採点処理の結果を当検索キーワードに対する指標値として付与する。検索リテラシー分析部130は、採点処理が行われた検索キーワードと指標値とをユーザIDに対応付けて検索クエリー算出テーブル231に格納する。検索キーワードに付与された指標値は、ユーザの検索リテラシーを算出するための指標値である。検索リテラシー分析部130は、検索クエリー算出テーブル231を検索リテラシーDB230に格納する。検索リテラシー算出テーブル231は、ユーザID情報、キーワード情報、採点情報(指標値)を含む。採点処理については後述する。尚、本実施例では、この指標値を検索リテラシーとも呼ぶ。検索リテラシーは、キーワード毎、あるいは検索クエリー毎に判定されるユーザの能力ということができる。
【0035】
検索リテラシー判定部140は、検索リテラシー算出テーブル231から各検索キーワードに付与された指標値を取得し、ユーザ毎の全検索クエリーに対する平均値を算出する。検索リテラシー判定部140は、ユーザ毎の検索クエリー平均値を、検索操作全般に対するユーザ毎の能力判定値として、検索リテラシー算出テーブル231に付加し、検索リテラシーDB230に再び格納する。能力判定値は、情報検索操作を行うユーザの能力(リテラシー)を判別する値である。本実施例では、能力判定値から判定される能力をリテラシーとも呼ぶ。
【0036】
UI提示処理部150は、検索リテラシーDB230に格納された検索リテラシー算出テーブル231からユーザ毎に算出された能力判定値を取得し、能力判定値に応じたユーザーインターフェース(UI)情報を検索結果画面としてユーザ装置20,20aに出力する。UI提示処理については後述する。
【0037】
記憶装置200は、検索ログDB210、ユーザログDB220、検索リテラシーDB230を含む。検索ログDB210、ユーザログDB220、検索リテラシーDB230は、それぞれ、別々の記憶装置に含まれてもよい。
【0038】
図3に検索クエリーログを例示する。図3に例示する検索クエリーログ211は、本情報検索システム10の検索サービスを利用するユーザ毎に、ユニークに対応付けた識別情報であるユーザIDを含むレコードを有している。各レコードは、ユーザIDに対応付けた日時、検索クエリー、セッションIDの各フィールドを備える。日時フィールドには、ネットワークNを介して情報検索システム10がユーザ装置20,20aから検索要求を受け付けた日時情報が格納される。検索クエリーフィールドには、ネットワークNを介して情報検索システム10がユーザ装置20,20aから受け付けた検索クエリー情報が格納される。検索クエリー情報は、ユーザ装置20等が検索要求時に検索サーバ装置30に送信した入力文字列を含む。また、セッションIDフィールドには、検索クエリーに応じたセッションIDが格納される。尚、図例では、日時フィールドには、“yyyy/mm/dd hh:mm”の表現形式で日時情報が格納されるが、図例の表現形式には限定されない。以下、図4〜6に例示する、日時フィールドの表現形式についても同様である。
【0039】
後述するユーザログテーブルの結合処理の説明のため、図5に例示する、検索結果表示
ログを説明する。検索結果表示ログは、検索要求に沿って検索されたネットワークN上に接続する各種Webサイトの情報が格納される。検索結果表示ログに格納される検索結果URL情報は検索要求を行ったユーザに出力される。図5に例示する検索結果表示ログ213は、本情報検索システム10の検索サービスを利用するユーザ毎に、ユニークに対応付けた識別情報であるユーザIDを含むレコードを有している。各レコードは、ユーザIDに対応付けた日時、検索結果URL、セッションIDの各フィールドを備える。日時フィールドには、ネットワークNを介して情報検索システム10がユーザ装置20,20aから検索要求を受け付けた日時情報が格納される。検索結果URLフィールドには、受け付けた検索クエリーに応じて取得した各種WebサイトのURL情報(検索結果URL情報)が格納される。検索結果URLフィールドに格納されるURL情報は、検索結果画面に表示する検索結果URL情報としてユーザ装置20,20aに出力される。また、セッションIDフィールドには、検索結果として各種WebサイトのURL情報を取得したセッションIDが格納される。尚、日時フィールドにおける日時情報の表現形式は図例に限定されない。
【0040】
検索要求を行ったユーザは、本情報検索システム10から出力された検索結果URL情報に沿って、閲覧要求を行う。ユーザのクリック操作によって閲覧要求されたURL(閲覧URL)は、クリックURLログに格納される。図4に、クリックURLログを例示する。図4に例示するクリックURLログ212は、本情報検索システム10の検索サービスを利用するユーザ毎に、ユニークに対応付けた識別情報であるユーザIDを含むレコードを有している。各レコードは、ユーザIDに対応付けた日時、閲覧URL、セッションIDの各フィールドを備える。日時フィールドには、ネットワークNを介して情報検索システム10がユーザ装置20,20aから閲覧要求を受け付けた日時情報が格納される。閲覧URLフィールドには、ユーザ装置20,20aに出力した検索結果画面からユーザがクリック操作による閲覧要求を行った閲覧対象のURL情報(閲覧URL情報)が格納される。また、セッションIDフィールドには、クリック操作による閲覧要求を行ったURL毎のセッションIDが格納される。尚、日時フィールドにおける日時情報の表現形式は図例に限定されない。
【0041】
図6に、ユーザログテーブルを例示する。図6に例示するユーザログテーブルは、図3に例示した検索クエリーログ211、図4に例示したクリックURLログ212、図5に例示した検索結果表示ログ213を、セッションIDを結合キーとして、同一のセッションIDを有する各ログファイルを結合処理したテーブルである。結合処理は、検索ログ処理部120により行われる。図6に例示するユーザログテーブル221は、本情報検索システム10の検索サービスを利用するユーザ毎に、ユニークに対応付けた識別情報であるユーザIDを含むレコードを有している。各レコードは、ユーザIDに対応付けた日時、検索クエリー、検索結果URL、閲覧URLの各フィールドを備える。検索クエリーフィールドには、ネットワークNを介して情報検索システム10がユーザ装置20,20aから受け付けた検索クエリー情報が格納される。検索結果URLフィールドには、検索結果表示ログ213の結果表示内容フィールドに格納された各種WebサイトのURL情報が格納される。閲覧URLフィールドには、ユーザ装置20,20aに出力した検索結果画面からユーザがクリック操作による閲覧要求を行ったURL情報が格納される。ユーザログテーブル221は、結合処理の結果として得られたユーザログ情報である。尚、検索クエリー情報が格納されたレコードの日時フィールドには検索要求を受け付けた日時情報が格納され、閲覧URL情報が格納されたレコードの日時フィールドには閲覧要求を受け付けた日時情報が格納される。
【0042】
尚、閲覧URLフィールドに格納される閲覧URL情報は、直前の行中に格納された検索結果URLフィールドの検索結果URL情報に対するものである。例えば、図例では、“アジアカップの日本のサブメンバー”の検索クエリーに対し、検索結果である検索結果
URLフィールドには、0件を示す“−”が格納されている。従って、同一セッションにおいて閲覧URLフィールドに格納する情報は無いため、“アジアカップの日本のサブメンバー”の検索クエリーが格納された行の直後には、閲覧URL情報を有する行が配行されていない。
【0043】
一方、“あdじあkっぷ”や“アジアカップ”の検索クエリーに対しては、それぞれ、複数のURL(図例では、“AD_URL1”〜“WEB_URL3”)が検索され、検索結果URLフィールドに格納されている。しかし、“あdじあkっぷ”の検索クエリーに対して提示された検索結果URL情報に対しては、同一セッションIDに対する閲覧URLが不検出のため、“あdじあkっぷ”の検索クエリーが格納された直後の行には、閲覧URL情報を有する閲覧URLフィールドは存在しない。つまり、“あdじあkっぷ”の検索クエリーに対して提示された検索結果URL情報に対しては、ユーザのクリック操作による閲覧要求が行われていない。
【0044】
“アジアカップ”の検索クエリーに対しては、同一セッションIDに対する閲覧URLが検出されているため、“アジアカップ”の検索クエリーが格納された直後の行には、閲覧URL情報を格納した閲覧URLフィールドを有する行が結合処理(配行)されている。そして、日時フィールドに格納された日時情報からも明らかなように、“アジアカップ”の検索クエリーが格納された直後の行には、閲覧URL情報が格納された閲覧URLフィールドを有する行が、連続して配行されている。連続して配行された各行の閲覧URLフィールドには、検索結果画面に表示された検索結果URLから、ユーザがクリック操作によって辿った閲覧URLが順に並んでいる。図例では、時間経過順に、“AD_URL
1”→“AD_URL2”→“WEB_URL1”となる閲覧URLを、閲覧URLフィールドに格納した行が連続する。
【0045】
このように、結合処理が施されたユーザログテーブル221には、ユーザIDに対応付けた日時情報、検索クエリー情報、検索クエリーに沿って検索収集された各種Webサイトの検索結果URL情報、及び各種WebサイトのURL情報からユーザがクリック操作による閲覧要求を行った閲覧URL情報が含まれる。
【0046】
図7に、検索リテラシー算出テーブルを例示する。検索リテラシー算出テーブルには、検索リテラシー分析部130で付与されたキーワード毎の指標値と、検索リテラシー判定部140で処理された全キーワードに対するユーザ毎の能力判定値が格納される。キーワード毎に付与される指標値は、例えば、検索要求を行ったユーザの得意分野、不得意分野等が反映されたものであり、知識の多寡によって偏りが生ずる。一方、全キーワードに対するユーザ毎の能力判定値は、検索要求を行ったユーザの得意分野、不得意分野等に偏らない、検索操作全般のリテラシーを判定するものである。採点処理については後述する。
【0047】
図7に例示する検索リテラシー算出テーブル231は、本情報検索システム10の検索サービスを利用するユーザ毎に、ユニークに対応付けた識別情報であるユーザIDを含むレコードを有している。各レコードは、ユーザIDに対応付けた、キーワード、指標値を格納するフィールドを備える。キーワードフィールドには、検索クエリー情報に含まれるキーワード情報が格納される。キーワードフィールドに格納されるキーワード情報としては、例えば、検索要求時に受け付けた検索クエリーに含まれる全ての単語名詞、検索クエリーの初頭に入力された単語名詞等が例示できる。指標値フィールドには、キーワード情報に対応する検索リテラシーを判断するための採点情報が格納される。検索リテラシー算出テーブル231では、一意に特定されたキーワード情報に対する指標値が格納される。
図7に例示する検索リテラシー算出テーブル231において、(1)は、採点処理の結果、検索リテラシー判定部140により、検索操作に係るリテラシーが低いと判別されるユーザのレコード例である。一方、(2)は、採点処理の結果、検索リテラシー判定部1
40により、検索操作に係るリテラシーが高いと判別されるユーザのレコード例である。図例の(1)では、一意に特定されたキーワード情報としてキーワードフィールドに格納された“アジアカップ”には、採点処理の結果、指標値として付与された“35”が指標値フィールドに格納されている。また、キーワードフィールドに格納された“C言語”には、採点処理の結果、指標値として付与された“50”が対応する指標値フィールドに格納されている。“C言語”の検索要求では、付与された指標値は相対的に高く、“アジアカップ”では、相対的に指標値は低い。つまり、(1)に例示するユーザ(ユーザID:001)は、“C言語”が属する分野では標準的な検索リテラシーを備えるが、“アジアカップ”が属する分野では検索リテラシーは低いと判断できる。また、(2)では、“アジアカップ”に対応する指標値は“60”であり、“C言語”に対応する指標値は“50”である。(2)に例示するユーザ(ユーザID:002)は、キーワード情報の属する分野によらず標準的以上の検索リテラシーを備えると判断できる。このように、検索リテラシー算出テーブル231には、一意に特定されるキーワード情報毎に、対応する指標値が格納されるため、検索要求を行うユーザの、キーワード情報が属する分野での能力の高低が判断できる。検索リテラシー分析部130で処理された指標値(採点情報)が格納された検索リテラシー算出テーブル231は、検索リテラシーを判定する情報がキーワード毎に格納されることとなる。
【0048】
また、検索リテラシー算出テーブル231の1つの行(図例では、最終行)のキーワードフィールドには、本ユーザの検索リテラシー判定を表す“[検索操作全般(平均)]”との文言が格納される。そして、“[検索操作全般(平均)]”との文言が格納される行の指標値フィールドには、検索リテラシー判定部140で処理された本ユーザの能力判定値が格納される。図例では、キーワード情報毎に付与された指標値の平均値が、能力判定値として格納されている。尚、検索リテラシー算出テーブル231の1つの行のキーワードフィールドに格納される、検索リテラシー判定を表す文言は、図例の表現形式に限定されない。本ユーザの検索リテラシー判定を表す表現であればよい。例えば、“「00000」”,“XXXXX”,“ユーザID:Total”,“総判定”,“★★★★”等の、本
ユーザの検索リテラシー判定を表すテキスト文字や記号等の任意の表現が可能である。
【0049】
また、“[検索操作全般(平均)]”との文言が格納される行の指標値フィールドに格納される能力判定値の表現形式は、図例に限定されない。例えば、各キーワード情報に付与された指標値の平均値をさらに閾値と比較し、“A”,“B”,“C”等のランク付けを行ってもよい。本ユーザの検索リテラシー判定の結果を示す指標であればよい。このようなランク分けは閾値判定により処理できる。例えば、2段階の閾値を設け、平均された能力判定値が60以上であれば“A”ランク、40以下であれば“C”ランク、40を超え、且つ60未満の範囲であれば“B”ランクとするランク付けが例示できる。尚、図例では、説明のために(1)、(2)の2つのテーブルを用いたが、ユーザ毎のレコードの纏まりを単位ブロックとし、複数のユーザブロックが連続して一つのテーブルを構成するようにしてもよい。前者では、テーブル毎に検索操作全般に対する能力判定値が格納されるのに対し、後者では、ユーザブロック毎に検索操作全般に対する能力判定値を格納できる。
〔処理シーケンス〕
次に、本情報検索システム10における解析サーバ装置100の処理シーケンスについて説明する。図8に、解析サーバ装置100の全体的な処理シーケンス図を例示する。
【0050】
図8において、解析サーバ100は、所定の周期間隔で検索履歴DB410に格納された検索履歴情報の取得を行う。所定の周期間隔として、1時間毎、12時間毎、1日毎、1週間毎、1ヶ月毎等の期間間隔が例示できる。解析サーバ装置100の検索ログ取得部110は、検索履歴DB410に格納された検索履歴情報からユーザIDに対応付けた検索クエリー情報、日時情報、セッションID情報を抽出し、抽出した結果を検索クエリー
ログ211として検索ログDB210に格納する。また、検索ログ取得部110は、検索履歴DB410に格納された検索履歴情報からユーザIDに対応付けた閲覧URL情報、日時情報、セッションID情報を抽出し、抽出した結果をクリックURLログ212として検索ログDB210に格納する。さらに、検索ログ取得部110は、検索履歴DB410に格納された検索履歴情報からユーザIDに対応付けた検索結果である各種WebサイトのURL情報(検索結果URL情報)、日時情報、セッションID情報を抽出し、抽出した結果を検索結果表示ログ213として検索ログDB210に格納する。尚、検索結果である各種WebサイトのURL情報(検索結果URL情報)は、ユーザ装置20,20aが備えるブラウザを介して検索結果画面としてユーザに提示される。
【0051】
解析サーバ装置100の検索ログ処理部120は、検索ログDB210に格納された、検索履歴情報の各抽出結果に対して結合処理を実行する。検索ログ処理部120で実行される結合処理は、ユーザ毎に行われ、各抽出結果に含まれるセッションIDを結合キーとして実行される。検索ログ処理部120は、結合処理の結果をユーザログDB220のユーザログテーブル221に格納する。ユーザログテーブル221のユーザログ情報は、ユーザIDに対応付けた日時情報、検索クエリー情報、検索クエリーに沿って検索収集された各種WebサイトのURL情報(検索結果URL情報)、及び各種WebサイトのURL情報からユーザがクリック操作による閲覧要求を行った閲覧URL情報を含む。
【0052】
解析サーバ装置100の検索リテラシー分析部130は、ユーザログテーブル221のユーザログ情報に対して検索リテラシーを判断するための指標値の付与処理を実行する。検索リテラシー分析部130で実行される指標値の付与処理は、検索クエリーに含まれるキーワード情報に応じた採点処理である。検索リテラシー分析部130で実行される採点処理は、キーワード毎に実行される。ユーザIDに対応付けた一意に特定されるキーワード情報、及びキーワード毎に付与された指標値を、検索リテラシー算出テーブル231に格納する。検索リテラシー算出テーブル231に格納された情報は、検索リテラシー判定部140により、ユーザの検索リテラシーを算出する情報として処理される。
【0053】
解析サーバ装置100の検索リテラシー判定部140は、検索リテラシー算出テーブル231に格納された、キーワード毎に付与された指標値に基づいてユーザの検索操作に対する能力判定値を算出する。検索リテラシー判定部140で算出された能力判定値は、本ユーザの検索リテラシー判定を表す文言と共に再び検索リテラシー算出テーブル231に格納される。検索リテラシー判定部140で実行される能力判定値の算出は、例えば、キーワード毎に付与された指標値の平均処理である。検索リテラシー判定部140は、全てのキーワードに付与された指標値について加算平均を行うことにより、ユーザ毎の能力判定値を算出する。
【0054】
解析サーバ装置100のUI提示処理部150は、検索リテラシーDB230に格納された、検索リテラシー算出テーブル231に付加された能力判定値に基づいてユーザの検索操作に対するリテラシーを判断し、リテラシーに応じたUI提示処理を実行する。UI提示処理部150で決定されたユーザーインターフェース情報は、例えば、検索結果情報と共にユーザ装置20,20aに出力される。例えば解析サーバ装置100により、リテラシーが低いと判断されたユーザ装置20には、検索コマンドを含めたクエリーの提示や、検索オプションの豆知識等が含まれる検索結果画面を表示させることが可能となる。また、例えば解析サーバ装置100により、リテラシーが高いと判断されたユーザ装置20aには、検索結果表示に際する説明文の割愛やマウスポインタによるURL情報の説明表示を行う等で、表示スペースを圧縮し、より多くの検索結果情報を一画面に表示させることが可能となる。
〔検索リテラシーの分析処理〕
図9,10に検索リテラシーの分析処理の説明図を例示する。図9,10は、ユーザロ
グDB220に格納されるユーザログテーブル221の一例である。図9は、検索リテラシーの分析処理でリテラシーが低いと判断される場合の説明図である。一方、図10は、検索リテラシーの分析処理でリテラシーが高いと判断される場合の説明図である。検索リテラシーの分析処理は、検索リテラシー分析部130によって実行される。尚、ユーザ毎のリテラシーの決定は、検索リテラシー判定部140で実行される。
【0055】
検索リテラシー分析部130で処理された結果は、検索キーワード毎の指標値として検索キーワードと共に検索リテラシー算出テーブル231に格納される。検索リテラシー判定部140は、検索リテラシー算出テーブル231のユーザ毎に、全ての検索キーワードに対する指標値の加算平均を行う。全ての検索キーワードに対する指標値の加算平均の結果は、能力判定値として再び検索リテラシー算出テーブルに格納される。尚、リテラシー判定は、例えば、能力判定値に対する閾値,所定値との比較により行うことが可能である。このような閾値,所定値は、例えばシステムパラメータとして情報処理装置300のメモリ302に保持することができる。また、入力部304を介して入力された設定値としてもよい。本情報検索システム10が要求される運用精度、システムの規模、データベースが構築される外部記憶装置の容量等によって適正なものが選択できる。
【0056】
図9に例示するユーザログのレコードは、例えば、ユーザ装置20を介して検索クエリーを行ったリテラシーの低いユーザ(ユーザID:001)によるレコードである。図例において、日時フィールドに格納された日時情報から、“2011/1/31 17:00”〜“2011/1/31 18:00”の間に3件の検索クエリーを入力していることがわかる。入力された検索クエリーは順に、“アジアカップの日本のサブメンバー”,“あdじあkっぷ”,“アジアカップ”である。最初に入力した検索クエリーに対しては、検索結果URL情報が格納される検索結果URLフィールドに0件を示す“−”が格納され、他の検索クエリーに対しては複数のURLが格納されている。次に入力した検索クエリーの検索結果に対しては、閲覧URL情報を閲覧URLフィールドに含む行が直後に配行されていない。最後に入力した検索クエリーに対しては、閲覧URL情報を閲覧URLフィールドに含む行が直後に配行されている。閲覧URLフィールドに閲覧URL情報を含む行は、“AD_URL1”
→“AD_URL2”→“WEB_URL1”の順に連続して配行されている。
【0057】
図10に例示するユーザログのレコードは、例えば、ユーザ装置20aを介して検索クエリーを行ったリテラシーの高いユーザ(ユーザID:002)によるレコードである。図例において、日時フィールドに格納された日時情報から、“2011/2/1 17:00”〜“2011/2/1 18:00”の間に3件の検索クエリーを入力していることがわかる。入力された検索クエリーは順に、“アジアカップ ●川 代理”,“アジアカップ ●川 控えメンバー”,“アジアカップ site:wwww.tv-XXXX.co.jp”である。最初に入力した検索クエリーに
対しては、検索結果URL情報が格納される検索結果URLフィールドに5件のURLが格納されている。最初に入力した検索クエリーに対しては、直後に、閲覧URL情報として“WEB_URL2”が閲覧URLフィールドに格納された行が配行されている。次に
入力した検索クエリーに対しては、検索結果URLフィールドに5件のURLが格納されている。そして、直後に、閲覧URL情報として“WEB_URL1”が閲覧URLフィ
ールドに格納された行が配行されている。最後に入力した検索クエリーに対しては、検索結果URLフィールドに5件のURLが格納されている。そして、直後に、閲覧URL情報として“AD_URL2”、“WEB_URL3”が閲覧URLフィールドに格納された行が連続して配行されている。
【0058】
本情報検索システム10の検索リテラシーの分析処理は、ユーザログDB220に格納されたユーザログテーブル221の、ユーザ毎のレコードに含まれる各種情報に対して処理が行われる。検索リテラシーの分析処理は、ユーザログレコードの各フィールドに格納された情報に対し、次の照合条件との合致度を分析する。
(1)検索結果が0件となる検索クエリー入力
(2)検索エンジンの補助機能(例えば、形態素解析機能)を必要とする検索クエリー入力
(3)検索クエリーの工夫(AND,OR,NOT,「site:」等)
(4)検索結果に対するクリック操作の有無
(5)検索結果に対するURL選別の有無
【0059】
(1)検索結果が0件となる検索クエリー入力
本情報検索システム10の検索リテラシー分析処理では、ユーザログテーブル221の検索結果URLフィールドに格納された検索結果の検出件数から入力された検索クエリーの妥当性を分析する。特に、検索結果として検出件数が0件であることを示す“−”である場合には、所望の情報を得るための検索クエリーが入力されていないと分析できる。本情報検索システム10では、ユーザログテーブル221の検索結果URLフィールドに格納された検索結果が0件であることを示す“−”である場合には、指標値を付与する採点処理として減点処理を行う。
【0060】
例えば、図9に例示するユーザ(ユーザID:001)のレコードでは、検索結果URLフィールドに“−”が格納されていることから、検索結果が「0件」となる検索クエリー“アジアカップの日本のサブメンバー”が入力されていると分析する。このケースでは、検索クエリーに、“アジアカップ”以外の情報の特徴を表す複数のキーワードが助詞で結合された状態で含まれているため、例えば、ユーザ(ユーザID:001)の情報検索操作入力の知識が不十分であると分析できる。
【0061】
(2)検索エンジンの補助機能(例えば、形態素解析)を必要とする検索クエリー入力
本情報検索システム10の検索リテラシー分析処理では、ユーザログテーブル221の検索クエリーフィールドに格納された検索クエリーについて、形態素解析等の検索エンジンの補助機能を必要とするものであるかを分析する。検索クエリーとして、自然言語で記述された検索文が入力された場合、複数のキーワードが検索文に含まれるため、特徴となるキーワードの特定が不十分であると分析できる。例えば、図9に例示するユーザ(ユーザID:001)のレコードでは、“アジアカップの日本のサブメンバー”との検索文が、検索エンジンの補助機能を必要とする検索クエリーと分析する。本情報検索システム10では、検索クエリーについて、形態素解析等の検索エンジンの補助機能を必要とするものである場合には、指標値を付与する採点処理として減点処理を行う。
【0062】
(3)検索クエリーの工夫(AND,OR,NOT,「site:」等)
また、検索リテラシー分析処理では、ユーザログテーブル221の検索クエリーフィールドに格納された検索クエリーについて、検索式(AND,OR,NOT等)を用いた工夫や、特定のWebサイトの中で限定した検索を行う「site:」等の、コマンドを用いた
工夫が施されているか分析する。検索式やコマンド等の検索オプション設定を用いた検索クエリーが入力された場合、検索式やコマンド等を扱うための検索知識が十分であると分析できる。本情報検索システム10では、検索クエリーについて、検索式やコマンド等の検索オプション設定を検知し、指標値を付与する採点処理として加点処理を行う。
【0063】
例えば、図9に例示するユーザ(ユーザID:001)のレコードでは、検索クエリーフィールドに格納された各検索クエリーには、検索式やコマンド等の検索オプション設定が検知できないため、何れも工夫がなされていないと分析する。一方、図10に例示するユーザ(ユーザID:002)のレコードでは、“アジアカップ ●川 代理”等のように複数のキーワードをスペースで連接させて検索クエリーを作成しているため、論理演算子ANDを用いた工夫が施されていると分析する。また、検索クエリーの“アジアカップ
site:wwww.tv-XXXX.co.jp”には、「site:」コマンドを用いた工夫が施されていると分
析する。
【0064】
(4)検索結果に対するクリック操作の有無
検索リテラシー分析処理では、ユーザログテーブル221の検索結果URLフィールドに格納された検索結果URL情報と、閲覧URLフィールドに格納された閲覧URL情報から、入力された検索クエリーの適切さを分析する。ユーザログテーブル221のレコードでは、検索結果URLフィールドに格納された検索結果URL情報は、検索クエリーに応じた各種Webサイトの検索結果であり、閲覧URLフィールドに格納された閲覧URL情報は、関心のある情報を所望するユーザの判別によって選択された検索結果である。このため、検索結果URLフィールドに格納された検索結果に対し、閲覧URLフィールドに格納された閲覧URL情報を照らし合すことにより、ユーザにとって適切な検索クエリー入力であったかを分析する。ユーザログテーブル221のレコードにおいて、検索結果URLフィールドに検索結果URL情報が格納された行の直後に、閲覧URLフィールドに閲覧URL情報が格納された行が配行された場合、ユーザにとって適切な検索クエリー入力が行われたと分析できる。本情報検索システム10では、検索結果に対するクリック操作の有無を検知し、クリック操作が行われていなかった場合には、指標値を付与する採点処理として減点処理を行う。
【0065】
例えば、図9に例示するユーザ(ユーザID:001)のレコードにおいて、“あdじあkっぷ”が格納された検索結果URLフィールドには5件の検索結果が格納されている。しかし、直後には、閲覧URLフィールドに閲覧URL情報を格納した行が続いて配行されていないことから、“あdじあkっぷ”はユーザにとって適切な検索クエリー入力とは言えないと分析する。
【0066】
一方、検索結果URLフィールドに5件の検索結果が格納された“アジアカップ”では、直後に閲覧URLフィールドに閲覧URL情報を格納した行が続いて配行されているため、“アジアカップ”はユーザにとって適切な検索クエリー入力と分析する。
【0067】
(5)検索結果に対するURL選別の有無
また、検索リテラシー分析処理では、ユーザログテーブル221の検索結果URLフィールドに格納された検索結果URL情報と、閲覧URLフィールドに格納された閲覧URL情報から、検索結果に対するユーザのURL選別の有無を分析する。検索結果URLフィールドに格納された検索結果URL情報は、検索クエリーに応じて検索された結果である各種WebサイトURLであり、この検索結果ULR情報はユーザ装置20,20aに出力される。一方、閲覧URLフィールドに格納された閲覧URL情報は、ユーザ装置20,20aに出力された検索結果URL情報の中からユーザの判別によって選択されたURL情報である。このため、検索結果URLフィールドに格納された検索結果URL情報に対し、閲覧URLフィールドに格納された閲覧URL情報を照らし合すことにより、ユーザによって情報の判別が行われたかを分析する。検索結果に対するURL選別の有無は、検索結果URL情報の並び順と閲覧URL情報の並び順との一致度で判定される。本情報検索システム10では、検索結果URL情報の並び順と、閲覧URL情報の並び順を比較し、一致度が高い場合には、指標値を付与する採点処理として減点処理を行う。
【0068】
例えば、図9に例示するユーザ(ユーザID:001)のレコードにおいて、検索クエリーとして“アジアカップ”が格納された検索結果URLフィールドには5件の検索結果が格納されている。そして、直後には、閲覧URLフィールドに閲覧URL情報を格納した行が続いて配行されている。さらに、閲覧URLフィールドに閲覧URL情報を格納した行は、“AD_URL1”→“AD_URL2”→“WEB_URL1”の順に連続して
いる。各行での閲覧URLフィールドに格納された閲覧URL情報と、検索クエリーとして“アジアカップ”が格納された検索結果URLフィールドの検索結果URL情報と照ら
し合すことにより、ユーザ(ユーザID:001)によってクリック操作された閲覧URL情報は、提示された検索結果URL順に連続していると分析する。このケースでは、ユーザによるURL選別は行われていないと分析する。
【0069】
一方、図10に例示するユーザ(ユーザID:002)のレコードでは、検索クエリーとして“アジアカップ site:wwww.tv-XXXX.co.jp”が格納された検索結果URLフィー
ルドには、“AD_URL1”,“AD_URL2”,“WEB_URL1”,“WEB_URL2”,“WEB_URL3”の5件の検索結果が順に格納されている。そして、直後
には、閲覧URLフィールドに“AD_URL2”を格納した行と、“WEB_URL3”を格納した行とが連続して配行されている。各行での閲覧URLフィールドに格納された閲覧URL情報と、検索クエリーとして“アジアカップ site:wwww.tv-XXXX.co.jp”が
格納された検索結果URLフィールドの検索結果URL情報と照らし合すことにより、ユーザ(ユーザID:002)によってクリックされた閲覧URL情報は、ユーザによるURL選別が行われていると分析する。
【0070】
本情報検索システム10の検索リテラシーの分析処理では、分析結果をユーザに対するリテラシー判別のための指標とするため、上述した照合条件毎に採点処理を行う。検索リテラシーの分析処理は、ユーザログDB220に格納された検索クエリーに含まれるキーワード毎に採点処理を行う。検索リテラシーの分析処理で実行される採点処理として、例えば、予め基本点(例えば、50点)を付与し、上述した照合条件に合致するか否かで加点及び減点を行う採点処理が可能である。
【0071】
図9に例示するユーザ(ユーザID:001)のレコードを採点処理の例に取れば、検索結果が0件となる検索クエリーが入力されていることから“X”点の減点処理が行われる。また、検索クエリーとして“あdじあkっぷ”が格納された検索結果URLフィールドには、検索結果が得られているにも関らず、検索結果に応じた閲覧要求であるクリック操作が行われていないことから、同様に“X”点の減点処理が行われる。また、検索クエリーとして“アジアカップ”の検索結果を、最上位から順番にクリック操作していることから、同様に“X”点の減点処理が行われる。従って、図9に例示するユーザ(ユーザID:001)のレコードでは、例えば50点の基本点に対し、“X×減点処理数”が採点処理として減点されることとなる。例えば、“X”点を“3”点とした場合、図9に例示するユーザのリテラシー指標値は“41”点となり、基本点50点を下回る結果となる。
【0072】
同様に、図10に例示するユーザ(ユーザID:002)のレコードを採点処理の例とする。図10に例示するユーザ(ユーザID:002)のレコードでは、検索クエリーに検索式やコマンドが使用されていることから、“Y”点の加点処理が行われる。尚、検索式の複雑さ、例えば、論理演算子(AND,NOT,OR等)の個数に応じて配点してもよい。また、各検索クエリーの検索結果に応じてクリック操作が行われていることから、“Y”点の加点処理が行われる。さらに、各検索クエリーの検索結果に応じたクリック操作では、URL情報の取捨選択による選別が行われているから、“Y”点の加点処理が行われる。従って、図10に例示するユーザ(ユーザID:002)のレコードでは、例えば50点の基本点に対し、“Y×加点処理数”が採点処理として加点されることとなる。例えば、“Y”点を“4”点とした場合、図10に例示するユーザのリテラシー指標値は“62”点となり、基本点50点を上回る結果となる。
【0073】
このように、本情報検索システム10の検索リテラシーの分析処理では、上述した照合条件ごとに採点処理を行うことにより、ユーザログテーブル221に格納された検索クエリーに含まれるキーワード毎に検索リテラシーを判定するための指標値を得ることができる。そして、ユーザ毎に全てのキーワードに対する指標値を加算平均することにより、検索操作全般に対する能力判定値を得ることができる。全てのキーワードに対して指標値の
加算平均を行うことにより、検索要求を行ったユーザの得意分野、不得意分野に偏らない、検索操作全般に対するリテラシーを判定することができる。尚、キーワード毎に得られた指標値の、ユーザ毎の平均化処理は、検索リテラシー判定部140によって実行される。
【0074】
尚、上述の採点例では、減点処理として“X”点、加点処理として“Y”点を配点するが、共通する配点(“X”=“Y”)による採点処理としても良い。また、例えば、“4”点、“3”点、“2”点、“1”点等のように段階的に差分を有する複数の配点基準を設け、照合条件に応じて配点するとしても良い。
【0075】
さらに、上述した採点処理例では、基本点を付与した上で照合条件毎に加点及び減点を行うが、加点は行わずに照合条件に合致しなければ減点する減点方式としてもよい。また、逆に、減点は行わずに照合条件に合致した場合に加点する加点方式としてもよい。
【0076】
〔処理フロー〕
図11〜図13に本情報検索システム10の解析サーバ装置100で実行される処理のフローチャートを例示する。図11〜図13に例示するフローチャートは、検索ログ取得部110、検索ログ処理部120、検索リテラシー分析部130、検索リテラシー判定部140で実行される処理である。
【0077】
図11に例示するフローチャートにおいて、検索ログ取得部110は、定期処理により、検索履歴DB410に格納された検索履歴の取得を行い、検索クエリーログ211、クリックURLログ212、検索結果表示ログ213を抽出し、検索ログDB210に格納する(S1)。そして、検索ログ処理部120は、検索ログDB210に格納された検索クエリーログ211、クリックURLログ212、検索結果表示ログ213からユーザログテーブル221を生成し、ユーザログDB220に格納する(S2〜S3)。ユーザログテーブル221は、検索ログ取得部110で抽出された各ログファイルのセッションIDを結合キーとして、各ログファイルを結合処理したものである。
【0078】
次に、検索リテラシー分析部130は、ユーザログテーブル221の各種情報に基づいて、検索クエリーに含まれる検索キーワードへの分析処理を行う。以下の処理では、リテラシー分析処理の結果が格納される検索リテラシー算出テーブル231は、図7に例示するように、ユーザID毎に作成されるとして説明を行う。
【0079】
検索リテラシー分析部130は、ユーザログDB220に格納されたユーザログテーブル211のユーザIDに対する検索リテラシー算出テーブル231が、検索リテラシーDB230に存在するかを判断する(S4)。検索リテラシー分析部130は、分析処理の対象であるユーザIDを検索キーとして、検索リテラシーDB230の検索を行い、分析処理の対象であるユーザIDを含む検索リテラシー算出テーブル231の有無を判断する。
【0080】
検索リテラシー分析部130は、検索リテラシーDB230に分析処理の対象となるユーザIDの検索リテラシー算出テーブル231が存在しない場合(S4“NO”)には、分析処理の対象となるユーザIDの検索リテラシー算出テーブル231の作成を行い、検索リテラシーDB230に格納する(S6)。一方、分析処理の対象となるユーザIDの検索リテラシー算出テーブル231が存在する場合(S4“YES”)には、格納された検索リテラシー算出テーブル231の読み込みを行う(S5)。検索キーワードに対して付与される指標値を、ユーザの能力判定値に反映させるためである。尚、以下の説明では、検索キーワードとして、検索要求時に受け付けた検索クエリーの最初の単語名詞を対象とし、分析処理の一例の説明を行う。
【0081】
ステップS4〜S6の処理は、図11及び図7に限定されるわけではない。例えば、ユーザ毎のレコードの纏まりを単位ブロックとし、複数のユーザブロックが連続して一つのテーブルを構成する場合には、ステップS4では、分析処理の対象であるユーザIDを検索キーとして、検索リテラシー算出テーブル231の検索を行えばよい。そして、検索リテラシー算出テーブル231に対応する単位ブロックが存在しない場合(S4“NO”)には、分析処理の対象となるユーザIDの単位ブロックを作成し、検索リテラシー算出テーブル231に格納すればよい(S6)。そして、検索リテラシー算出テーブル231に対応する単位ブロックが存在する場合には、対応するユーザIDの単位ブロックの読み込みを行うとしてもよい(S4“YES”〜S5)。
【0082】
図12に例示するフローチャートにおいて、検索リテラシー分析部130は、検索リテラシー算出テーブルに、ユーザログテーブル211の検索クエリーに応じた検索キーワード行が含まれているかを判断する(S101)。検索リテラシー分析部130は、検索リテラシー算出テーブル231のキーワードフィールドに格納された検索キーワード情報の検索を行い、該当する検索キーワードが存在するかを判断する。
【0083】
検索リテラシー分析部130は、検索リテラシー算出テーブル231のキーワードフィールドに、該当する検索キーワードが存在しない場合(S101“NO”)には、当検索キーワードに対応する行(検索リテラシー算出行、と呼ぶ)を作成し、キーワードフィールドに当検索キーワードを格納する(S103)。一方、検索リテラシー算出テーブル231のキーワードフィールドに、該当する検索キーワードが存在する場合(S101“YES”)には、対応するキーワード情報(キーワード、指標値)の読み込みを行う(S102)。尚、検索リテラシー分析部130は、ステップS102、S103において、指標値の算出のための基本点(例えば、“50”点)を該当する検索キーワードに付与する。また、以下のステップで処理される加点処理及び減点処理は、ステップS102、3で新たに付与した基本点に対して行われる。尚、ステップS102で読み込まれたキーワード情報(キーワード、指標値)は、例えば、情報処理装置300のメモリ302等の作業領域に保存される。また、ステップS102,S103で付与された基本点も同様に情報処理装置300のメモリ302等の作業領域に保存される。
【0084】
図12に例示するフローチャートでは、検索リテラシー分析部130は、先ず、検索クエリーの工夫を判断する(S104)。検索リテラシー分析部130は、ユーザログテーブル221の検索クエリーフィールドに格納された検索クエリーについて論理演算子(AND,OR,NOT等)の有無、特定のWebサイトの中で限定した検索を行う「site:
」等のコマンドの有無を判断する。検索リテラシー分析部130は、検索クエリーについて論理演算子やコマンド等が検知できない場合(S104“NO”)には、対応する検索キーワードへの採点処理は行わない。検索リテラシー分析部130は、該当する検索キーワードに付与された指標値(基本点:“50”点)の更新は行わない(S106)。
【0085】
一方、検索リテラシー分析部130は、検索クエリーついて検索演算子式やコマンド等が検知できる場合(S104“YES”)には、“Y”点の加点処理を行い(S105)、ステップS107に移行する。尚、図例では、“Y”点として“3”点が配点されている。
【0086】
図13のステップS107において、検索リテラシー分析部130は、入力された検索クエリーの妥当性を判断する。検索リテラシー分析部130は、ユーザログテーブル221の検索結果URLフィールドに格納された検索結果であるURL情報の有無を判断する。検索リテラシー分析部130は、ユーザログテーブル221の検索結果URLフィールドにURL情報が存在する場合(S107“NO”)には、対応する検索キーワードへの
採点処理は行わず、該当する検索キーワードの指標値の更新は行わない(S109)。
【0087】
一方、検索リテラシー分析部130は、ユーザログテーブル221の検索結果URLフィールドにURL情報が存在しない場合(S107“YES”)には、検索結果が0件となる検索クエリーが入力されたと判断し、“X”点の減点処理を行い(S108)、ステップS110に移行する。尚、図例では、“X”点として“3”点が配点されている。
【0088】
ステップS110において、検索リテラシー分析部130は、入力された検索クエリーについて形態素解析を必要とする検索クエリーであるかを判断する。検索リテラシー分析部130は、ユーザログテーブル221の検索クエリーフィールドに格納された検索クエリーについて、例えば、自然言語で記述された検索文であるかを判断する。また、形態素解析を必要としない場合として、例えば、形態素解析を必要としないキーワードや検索式,コマンドによるキーワードの連続した並び等が例示できる。
【0089】
検索リテラシー分析部130は、検索クエリーフィールドに、形態素解析を必要としない検索クエリーが格納されている場合(S110“NO”)には、採点処理は行わず、該当する検索キーワードの指標値の更新は行わない(S112)。一方、検索リテラシー分析部130は、検索クエリーフィールドに、形態素解析を必要とする検索クエリーが格納されている場合(S110“YES”)には、“X”点(図例では“3”点)の減点処理を行い(S111)、ステップS113に移行する。
【0090】
ステップS113において、検索リテラシー分析部130は、入力された検索クエリーについて、検索結果をクリックする適切な検索クエリーであったかを判断する。検索リテラシー分析部130は、ユーザログテーブル221のレコードにおいて、検索結果URLフィールドにURL情報が格納された行の直後に、閲覧URLフィールドにURL情報が格納された行が配行されているかを判断する。URL情報が検索結果URLフィールドに格納された直後の行に、閲覧URLフィールドとして閲覧URL情報が格納されている場合は、少なくとも検索入力を行ったユーザにとって、検索結果を辿る有意なURL情報が得られていると判断できる。つまり、検索結果URL情報は、ユーザにとってクリック操作を行うに値するものであり、適切な検索クエリー入力が行われたと判断できる。
【0091】
検索リテラシー分析部130は、入力された検索クエリーについて、検索結果に対するクリック操作があった場合(S113“NO”)には、採点処理は行わず、該当する検索キーワードの指標値の更新は行わない(S115)。一方、検索リテラシー分析部130は、入力された検索クエリーについて、検索結果に対するクリック操作がない場合(S113“YES”)には、“X”点(図例では“3”点)の減点処理を行い(S114)、ステップS116に移行する。
【0092】
ステップS116において、検索リテラシー分析部130は、検索結果に対するURL選別の有無を判断する。検索リテラシー分析部130は、ユーザログテーブル221のレコードにおいて、検索結果URLフィールドに格納された検索結果URL情報と、直後以降の行の閲覧URLフィールドに格納された閲覧URL情報とから、検索結果に対するユーザのURL選別の有無を判断する。例えば、閲覧URLフィールドに格納されたURLが検索結果URLフィールドに格納された検索結果であり、かつ、閲覧URLフィールドに格納されたURLが検索結果URLフィールドに格納されたURL順に連続行に並ぶ場合には、ユーザによる情報の判別(URL選別)は行われていないと判断できる。検索結果URL情報と閲覧URL情報の並び順に対する合致の度合が高いためである。また、例えば、閲覧URLフィールドに格納されたURLが検索結果URLフィールドに格納された検索結果であり、かつ、検索結果URLフィールドに格納された複数のURLの中から任意の順序で連続行に並ぶ場合には、合致の度合は低く、ユーザによる情報の判別(UR
L選別)が行われていると判断できる。
【0093】
検索リテラシー分析部130は、検索結果に対するURL選別が行われている場合(S116“NO”)には、採点処理は行わず、該当する検索キーワードの指標値の更新は行わない(S118)。一方、検索リテラシー分析部130は、検索結果に対するURL選別が行われていない場合(S116“YES”)には、“X”点(図例では“3”点)の減点処理を行い(S117)、ステップS119に移行する。
【0094】
ステップS119では、検索リテラシー分析部130は、ステップS101〜S118で採点処理を行った検索キーワードが新規であるかを判断する。検索リテラシー分析部130は、検索キーワードが新規である場合(S119“YES”)には、基本点に加点処理または減点処理が施された採点情報を指標値として指標値フィールドに格納する。一方、検索キーワードが新規でない場合(S119“NO”)には、ステップS5で読み出した指標値と、ステップS102で付与された基本点に加点処理または減点処理が施された指標値との平均を算出(S120)し、採点情報が反映された指標値として再び指標値フィールドに格納する。ステップS120では、既存の指標値と新たに処理された指標値との平均をとるため、例えば、同じ検索キーワードを有する、短期的な複数の検索要求に対する指標値変動を抑えることができる。このため、検索キーワード毎に付与される指標値は安定する。検索リテラシー判定部140は、短期的な指標値変動を抑えた安定した指標値でユーザの検索リテラシーを判定できることとなる。
【0095】
検索リテラシー分析部130は、ユーザログテーブル211に未処理の検索キーワードがなくなるまでステップS101〜S120の処理を繰り返す。尚、検索キーワードとして、検索要求時に受け付けた検索クエリーの最初の単語名詞を対象とし、分析処理の説明を行ったが、複数の単語名詞が検索クエリーに含まれる場合には全ての単語名詞についてステップS101〜S120の処理を繰り返す。検索リテラシー分析部130は、ユーザログテーブル211に未処理の検索キーワードがなくなると、ステップS7に移行する。
【0096】
ステップS7では、検索リテラシー判定部140は、採点処理が施されたユーザIDの全ての検索リテラシー算出テーブル231について、指標値フィールドに格納された指標値の平均を算出する。検索リテラシー判定部140は、算出した平均値をユーザ毎のリテラシーに対する能力判定値として、当ユーザIDの検索リテラシー算出テーブル231に付加する。検索リテラシー判定部140は、キーワードフィールドに本ユーザのリテラシー判定の結果を表す、例えば、“[検索操作全般(平均)]”との文言を格納し、対応する指標値フィールドに算出した能力判定値を格納する。検索リテラシー判定部140は、例えば、当ユーザIDの検索リテラシー算出テーブル231の最終行に付加することができる。
【0097】
尚、検索リテラシー算出テーブル231の一つの行の、キーワードフィールドに格納される、リテラシーの判定の結果を表す文言は、本ユーザのリテラシーの判定の結果を表す表現であればよい。例えば、“「00000」”,“XXXXX”,“ユーザID:Total”,“総判定”,“★★★★”等の、本ユーザのリテラシーの判定の結果を表すテキス
ト文字や記号等の任意の表現が可能である。また、“[検索操作全般(平均)]”との文言が格納される行の指標値フィールドに格納される能力判定値の表現形式は、能力判定値に応じた識別クラスを表す“A”,“B”,“C”等の記号による表現でもよい。
【0098】
検索リテラシー分析部130及び検索リテラシー判定部140は、以上の処理をユーザログテーブル211に未処理のユーザIDがなくなるまでステップS4〜S7及びステップS101〜S120の処理を繰り返す。検索リテラシー判定部140は、ユーザログテーブル211に未処理のユーザIDがなくなると、検索リテラシー算出テーブル231を
検索リテラシーDB230に格納する。検索リテラシーDB230に格納された検索リテラシー算出テーブル231には、検索キーワードが新たに追加されたレコードや更新処理が行われたレコードが含まれる。
【0099】
以上の処理により、検索リテラシー分析部130は、検索クエリーに含まれるキーワード毎にリテラシー判別のための指標値の付与を行い、検索リテラシー判定部140は、全キーワードについて指標値の平均を算出する。この結果、本情報検索システム10では、ユーザ毎に、検索キーワードが属する特定の分野に偏らない検索操作全般に対するリテラシーが判定できる。
【0100】
〔UI提示処理〕
図14に、UI提示処理のフローチャートを例示する。図14に例示するフローチャートは、UI提示処理部150で実行されるリアルタイム処理である。
【0101】
図14に例示するフローチャートにおいて、UI提示処理の開始(START)は、例えば、ユーザ装置20,20aを介して入力された検索要求の受付(検索クエリーの受付)が例示できる。UI提示処理部150は、検索要求に伴うユーザIDを取得する(S11)。例えば、検索要求受付に伴い検索サーバ装置30が解析サーバ100にユーザIDを通知してもよく、解析サーバ装置100が仲介する形態でユーザ装置20、20aからの検索要求に伴うユーザIDを検知し、検索要求を検索サーバ装置30に通知してもよい。情報検索システムが要求される運用精度、システムの規模、データベースが構築される外部記憶装置の容量等の形態に応じた開始条件が選択できる。
【0102】
UI提示処理部150は、検索リテラシーDB230に格納された検索リテラシー算出テーブル231に、ステップS11で取得したユーザID(以下、該当ユーザと称する。)が存在するか否かを判定する(S12)。UI提示処理部150は、取得したユーザIDを検索キーとして、検索リテラシー算出テーブル231のユーザIDフィールドを検索する。
【0103】
UI提示処理部150は、検索リテラシーDB230に格納された検索リテラシー算出テーブル231に該当ユーザIDが存在しない場合(S12、“NO”)には、デフォルトのユーザーインターフェース(UI)情報を提示する(S15)。デフォルトのユーザーインターフェース情報は、従来の検索システムで提示する検索画面であり、ユーザのリテラシーに依らない汎用の検索画面である。
【0104】
一方、UI提示処理部150は、検索リテラシーDB230に格納された検索リテラシー算出テーブル231に該当ユーザIDが存在する場合(S12、“YES”)には、該当するユーザIDの検索リテラシー算出テーブル231に格納された各種情報の読み込みを行う(S13)。ステップS13において、UI提示処理部150は、キーワードフィールドに格納された検索リテラシーの判定の結果を表す文言を検索し、同行の指標値フィールドに格納された能力判定値を読み込む。指標値フィールドに格納された能力判定値は、該当ユーザの検索操作全般に対するリテラシー判定を表す値である。
【0105】
次に、UI提示処理部150は、ステップS13で読み込んだ該当ユーザのリテラシーの判定を行う(S14)。例えば、指標値フィールドに格納された能力判定値が、採点情報であった場合には、閾値判定により、能力判定値の高低判定を行う。一例として、図7に例示する検索リテラシー算出テーブル231において、(1)のユーザ例では“40”、(2)のユーザ例では“50”が能力判定値として格納されている。リテラシー判定の閾値を“50”とし、閾値以上の能力判定値は高いと判定するならば、(1)は低いと判定でき、(2)は高いと判定できる。また、指標値フィールドに格納される能力判定値の
表現形式が、能力判定値に応じたリテラシー識別クラスを表す“A”,“B”,“C”等の記号の場合では、例えば、“A”と一致する場合を高いと判定し、“A”と一致しない場合には低いと判定することができる。ステップS14において、UI提示処理部150は、閾値判定や比較判定により、該当ユーザの能力判定値の高低判定を行う。
【0106】
UI提示処理部150は、該当ユーザの能力判定値が高い場合(S14、“YES”)には、検索リテラシーが高いユーザ用のユーザーインターフェース情報を提示する(S16)。また、該当ユーザの能力判定値が低い場合(S14、“NO”)には、検索リテラシーが低いユーザ用のユーザーインターフェース情報を提示する(S17)。
【0107】
UI提示処理部150は、ユーザからの検索要求が行われる度に、ステップS11〜S17の処理を実行する。
【0108】
〔UI提示例〕
図15,16にUIの提示画面を例示する。図15,16は、ユーザ装置に表示される提示画面の一例である。図15は、UI提示処理でリテラシーが低いユーザに提示される画面例である。例えば、ユーザ装置20を介して検索クエリー入力を行ったユーザ(ユーザID:001)であり、図9に例示するユーザログレコードが作成されたユーザである。図16は、UI提示処理でリテラシーが高いユーザに提示される画面例である。例えば、ユーザ装置20aを介して検索クエリー入力を行ったユーザ(ユーザID:002)であり、図10に例示するユーザログレコードが作成されたユーザである。
【0109】
図15に例示する提示画面は、ユーザが“P●IDE”を検索クエリーとして入力した場合の検索結果の提示画面50である。検索窓50aに入力された検索クエリーは、検索キーワードとなる単語が1語のみで構成されている。この検索クエリーに対する検索結果50bでは、約1,200万件以上のWebサイトがヒットしている。提示画面50は、検索結果の最初の1〜10件目を表示する画面であり、ヒットした10件分の検索結果URL情報が提示される。
【0110】
提示画面50の表示領域50cには、入力された検索クエリーに対する検索操作のアドバイス情報が提示される。図例では、検索キーワードとなる単語が1語のみで入力されているため、“■カテゴリで絞り込みますか?”との表現で、検索結果に対する絞り込み方法を提案している。そして、行を改め、直後の行に検索情報を絞り込むための具体的な検索クエリーを提示している。図例では、ユーザが入力した検索キーワードに連続してカテゴリ情報を付加した、“P●IDE−格闘技”,“P●IDE−音楽”,“P●IDE−今●美●”等の検索クエリーの提示を行っている。また、図例において、“■動画サイトに限定しますか?”との表現で、入力された検索キーワード“P●IDE”から、所望する情報の表現種別を絞り込むための提案を行っている。そして、行を改め、直後の行に“P●IDE−site:www.y・・・・be.com”等の検索コマンドを含めた検索クエリーの提示を行っている。
【0111】
提示画面50の表示領域50dには、検索オプションに関する豆知識情報がサブウィンドウで提示される。図例では、サブウィンドウ枠内に“<検索のコツ> 文字を簡単に大きくできます”等の表現で、検索結果画面に表示される文字サイズの設定情報を提示している。検索結果画面の文字サイズを変更したい場合には、サブウィンドウ枠内に設けられた文字サイズ設定から変更後の文字サイズをマウスポインタ等で選択し、設定する。ユーザは、検索結果画面の検索オプションを改めてクリックしなくとも、オンスクリーン表示されたサブウィンドウから文字サイズ変更が行える。
【0112】
尚、提示画面50において、表示領域50c,50dは、検索窓50aの近傍に位置す
ることが望ましく、より好ましくは、図例のように、検索結果の表示領域の冒頭に位置することが望ましい。
【0113】
図16に例示する提示画面は、検索クエリーとして、「“P●IDE”AND“動画”−“音楽”」を入力した場合の検索結果の提示画面50である。提示画面50は、検索結果の最初の1〜10件目を表示する画面であり、ヒットした10件分のURL情報が提示される。検索窓50aに入力された検索クエリーは、複数の検索キーワードをAND演算子,除く演算子で接続した検索式から構成されている。この検索クエリーに対する検索結果50bは、約16万件程度迄に、Webサイトが絞り込まれている。
【0114】
提示画面50の表示領域50eでは、検索クエリーに使用された検索条件を解説することで、検索結果に対する説明情報を割愛し、画面スペースの圧縮に努めている。図例では、“[音楽]を含まないサイトのみを検索対象にしています。”との表現で、検索結果に対する各種カテゴリや各種Webサイトの種別への説明を省略している。また、図例では、検索条件の解説文に続き、“全てのサイトを対象に再検索”との表現で、全サイトを対象とした再検索のアドバイスを行っている。また、提示画面50に表示される検索結果の各URL情報は、マウスポインタ等によってタイトル表示領域にカーソル位置を合すことにより、オンスクリーン表示50fによる説明の閲覧が可能である。オンスクリーン表示50fを用いて、タイトル表示されたURL情報の説明を行うことで画面スペースの圧縮に努めている。図例では、“有料動画サイト《XX》月会費200円”とのタイトル表示にマウスポインタ等を合わせると、タイトル表示されたWebサイトのURL“www.show・・me.jp”がオンスクリーン表示される。
【0115】
このように、ユーザのリテラシーに応じた検索結果画面をUI画面として提示することにより、検索に不慣れな初心者にとっては、所定の検索操作に関する知識やアドバイス等が提示されるため、不親切に感じることはない。一方、リテラシーの高いユーザにとっては、検索結果に対して不要に感じる過度な説明等が割愛されるため、提示された検索結果画面に対して煩わしく感じることもない。このため、リテラシーの高いユーザに対しても、検索に不慣れなユーザに対しても満足度の高い検索サービスが提供できる。
【0116】
〔効果〕
以上に説明した実施例によれば、本情報検索システム10は、検索サービスを利用するユーザのリテラシーに応じたユーザーインターフェース(UI)情報を検索結果の提示と共に提供することができる。本情報検索システム10は、入力された検索クエリーについて、形態素解析等の検索エンジンの補助機能を必要とするかを判断する。このため、情報検索操作の知識が十分であるかを判定できる。また、本情報検索システム10は、入力された検索クエリーについて、検索式やコマンド等の使用の有無を判断する。このため、検索入力の知識が十分であるかを判定できる。また、本情報検索システム10は、入力された検索クエリーに対応する検索結果の有無を判断する。このため、所望の情報を得るために入力された検索クエリーの妥当性が判定できる。また、本情報検索システム10は、ユーザに提示された検索結果から、閲覧要求を行ったかを判断する。このため、閲覧要求を行う価値のある適切な検索クエリー入力であったかが判定できる。また、本情報検索システム10は、提示された検索結果に対するユーザの取捨選択操作を判断する。このため、検索結果として提示されたULR情報への判別能力が判定できる。また、本情報検索システム10は、検索クエリーに含まれるキーワード毎にリテラシー判別のための指標値の付与を行い、全キーワードについて指標値の平均を算出する。このため、特定のキーワードに偏らない検索操作全般に対するリテラシーが判定できる。また、本情報検索システム10は、全キーワードについて算出された能力判定値に応じてユーザーインターフェース情報の提示を行う。このため、本情報検索システム10が提供する検索サービスの利便性を高めることができ、検索サービスを利用するユーザの満足度を向上させることができる。
【0117】
上記の説明では、検索クエリーに含まれる検索キーワード対象として、(1)検索要求時に受け付けた検索クエリーの最初の単語名詞、(2)検索クエリーに含まれる全ての単語名詞とした。この他に、例えば、過去に処理を行った履歴に基づき(3)検索要求時に受け付けた検索クエリーに対する閲覧要求に基づいて検索キーワード対象を特定してもよい。例えば、ユーザログレコードの閲覧URL情報が格納された最終行に対応する検索クエリーに含まれる単語情報を例示できる。その際に、ユーザログレコード数の多い単語に高い優先度を付与してもよい。同一の検索クエリーに複数の単語が含まれる場合、優先順に1又は複数個の単語をキーワード情報として選択してもよい。また、(4)検索要求時の複数セッションに亘って検索クエリーに含まれる共通のキーワードを検索キーワード対象としてもよい。例えば、ユーザログレコードの連続した検索クエリー情報に共通に含まれるキーワード情報が例示できる。
【0118】
《コンピュータが読み取り可能な記録媒体》
コンピュータその他の機械、装置(以下、コンピュータ等)に上記いずれかの機能を実現させるプログラムをコンピュータ等が読み取り可能な記録媒体に記録することができる。そして、コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
【0119】
ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD−ROM、CD−R/W、DVD、ブルーレイディスク、DAT、8mmテープ、フラッシュメモリなどのメモリカード等がある。また、コンピュータ等に固定された記録媒体としてハードディスクやROM(リードオンリーメモリ)等がある。
【符号の説明】
【0120】
10 情報検索システム
20 ユーザ装置
30 検索サーバ装置
40 記憶装置
100 解析サーバ装置
110 検索ログ取得部
120 検索ログ処理部
130 検索リテラシー分析部
140 検索リテラシー判定部
150 UI提示処理部
200 記憶装置
210 検索ログDB
211 検索クエリーログ
212 クリックURLログ
213 検索結果表示ログ
220 ユーザログDB
221 ユーザログテーブル
230 検索リテラシーDB
231 検索リテラシー算出テーブル
300 情報処理装置
301 CPU
302 メモリ
303 記憶部
304 入力部
305 出力部
306 通信部

【特許請求の範囲】
【請求項1】
情報処理装置に接続される記憶装置に格納された検索履歴情報から、検索要求を行ったユーザの識別情報と、前記検索要求で受け付けた検索クエリー情報と、前記検索クエリー情報に応じて検索された検索結果URL情報と、前記検索結果URL情報から閲覧要求が行われた閲覧URL情報とを前記ユーザの識別情報に対応付けて抽出し、ユーザログ情報として前記記憶装置に格納する手段と、
前記ユーザログ情報に含まれる前記検索クエリー情報の構成、及び前記検索結果URL情報と前記閲覧URL情報との対応関係の少なくとも一つを含む判定基準に従って前記ユーザの能力判定値を付与するリテラシー分析手段と、
前記能力判定値に応じたユーザーインターフェース情報を提示するUI提示処理手段と
を備えた情報処理装置。
【請求項2】
前記リテラシー分析手段はさらに、前記検索クエリー情報毎に前記判定基準を適用して算出した指標値を前記キーワード情報に付与し、前記キーワード情報に付与された前記指標値の平均値を前記ユーザ毎に算出することにより前記能力判定値を付与する、請求項1に記載の情報処理装置。
【請求項3】
前記リテラシー分析手段は、前記検索クエリー情報に応じて検索された前記検索結果URL情報の有無を判定して指標値を付与する、請求項2に記載の情報処理装置。
【請求項4】
前記リテラシー分析手段は、前記検索クエリー情報が形態素解析を必要とするか否かを判定して指標値を付与する、請求項2または3に記載の情報処理装置。
【請求項5】
前記リテラシー分析手段は、前記検索クエリー情報が所定の検索オプション設定が含まれているか否かを判定して指標値を付与する、請求項2−4の何れか一項に記載の情報処理装置。
【請求項6】
前記リテラシー分析手段は、前記検索結果URL情報に対する閲覧要求が行われたか否かを判定して指標値を付与する、請求項2−5の何れか一項に記載の情報処理装置。
【請求項7】
前記リテラシー分析手段は、前記検索結果URL情報に対する閲覧要求が、前記検索結果URL情報から選別されて行われているか否かを分析して指標値を付与する、請求項2−6の何れか一項に記載の情報処理装置。
【請求項8】
情報処理装置に、
情報処理装置に接続される記憶装置に格納された検索履歴情報から、検索要求を行ったユーザの識別情報と、前記検索要求で受け付けた検索クエリー情報と、前記検索クエリー情報に応じて検索された検索結果URL情報と、前記検索結果URL情報から閲覧要求が行われた閲覧URL情報とを前記ユーザの識別情報に対応付けてユーザログ情報として抽出するステップと、
前記ユーザログ情報に含まれる前記検索クエリー情報の構成、及び前記検索結果URL情報と前記閲覧URL情報との対応関係の少なくとも一つを含む判定基準に従って前記ユーザの能力判定値を付与するステップと、
前記能力判定値に応じたユーザーインターフェース情報を提示するステップと
を実行させるプログラム。
【請求項9】
複数の端末と通信可能な情報処理装置を備える情報検索システムであって、
前記情報処理装置は、
情報処理装置に接続される記憶装置に格納された検索履歴情報から、検索要求を行っ
たユーザの識別情報と、前記検索要求で受け付けた検索クエリー情報と、前記検索クエリー情報に応じて検索された検索結果URL情報と、前記検索結果URL情報から閲覧要求が行われた閲覧URL情報とを前記ユーザの識別情報に対応付けて抽出し、ユーザログ情報として前記記憶装置に格納する手段と、
前記ユーザログ情報に含まれる前記検索クエリー情報の構成、及び前記検索結果URL情報と前記閲覧URL情報との対応関係の少なくとも一つを含む判定基準に従って前記ユーザの能力判定値を付与するリテラシー分析手段と、
前記能力判定値に応じたユーザーインターフェース情報を提示するUI提示処理手段と、
を備えることを特徴とする情報検索システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate