説明

ウェブサイト到達領域把握装置及びウェブサイト到達領域把握方法

【課題】アクセスログ情報からウェブサイトの評価、とりわけサイト内ページ遷移上の重大な弱みとなっているものを発見するのに有益な情報を取り出す。
【解決手段】複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト到達領域把握装置におけるウェブサイト到達領域把握方法であって、アクセスログ情報を取得し、ユーザ毎のウェブサイト内遷移の履歴をあらわす遷移行列に変換し、スタートページ別に集計し、規格化を実行し、全次数効果の総合的評価を実行することにより、ウェブページの位置づけをする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断し、ウェブサイト内の到達領域を把握する装置及び方法に関する。
【背景技術】
【0002】
一般にアクセスログと呼ばれるウェブページへのアクセスを記録した情報がウェブサイトの評価に用いられることがある。
【0003】
特許文献1には、アクセスログ情報のうちの必要なログ情報を抽出するログファイル解析用データベースについて開示されている。特許文献2には、複数のウェブページが階層的にリンクされて構成されるウェブサイトをページ更新の前後における変化をアクセスログに基づいて評価するウェブサイト評価システムが開示されている。
また、特許文献3には、商品コンセプトの分析にデマテル分析法を用いる商品開発システムが開示されている。さらに、特許文献4には、デマテル分析法を用いた商品コンセプト開発方法が開示されている。
【0004】
【特許文献1】特開2002−328863号公報
【特許文献2】特開2002−175240号公報
【特許文献3】特開2002−269334号公報
【特許文献4】特開2001−306783号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
本発明の発明者は、ユーザが検索サイトなどの外部リンクから、評価対象となる当該サイトへとアクセスしてくる場合に、そのユーザにとっての当該サイトの入り口は多様であり、さまざまなページからアクセスがスタートすることに着目する。そして、アクセスしてきたユーザが最初に閲覧したページの後に当該サイト内の他のページを閲覧せずに、「離脱」してしまう場合は、そのページにスタートページとしての不具合があると考える。たとえば、そのページの内容によっては、当該サイト内の他のページへと遷移しにくいものがあるかもしれない。また、サイト内の他ページへのリンクが貼り付けられていないページがあるのかもしれない。本発明の目的は、アクセスログ情報からウェブサイトの評価、とりわけサイト内ページ遷移上の重大な弱みとなっているものを発見するのに有益な情報を取り出すことにある。
【課題を解決するための手段】
【0006】
本発明は、複数のウェブページからなるウェブサイトの、構成ページ相互間の遷移に関して、アクセスログ情報に基づいて遷移行列を生成し、デマテル分析法を施すことにより、弱みのあるページを見出すことを最も主要な特徴とする。
【0007】
請求項1に記載した発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト到達領域把握装置であって、アクセスログ情報を取得するアクセスログ情報取得手段と、該アクセスログ情報取得手段により取得した情報をユーザ毎のウェブサイト内遷移の履歴をあらわす遷移行列に変換するユーザ毎遷移行列変換手段と、該ユーザ毎遷移行列変換手段にて得られた遷移行列をスタートページ別に集計するスタートページ別集計手段と、該スタートページ別集計手段により集計された遷移行列の規格化を実行する遷移行列規格化手段と、該遷移行列規格化手段により規格化された遷移行列の全次数効果の総合的評価を実行する全次数効果評価手段と、を有するものである。
【0008】
請求項2に記載した発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト到達領域把握装置におけるウェブサイト到達領域把握方法であって、アクセスログ情報を取得するアクセスログ情報取得ステップと、該アクセスログ情報取得ステップにより取得した情報をユーザ毎のウェブサイト内遷移の履歴をあらわす遷移行列に変換するユーザ毎遷移行列変換ステップと、該ユーザ毎遷移行列変換ステップにて得られた遷移行列をスタートページ別に集計するスタートページ別集計ステップと、該スタートページ別集計ステップにより集計された遷移行列の規格化を実行する遷移行列規格化ステップと、該遷移行列規格化ステップにより規格化された遷移行列の全次数効果の総合的評価を実行する全次数効果評価ステップとを有するものである。
【発明の効果】
【0009】
従来からあるアクセスログを有効に生かして、ウェブサイトを構成する一つ一つのウェブページにサイト内ページ遷移上の重大な弱みとなっているものを見つけることができることに本発明の利点がある。
【発明を実施するための最良の形態】
【0010】
図3は、本発明に用いるコンピュータのハードウェア構成を示す図である。インターネットにつながったサーバ10、20及び端末コンピュータ101,102,103,104が描かれている。今、サーバ10に診断対象となるウェブサイトを構成するウェブページが置かれているものとする。サーバ20により、このウェブサイトの診断を実行するプログラムを走らせる。端末コンピュータ101,102,103,104はこの診断対象となるウェブサイトを閲覧するユーザのコンピュータである。ユーザが当該サイトにアクセスする履歴はサーバ10又は図示しない他のコンピュータに保存される。ある一定期間、たとえば、数時間、一日、一週間といった単位でアクセスログ情報は、収集されて分析にかけられる。
【0011】
図1は、スタートページ別到達ページ領域の把握を実行するプログラムのフローチャートである。ここでは、38ページのウェブページから構成されるウェブサイトを例にとって、説明する。ウェブサイトを閲覧するユーザがこのウェブサイトに入ってくるには、ウェブサイトの運営者が意図する入り口のページにかぎらず、様々なページから入ってくることが考えられる。そこで、ここでは、それぞれのページがスタートページになりえるものと考え、それぞれのページがスタートページになった場合に、当該サイト内のほかのページにどれだけたどり着けるかを診断する。なお、それぞれの算出手段や実行手段は、コンピュータプログラムが、コンピュータ(CPU)に読み込まれて、実現される。
【0012】
本発明では、DEMATEL法(DEcision MAking Trial and Evaluation Laboratory)を用いる。プログラムをスタートすると(ステップ300)、まず、アクセスログ情報を読み込む(ステップ310)。そして、ユーザ毎の遷移行列を作成する(ステップ320)。
【0013】
【数1】

【0014】
ユーザ毎の遷移行列とは、一連の閲覧動作として当該サイト内を遷移するユーザを、用いているコンピュータのIPアドレスなどを頼りに抽出して、当該サイト内のどのページからどのページへ遷移して行ったかを行列表示したものである。
【0015】
次にスタートページ別に遷移行列を集計する(ステップ330)。ここでは、38ページあるので、38個の集計結果が得られる。そして、集計した遷移行列の規格化を実行する(ステップ340)。規格化は、次の式によりなされる。
【0016】
【数2】

【0017】
規格化した遷移行列の全次数効果の総合的な評価を実行する(ステップ350)。次の式により遷移による全ての次数の効果の合計を扱う。
【0018】
【数3】

【0019】
全ての次数の効果の合計とは、直接遷移と間接遷移とを合計したものである。直接遷移は次の式により表されるものであり、1次効果ということができる。
【0020】
【数4】

【0021】
間接遷移は、次の式で表されるものであり、2次効果、3次効果、X次効果からなる。DEMATEL法では、極限的な遷移状態を分析する。
【0022】
【数5】

【0023】
次に、行和ベクトルと列和ベクトルを算出する(ステップ360)。次の式により表されるものである。
【0024】
【数6】

【0025】
行和ベクトルと列和ベクトルとから、その差と和とを構成する。次の式による。
【0026】
【数7】

【0027】
視覚的には、次のようにグラフにプロットすることにより、各ページの評価がしやすくなる。
【0028】
【数8】

【0029】
コンピュータプログラムとしては、ステップ370、ステップ380、ステップ390、ステップ400の大小関係により、未到達領域、小さなレシーバー領域、小さなディスパッチャー領域、大きなディスパッチャー領域を分類し終わる(ステップ460)。ここで、ステップ380における米印は、ゼロと(D+R)の最大値との間の中間値である。
【0030】
図2は、DEMATELによるウェブページの位置づけをしたグラフである。D+Rを横軸、D−Rを縦軸として、それぞれのページをプロットすることにより、当該ページが未到達領域なのか、小さなディスパッチャー、大きなディスパッチャー、小さなレシーバー、大きなレシーバーのいずれであるかが診断できる。このグラフは、それぞれのページをスタートページとするものごとに作成される。たとえば、38ページあるウェブサイトのうちのページID1をスタートページとする場合には、ページID1からページID38までの38ページをこのグラフ上にプロットすることができる。
【0031】
【表1】

【0032】
以下、実際に38ページある特定のウェブサイトのアクセスログ情報を実際に入力して分析した例を示す。表1は、ページ1D1番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図4である。
【0033】
このページはサイトのトップページであり、総アクセス数第一位である。ほぼ全てのページに遷移していることがわかる。よって、スタートページとしては、特に問題がないことがわかる。
【0034】
【表2】

【0035】
表2は、ページ1D13番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図5である。
【0036】
このページは総アクセス数第2位だったものである。スタート総数が多く、アクセス継続度(2ページ目以降にアクセスが続いていく程度)が小さい。このページからスタートした場合、極限的に見ても6つの他ページへは遷移しないので、スタートページとして弱さがやや見える。しかし問題は大きい。
【0037】
【表3】

【0038】
表3は、ページ1D8番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図6である。
【0039】
このページはスタート総数がやや多く、アクセス継続度がやや小さい。このページからアクセスがスタートした場合、極限的に見ても9つの他ページへは遷移しないことがわかり、スタートページとしての弱さが見て取れ、やや重大な問題と言える。
【0040】
【表4】

【0041】
表4は、ページ1D22番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図7である。
【0042】
このページはスタート総数が多く、アクセス継続度が小さかった。このページからアクセスがスタートした場合、極限的に見ると半数以上の他ページへは遷移しないことがわかり、スタートページとして非常に弱く、その問題は重大であることが見て取れる。
【0043】
【表5】

【0044】
表5は、ページ1D34番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図8である。
【0045】
このページはスタート総数がやや多く、アクセス継続度が小さい。このページからアクセスがスタートした場合、極限的に見ると他の5つのページへは遷移しないことがわかり、スタートページとしてやや弱いことが見て取れる。しかし、問題は大きい。
【0046】
【表6】

【0047】
表6は、ページ1D13番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図9である。
【0048】
このページはスタート総数が少なく、アクセス継続度最下位であった(ただし、ID4,11,38を除く)。極限的にもほとんどのページに遷移しないので、スタートページとしては非常に弱いことが把握できる。しかし問題は小さい。
【0049】
【表7】

【0050】
表7は、ページ1D10番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図10である。
【0051】
このページはスタート総数が少なく、アクセス継続度も小さいものであった。極限的にもほとんどのページには遷移しないので、スタートページとして非常に弱いことが把握できるが、それほど重要ではない。
【0052】
【表8】

【0053】
表8は、ページ1D12番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図11である。
【0054】
このページはスタート総数が少なく、アクセス継続度も小さいものであった。極限的にもほぼ全てのページには遷移しないので、スタートページとして非常に弱いことが把握できるが、それほど重要ではない。
【0055】
【表9】

【0056】
表9は、ページ1D14番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図12である。
【0057】
このページはスタート総数が少なく、アクセス継続度は下2位(ただし、ID4,11,38を除く)であった。ほとんど全てのページへは遷移しない。スタートページとしては非常に弱いが、問題は小さい。
【0058】
【表10】

【0059】
表10は、ページ1D16番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図13である。
【0060】
このページはスタート総数が少なく、アクセス継続度も小さい。半数以上のページへは遷移しない。スタートページとしては非常に弱いが、問題は小さい。
【0061】
【表11】

【0062】
表11は、ページ1D32番をスタートページとする場合における各ウェブページのD+R及びD−Rを示す表である。これをグラフ化したのが図14である。
【0063】
このページはスタート総数が少なく、アクセス継続度も小さい。ほとんどのページへは遷移しない。スタートページとしては弱いが、問題は小さい。
【0064】
以上の分析をまとめると、極限的にも到達し得ない他ページがどれ程存在するかでスタートページとしての弱さが把握された。
今回の分析では、ページID13,8,22,34のウェブページがスタートページとしての弱さを抱えており、しかもそれは重大であることが把握された。当該サイトをテコ入れする場合には、これらのページからサイト内の他ページへの遷移を促すような再設計が必要と考えられる。これらのページからアクセスがスタートした場合、サイト内の他ページへとあまり遷移せず、すぐに他のサイトへと離脱してしまうことが把握されたからである。
【産業上の利用可能性】
【0065】
本発明は、スタンドアローンのコンピュータで行うこともできるし、ウェブ上のサーバでのサービスとしても提供できる。
【図面の簡単な説明】
【0066】
【図1】スタートページ別到達領域の把握プログラムのフローチャートである。
【図2】DEMATELによるウェブページの位置づけをしたグラフである。
【図3】本発明に用いるコンピュータのハードウェア構成を示す図である。
【図4】ページID1番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図5】ページID13番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図6】ページID8番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図7】ページID22番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図8】ページID34番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図9】ページID6番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図10】ページID10番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図11】ページID12番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図12】ページID14番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図13】ページID16番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【図14】ページID32番をスターとページとする場合のウェブページの位置づけを示すグラフである。
【符号の説明】
【0067】
10,20 サーバ
101,102,103,104 端末コンピュータ

【特許請求の範囲】
【請求項1】
複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト到達領域把握装置であって、
アクセスログ情報を取得するアクセスログ情報取得手段と、
該アクセスログ情報取得手段により取得した情報をユーザ毎のウェブサイト内遷移の履歴をあらわす遷移行列に変換するユーザ毎遷移行列変換手段と、
該ユーザ毎遷移行列変換手段にて得られた遷移行列をスタートページ別に集計するスタートページ別集計手段と、
該スタートページ別集計手段により集計された遷移行列の規格化を実行する遷移行列規格化手段と、
該遷移行列規格化手段により規格化された遷移行列の全次数効果の総合的評価を実行する全次数効果評価手段と、
を有するウェブサイト到達領域把握装置。
【請求項2】
複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト到達領域把握装置におけるウェブサイト到達領域把握方法であって、
アクセスログ情報を取得するアクセスログ情報取得ステップと、
該アクセスログ情報取得ステップにより取得した情報をユーザ毎のウェブサイト内遷移の履歴をあらわす遷移行列に変換するユーザ毎遷移行列変換ステップと、
該ユーザ毎遷移行列変換ステップにて得られた遷移行列をスタートページ別に集計するスタートページ別集計ステップと、
該スタートページ別集計ステップにより集計された遷移行列の規格化を実行する遷移行列規格化ステップと、
該遷移行列規格化ステップにより規格化された遷移行列の全次数効果の総合的評価を実行する全次数効果評価ステップと
を有するウェブサイト到達領域把握方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2006−185281(P2006−185281A)
【公開日】平成18年7月13日(2006.7.13)
【国際特許分類】
【出願番号】特願2004−379555(P2004−379555)
【出願日】平成16年12月28日(2004.12.28)
【出願人】(300064102)株式会社環 (7)
【出願人】(505004226)
【Fターム(参考)】