説明

ウェブサイト診断装置及びウェブサイト診断方法

【課題】アクセスログ情報からウェブサイトの評価、とりわけサイト内ページ遷移上の重大な弱みとなっているものを発見するのに有益な情報を取り出す。
【解決手段】ウェブサイトを構成するウェブページのそれぞれのURLを記憶し、所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出し、スタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページ離脱数)を算出し、スタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出し、2ページ以上到達数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数をアクセス継続度として、それと、前記スタート回数とをそれぞれのウェブページごとにプロットする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断する装置及び方法に関する。
【背景技術】
【0002】
一般にアクセスログと呼ばれるウェブページへのアクセスを記録した情報がウェブサイトの評価に用いられることがある。
【0003】
特許文献1には、アクセスログ情報のうちの必要なログ情報を抽出するログファイル解析用データベースについて開示されている。特許文献2には、複数のウェブページが階層的にリンクされて構成されるウェブサイトをページ更新の前後における変化をアクセスログに基づいて評価するウェブサイト評価システムが開示されている。
【0004】
【特許文献1】特開2002−328863号公報
【特許文献2】特開2002−175240号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
本発明の発明者は、ユーザが検索サイトなどの外部リンクから、評価対象となる当該サイトへとアクセスしてくる場合に、そのユーザにとっての当該サイトの入り口は多様であり、さまざまなページからアクセスがスタートすることに着目する。そして、アクセスしてきたユーザが最初に閲覧したページの後に当該サイト内の他のページを閲覧せずに、「離脱」してしまう場合は、そのページにスタートページとしての不具合があると考える。たとえば、そのページの内容によっては、当該サイト内の他のページへと遷移しにくいものがあるかもしれない。また、サイト内の他ページへのリンクが貼り付けられていないページがあるのかもしれない。本発明の目的は、アクセスログ情報からウェブサイトの評価、とりわけサイト内ページ遷移上の重大な弱みとなっているものを発見するのに有益な情報を取り出すことにある。
【課題を解決するための手段】
【0006】
本発明は、「スタート総数」と、「アクセス継続度」とを算出し、それをそれぞれのウェブページごとにプロットして、弱みのあるページを見出すことを最も主要な特徴とする。
【0007】
請求項1に記載した発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト診断装置であって、診断対象である当該ウェブサイトを構成するウェブページのそれぞれのURLを記憶するリクエストURL記憶手段と、所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出するスタート回数算出手段と、該スタート回数算出手段により算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページでの離脱数)を算出する1ページ離脱数算出手段と、前記スタート回数算出手段により算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出する2ページ以上到達数算出手段と、該2ページ以上到達数算出手段により算出された2ページ以降へ進んだアクセス数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数(アクセス継続度)を算出するアクセス継続度算出手段と、該アクセス継続度算出手段により算出されたアクセス継続度と、前記スタート回数とをそれぞれのウェブページごとにプロットするプロット手段とを有するものである。
【0008】
請求項2に記載した発明は、複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト診断装置における診断方法であって、診断対象である当該ウェブサイトを構成するウェブページのそれぞれのURLを記憶するリクエストURL記憶ステップと、所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出するスタート回数算出ステップと、該スタート回数算出ステップにより算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページでの離脱数)を算出する1ページ離脱数算出ステップと、前記スタートページ算出ステップにより算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出する2ページ以上到達数算出ステップと、該2ページ以上到達数算出ステップにより算出された2ページ以上到達数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数(アクセス継続度)を算出するアクセス継続度算出ステップと、該アクセス継続度算出ステップにより算出されたアクセス継続度と、前記スタート回数とをそれぞれのウェブページごとにプロットするプロットステップとを有するものである。
【発明の効果】
【0009】
従来からあるアクセスログを有効に生かして、ウェブサイトを構成する一つ一つのウェブページにサイト内ページ遷移上の重大な弱みとなっているものを見つけることができることに本発明の利点がある。
【発明を実施するための最良の形態】
【0010】
図4は、本発明に用いるコンピュータのハードウェア構成を示す図である。インターネットにつながったサーバ10、20及び端末コンピュータ101,102,103,104が描かれている。今、サーバ10に診断対象となるウェブサイトを構成するウェブページが置かれているものとする。サーバ20により、このウェブサイトの診断を実行するプログラムを走らせる。端末コンピュータ101,102,103,104はこの診断対象となるウェブサイトを閲覧するユーザのコンピュータである。ユーザが当該サイトにアクセスする履歴はサーバ10又は図示しない他のコンピュータに保存される。ある一定期間、たとえば、数時間、一日、一週間といった単位でアクセスログ情報は、収集されて分析にかけられる。
【0011】
図1は、アクセス継続度の算出にいたるプログラムのフローチャートである。アクセスログ情報が、インターネットを介して、又は磁気媒体などを介して本発明にかかる診断装置に渡される。本発明におけるいくつかの算出手段は、コンピュータが必要なプログラムを読み込んで実行することにより実現され得る。その手順をフローチャートで表現したのが図1のフローチャートである。このプログラムを走らせる前提として、当該診断対象となるウェブサイトに含まれるウェブページすべてのURLの情報が入力される必要がある。それに含まれるか否かをみて当該サイト内か、サイト外かを判断するためである。
【0012】
プログラムがスタートすると(ステップ200)、まずログよりデータを読み込む(ステップ210)。それぞれのアクセスごとに、どのページから遷移してきて、どのページへ遷移して行ったかの情報を中心に読み込まれる。そして、それに基づいて各ウェブページごとの「スタート回数(D)」、「1ページでの離脱数(E)」、「2ページ以上到達数(G)」が算出される(ステップ220)。スタート回数がゼロでなければ、ステップ230でNOと判断されて、アクセス継続度(I)は、ステップ240の式により、I=(G−E)/Dとして算出される。スタート回数がゼロの場合は、I=−100とされる(ステップ250)。アクセス継続度が算出されて終わる(ステップ260)。なお、このフローチャートには省略したが、X軸にアクセス継続度を、Y軸にスタート回数をとって、ウェブページのそれぞれについてプロットすると、それぞれのページの問題点が明確になる。グラフの作成や、プリントアウトまで連続して実行するプログラムとすることも可能である。
【0013】
図2は、38のウェブページからなるウェブサイトを例にとってスタート回数、1ページでの離脱数、二ページ以上到達数、アクセス継続度の算出を示す図である。38個のウェブページのIDが1から38まで振られている。それぞれのURLがリクエストURLの欄に記載されている。これは、サイト内かサイト外かを判断するのに必要な情報である。A欄のアクセス総数は、このアクセスログ情報を取得した期間内に当該ウェブページをアクセスした総数である。D欄のスタート回数は、A欄のアクセス総数のうち、そのアクセスの直前にサイト外にいたものの数である。E欄の1ページでの離脱数は、D欄のアクセスのうち、次にサイト外をアクセスしたものの数である。E/Dを求めることにより1ページでの離脱率(F欄)が求められる。D欄のアクセスのうち次もサイト内をアクセスしたものが2ページ以上到達数(G欄)となる。そして、G/Dを求めることにより、2ページ以上到達率(H欄)が求められる。H−Fを算出してアクセス継続度(I)が求まる。
【0014】
図3は、スタート総数とアクセス継続度とをプロットした例を示す図である。図2に示した例について、プロットしたものである。スタート総数は、当該ページのスタートページとしての重要度を表す。アクセス継続度は問題の大きさを表し、アクセス継続度が低い場合はスタートページとしての問題は大きく、一方でアクセス継続度が高い場合は、スタートページとしての問題は小さい。スタート総数を縦軸、アクセス継続度を横軸としてサイト内のページを点表示し、スタートページとしての重大な問題を抱えているものを識別する。この例では、つぎのようなことがわかる。
ページID1では、スタート総数が大きく、アクセス継続度も大きいので問題はなさそうである。
ページID13はスタート総数が大きく、アクセス継続度が小さいので、ページ遷移の点で弱い。
ページID8はスタート総数がやや大きく、アクセス継続度にやや不足が見て取れる。
ページID22と34は、スタート総数がやや大きく、アクセス継続度が小さいので、ページ遷移の点で弱い。
ページID4,11,38はスタート総数が小さいものの、アクセス継続度はマイナス100で最低であり、サイト外からこれらのページにアクセスしてきた場合、必ずサイト外へと離脱してしまう。
ページID6,10,12,14,16,32はスタート総数が小さいものの、アクセス継続度が小さく、サイト内のページ遷移を起こしにくい。
ページID36はスタート総数がゼロである。
このようにスタート総数とアクセス継続度による分析によって、アクセスのスタートとなるウェブページ毎にどの程度重大な問題を抱えているかが把握された。
【0015】
なお、上の例では、一つのサーバにあるページ群からなる一つのウェブサイトを診断対象としたが、二つ以上のサーバにあるページ群を複合的に一つのウェブサイトとみなして、サイト分析をすることもできる。サイト内にあるか否かは、登録されたURLとの照合をする作業により決定するものであって、一つのサーバにあるものであることを前提としないからである。また、同様に、サイト内のウェブページが階層構造になっている必要もない。
【産業上の利用可能性】
【0016】
本発明は、スタンドアローンのコンピュータで行うこともできるし、ウェブ上のサーバでのサービスとしても提供できる。
【図面の簡単な説明】
【0017】
【図1】アクセス継続度の算出にいたるプログラムのフローチャートである。
【図2】38のウェブページからなるウェブサイトを例にとってスタート回数、1ページでの離脱数、二ページ以上到達数、アクセス継続度の算出を示す図である。
【図3】スタート総数とアクセス継続度とをプロットした例を示す図である。
【図4】本発明に用いるコンピュータのハードウェア構成を示す図である。
【符号の説明】
【0018】
10,20 サーバ
101,102,103,104 端末コンピュータ

【特許請求の範囲】
【請求項1】
複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト診断装置であって、
診断対象である当該ウェブサイトを構成するウェブページのそれぞれのURLを記憶するリクエストURL記憶手段と、
所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出するスタート回数算出手段と、
該スタート回数算出手段により算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページでの離脱数)を算出する1ページ離脱数算出手段と、
前記スタート回数算出手段により算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出する2ページ以上到達数算出手段と、
該2ページ以上到達数算出手段により算出された2ページ以上到達数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数(アクセス継続度)を算出するアクセス継続度算出手段と、
該アクセス継続度算出手段により算出されたアクセス継続度と、前記スタート回数とをそれぞれのウェブページごとにプロットするプロット手段と
を有するウェブサイト診断装置。
【請求項2】
複数のウェブページからなるウェブサイトをアクセス遷移の観点から診断するウェブサイト診断装置における診断方法であって、
診断対象である当該ウェブサイトを構成するウェブページのそれぞれのURLを記憶するリクエストURL記憶ステップと、
所定期間のアクセスログ情報にもとづいて個々のウェブページについてスタートページとなった回数(スタート回数)を算出するスタート回数算出ステップと、
該スタート回数算出ステップにより算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト外のものとなった回数(1ページでの離脱数)を算出する1ページ離脱数算出ステップと、
前記スタートページ算出ステップにより算出されたスタート回数のうち次に閲覧したページが当該ウェブサイト内のものとなった回数(2ページ以上到達数)を算出する2ページ以上到達数算出ステップと、
該2ページ以上到達数算出ステップにより算出された2ページ以降へ進んだアクセス数から前記1ページでの離脱数を差し引いた結果を前記スタート回数で除してなる数(アクセス継続度)を算出するアクセス継続度算出ステップと、
該アクセス継続度算出ステップにより算出されたアクセス継続度と、前記スタート回数とをそれぞれのウェブページごとにプロットするプロットステップと
を有するウェブサイト診断方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2006−185280(P2006−185280A)
【公開日】平成18年7月13日(2006.7.13)
【国際特許分類】
【出願番号】特願2004−379554(P2004−379554)
【出願日】平成16年12月28日(2004.12.28)
【出願人】(300064102)株式会社環 (7)
【出願人】(505004226)