説明

キーワード付与装置、コンテンツ提供システム、キーワード付与方法およびプログラム

【課題】受信するキーワード基づいてデータを返信するシステムにおいて、データ入力作業者の負担を軽減し、かつ、キーワードとデータとの対応付けを行えるようにする。
【解決手段】
対応関係取得部202が、広告情報マスタデータベース31のレコードと、製品情報マスタデータベース32のレコードとを、これらのレコードに格納されているデータの類否に基づいて対応付ける。そして、キーワード付与部203が、対応関係取得部202による対応付けに基づいて、広告情報マスタデータベース31に格納されている検索キーに、製品情報マスタデータベース32に格納されているキーワードを付与し、製品情報マスタデータベース32に格納されている検索キーに、広告情報マスタデータベース31に格納されているキーワードを付与する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クライアント装置に提供されるデータを検索するためのキーワードを付与するキーワード付与装置、当該キーワード付与装置を具備するコンテンツ提供システム、当該キーワード付与装置のキーワード付与方法およびプログラムに関する。
【背景技術】
【0002】
クライアント装置から送信されるキーワードに対応付けられたデータを返信する様々なシステムが提案されている。例えば、特許文献1に記載の広告情報検索システムでは、キーワードと関連付けられた広告情報を蓄えるマスターサーバーシステムが、ユーザ端末からのキーワードに応じた広告情報に対して順位付けを行い、順位付けされた広告情報を検索ユーザに対して表示(送信)する。これにより、検索ユーザにとっては広告情報の選択を容易にし、商品等に自信がある広告情報提供者には、効果的な集客を図ることができるとされている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−38370号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
キーワードに対応付けられたデータを返信するための準備作業である、キーワードとデータとの対応付け作業は、キーワードや返信用データをシステムに入力するデータ入力作業者にとって負担となる。また、当該対応付け作業において入力ミスや表記ゆれが生じ、適切なキーワードの対応付けが行われないおそれがある。
【0005】
例えば、特許文献1に記載の広告情報検索システムでは、参加店舗が、プロモーション情報やキーワードプログラム情報等を入力するか、あるいは、参加店舗からの申請書類に基づきサービス提供者が代行するとされており、参加店舗の従業員またはサービス提供者が行う情報入力作業に、キーワードとデータとの対応付け作業が含まれると考えられる。かかる対応付け作業は、データ入力作業者である参加店舗の従業員またはサービス提供者の負担となる。また、当該対応付け作業において、行われるべき対応付けが行われない入力ミス、あるいは逆に、行われるべきでない対応付けが行われる入力ミスの生じるおそれがあり、当該入力ミスが生じると検索精度が低下してしまう。
【0006】
また、例えば、入力すべきキーワード「オレンジジュース」に対して、データ入力作業者が「オレンヂジュース」と入力するような表記ゆれが生じた場合も、本来対応付けられるべきキーワードと異なるキーワードが対応付けられることになり、検索精度の低下につながる。しかも、かかる表記ゆれは、明らかな誤記の場合と比較して、入力データのチェック作業において発見できないおそれが高い。
【0007】
特に、データベースの規模が大きい場合、作業対象のデータの数が膨大となるため、データ入力作業者の負担が重くなり、また、作業量が増大するにつれて、入力ミスや表記ゆれの生じるおそれが高くなってしまう。
【0008】
本発明は、このような事情を考慮してなされたものであり、その目的は、データ入力作業者の負担を軽減し、かつ、キーワードとデータとの対応付けを行うことのできるキーワード付与装置、コンテンツ提供システム、キーワード付与方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0009】
この発明は上述した課題を解決するためになされたもので、本発明の一態様によるキーワード付与装置は、第1のデータベースの何れかのフィールドが選択されると、第2のデータベースの各フィールドと、前記選択されたフィールドとの、データの類似度を算出し、類似度が最も高いと判定した前記第2のデータベースのフィールドを選択するフィールド選択部と、前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行い、類似すると判定したデータを含む前記第1のデータベースのレコードと前記第2のデータベースのレコードとを対応付ける対応関係取得部と、前記第1のデータベースに格納された情報と、当該情報を含むレコードに対応付けられた前記第2のデータベースのレコードから得られるキーワードとを対応付けるキーワード付与部と、を具備することを特徴とする。
【0010】
また、本発明の一態様によるキーワード付与装置は、上述のキーワード付与装置であって、前記第1のデータベースの前記選択されたフィールドの各データ、および、前記第2のデータベースの前記選択されたフィールドの各データは、いずれも文字列データであり、前記対応関係取得部は、前記第1のデータベースの前記選択されたフィールドの各文字列データと、前記第2のデータベースの前記選択されたフィールドの各文字列データとの最長共通部分列を求め、前記第1のデータベースの前記選択されたフィールドの各文字列データ、または、前記第2のデータベースの前記選択されたフィールドの各文字列データのいずれかと、前記最長共通部分列との近似文字列照合における編集距離に基づいて、前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行うことを特徴とする。
【0011】
また、本発明の一態様によるコンテンツ提供システムは、クライアント装置に提供されるデータであるコンテンツを格納するコンテンツデータベースと、前記コンテンツデータベースにおける前記コンテンツの検索キーであるコンテンツ検索キーを格納する第1のデータベースと、第2のデータベースと、検索キーデータベースと、キーワード付与装置と、コンテンツ検索装置と、を具備するコンテンツ提供システムであって、前記キーワード付与装置は、前記第1のデータベースの何れかのフィールドが選択されると、前記第2のデータベースの各フィールドと、前記選択されたフィールドとの、データの類似度を算出し、類似度が最も高いと判定した前記第2のデータベースのフィールドを選択するフィールド選択部と、前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行い、類似すると判定したデータを含む前記第1のデータベースのレコードと前記第2のデータベースのレコードとを対応付ける対応関係取得部と、前記第1のデータベースに格納された前記コンテンツ検索キーと、当該コンテンツ検索キーを含むレコードに対応付けられた前記第2のデータベースのレコードから得られるキーワードとを対応付けるキーワード付与部と、前記キーワード付与部による対応付けを示す情報を、前記検索キーデータベースに書き込む対応情報書込部と、を具備し、前記コンテンツ検索装置は、前記コンテンツデータベースに格納されたコンテンツを検索するための検索語が前記クライアント装置から送信されると、前記検索語に基づいて前記検索キーデータベースを検索してコンテンツ検索キーを取得するコンテンツ検索キー取得部と、前記コンテンツ検索キー取得部の取得する前記コンテンツ検索キーに基づいて前記コンテンツデータベースを検索してコンテンツを取得するコンテンツ取得部と、前記コンテンツ取得部の取得する前記コンテンツを前記クライアント装置に送信する通信部と、を具備することを特徴とする。
【0012】
また、本発明の一態様によるキーワード付与方法は、キーワード付与装置のキーワード付与方法であって、第1のデータベースの何れかのフィールドが選択されると、第2のデータベースの各フィールドと、前記選択されたフィールドとの、データの類似度を算出し、類似度が最も高いと判定した前記第2のデータベースのフィールドを選択するフィールド選択ステップと、前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行い、類似すると判定したデータを含む前記第1のデータベースのレコードと前記第2のデータベースのレコードとを対応付ける対応関係取得ステップと、前記第1のデータベースに格納された情報と、当該情報を含むレコードに対応付けられた前記第2のデータベースのレコードから得られるキーワードとを対応付けるキーワード付与ステップと、を具備することを特徴とする。
【0013】
また、本発明の一態様によるプログラムは、コンピュータに、第1のデータベースの何れかのフィールドが選択されると、第2のデータベースの各フィールドと、前記選択されたフィールドとの、データの類似度を算出し、類似度が最も高いと判定した前記第2のデータベースのフィールドを選択するフィールド選択ステップと、前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行い、類似すると判定したデータを含む前記第1のデータベースのレコードと前記第2のデータベースのレコードとを対応付ける対応関係取得ステップと、前記第1のデータベースに格納された情報と、当該情報を含むレコードに対応付けられた前記第2のデータベースのレコードから得られるキーワードとを対応付けるキーワード付与ステップと、を実行させるためのプログラムである。
【発明の効果】
【0014】
この発明によれば、データ入力作業者の負担を軽減し、かつ、キーワードとデータとの対応付けを行うことができる。
【図面の簡単な説明】
【0015】
【図1】本発明の一実施形態における広告用コンテンツ提供システムの概略構成を示す構成図である。
【図2】同実施形態において、広告情報マスタデータベースが格納しているデータの例を示す説明図である。
【図3】同実施形態において、製品情報マスタデータベースが格納しているデータの例を示す説明図である。
【図4】同実施形態において、広告情報フィールドデータベースが格納しているデータの例を示す説明図である。
【図5】同実施形態において、製品情報フィールドデータベースが格納しているデータの例を示す説明図である。
【図6】同実施形態において、基本データベースが格納しているデータの例を示す説明図である。
【図7】同実施形態において、基本データベースが格納しているデータの、もう1つの例を示す説明図である。
【図8】同実施形態において、キーワードデータベースが格納しているデータの例を示す説明図である。
【図9】同実施形態において、フィールド選択部によって選択される、広告情報マスタデータベースのフィールドの例を示す説明図である。
【図10】同実施形態における、フィールド選択部による類否判定の例を示す説明図である。
【図11】同実施形態において、フィールド選択部によって選択される、製品情報マスタデータベースのフィールドの例を示す説明図である。
【図12】同実施形態において、対応関係取得部が生成する最長共通文字列の例を示す説明図である。
【図13】同実施形態において、キーワード付与装置が広告用コンテンツの検索キーにキーワードを付与する処理手順の概略を示すフローチャートである。
【図14】同実施形態において、フィールド選択部が、広告情報マスタデータベースのフィールドおよび製品情報マスタデータベースのフィールドを選択する処理手順を示すフローチャートである。
【図15】同実施形態において、対応関係取得部が、広告情報フィールドデータベースのデータおよび製品情報フィールドデータベースのデータを生成する処理手順を示すフローチャートである。
【図16】同実施形態において、対応関係取得部が、広告情報マスタデータベースのレコードと製品情報マスタデータベースのレコードとの対応付けを行う処理手順を示すフローチャートである。
【図17】同実施形態において、キーワード付与部が、広告情報マスタデータベースの検索キーと、製品情報マスタデータベースの検索キーと、素材ファイルデータベースの検索キーとに、キーワードを対応付ける処理手順を示すフローチャートである。
【図18】同実施形態において、コンテンツ検索装置が広告用コンテンツを提供する処理手順を示すフローチャートである。
【発明を実施するための形態】
【0016】
以下、図面を参照して、本発明の一実施形態について説明する。
図1は、本発明の一実施形態における広告用コンテンツ提供システムの概略構成を示す構成図である。同図において、広告用コンテンツ提供システム1は、コンテンツ検索装置10と、キーワード(Keyword;KW)付与装置20と、広告情報マスタデータベース(Database;DB)31と、製品情報マスタデータベース32と、素材ファイルデータベース33と、広告情報フィールドデータベース34と、製品情報フィールドデータベース35と、基本データベース36と、キーワードデータベース37とを具備する。コンテンツ検索装置10は、通信部101と、コンテンツ検索キー取得部102と、コンテンツ取得部103とを具備する。キーワード付与装置20は、フィールド選択部201と、対応関係取得部202と、キーワード付与部203とを具備する。また、コンテンツ検索装置10は、クライアント装置9に接続されている。
【0017】
広告用コンテンツ提供システム1は、コンテンツ提供システムの一例であり、クライアント装置9からキーワードが送信されると、当該キーワードに関連する広告を生成するための素材となる広告用コンテンツを返信する。なお、ここでいう「コンテンツ」は、動画像、静止画像、テキスト、音声あるいはこれらの組み合わせである。
クライアント装置9は、広告用コンテンツ提供システム1(コンテンツ検索装置10)にキーワードを送信し、広告用コンテンツを取得する。例えば、クライアント装置9は、ウェブページ検索サービスを提供するウェブサーバ装置であり、キーワードを含む検索リクエストを受信すると、検索結果のウェブページ情報と、キーワードに関連する広告とを含むレスポンスを返信する。その際、クライアント装置9は、受信したキーワードを広告用コンテンツ提供システム1に送信(転送)し、広告用コンテンツ提供システム1から返信される広告用コンテンツを用いて広告を生成し、レスポンスに含める。
【0018】
コンテンツ検索装置10は、クライアント装置9から送信されるキーワードを受信すると、当該キーワードに基づいて広告情報マスタデータベース31、製品情報マスタデータベース32または素材ファイルデータベース33から広告用コンテンツを取得し、当該広告用コンテンツをクライアント装置9に返信する。
通信部101は、クライアント装置9との間で通信を行って、各種データを送受信する。特に、通信部101は、クライアント装置9から送信されるキーワードを受信してコンテンツ検索キー取得部102に出力し、また、コンテンツ取得部103から出力される広告用コンテンツをクライアント装置9に送信する。
【0019】
コンテンツ検索キー取得部102は、クライアント装置9からキーワード(検索語)が送信されると、当該キーワードに基づいてキーワードデータベース37を検索して、広告情報マスタデータベース31、製品情報マスタデータベース32または素材ファイルデータベース33の検索キーを取得し、当該検索キーをコンテンツ取得部103に出力する。
なお、ここでいう「検索キー」は、データベースのレコードを一意に特定する識別子である。この検索キーは、コンテンツ検索装置10が広告情報マスタデータベース31、製品情報マスタデータベース32または素材ファイルデータベース33を検索して広告用コンテンツを取得する際に、当該広告用コンテンツを格納するレコードを特定するために用いられる。
なお、ここでいう「レコード」は、データベースにおける行である。また、以下では、レコードに含まれる項目を「フィールド」と称する。フィールドは、データベースにおける列を構成する。
【0020】
また、以下では、特に区別する必要のある場合を除き、検索可能に構成されたデータと、当該データに対する処理を提供する手段とのいずれも「データベース」と称する。なお、データ処理提供手段としてのデータベースは、データベースサーバなどデータベース専用のハードウェアを用いて実現されていてもよい。あるいは、コンテンツ検索装置10の具備するメモリがデータを格納し、コンテンツ検索装置10の具備するCPU(Central Processing Unit、中央処理装置)が所定のプログラムを読み込み実行することによってデータに対する各種処理を行うなど、データベース専用のハードウェア以外のハードウェアを用いて実現されていてもよい。
【0021】
コンテンツ取得部103は、コンテンツ検索キー取得部102の取得する検索キーに基づいて、広告情報マスタデータベース31、製品情報マスタデータベース32または素材ファイルデータベース33を検索して広告用コンテンツを取得し、当該広告用コンテンツを通信部101に出力する。
【0022】
キーワード付与装置20は、広告用コンテンツを格納する広告情報マスタデータベース31、製品情報マスタデータベース32および素材ファイルデータベース33の検索キーを、キーワードに対応付けてキーワードデータベース37に格納する。より具体的には、キーワード付与装置20は、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとの対応付けを行い、対応付けられたレコード毎に、当該レコードから広告情報マスタデータベース31の検索キーと、製品情報マスタデータベース32の検索キーと、素材ファイルデータベース33の検索キーと、これらの検索キーに対応付けるキーワードとを読み出し、キーワードデータベース37の同一レコードに書き込むことにより検索キーとキーワードとの対応付けを行う。
【0023】
フィールド選択部201は、対応関係取得部202が、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとの対応付けを行う際に、類否判定対象とするフィールドを選択する。
対応関係取得部202は、フィールド選択部201が選択したフィールドのデータに基づいて、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとを対応付ける。
【0024】
キーワード付与部203は、広告情報マスタデータベース31と製品情報マスタデータベース32とから、対応関係取得部202によって対応付けられたレコード毎に、広告情報マスタデータベース31の検索キーと、製品情報マスタデータベース32の検索キーと、素材ファイルデータベース33の検索キーと、これらの検索キーに対応付けるキーワードとを読み出す。そして、キーワード付与部203は、読み出した検索キーおよびキーワードを、キーワードデータベース37に書き込む。その際、キーワード付与部203は、広告情報マスタデータベース31の1つのレコードから読み出した検索キーおよびキーワードと、当該レコードに対応付けられた製品情報マスタデータベース32のレコードから読み出した検索キーおよびキーワードとを、キーワードデータベース37の同一レコードに書き込む。
【0025】
広告情報マスタデータベース31は、第1のデータベースの一例であり、各種広告に関するデータを予め格納する。
図2は、広告情報マスタデータベース31が格納しているデータの例を示す説明図である。同図において、広告情報マスタデータベース31の各レコードが、1つの広告に関する一連のデータを格納しており、各レコードは、広告ID(Identifier)フィールドと、広告主フィールドと、商品名フィールドと、商品名カナフィールドと、媒体フィールドと、素材IDフィールドとを有する。
【0026】
広告IDフィールドは、広告情報マスタデータベース31の検索キーである広告IDを格納する。広告主フィールドは、広告主名を格納する。商品名フィールドは、広告対象の商品名を格納する。商品名カナフィールドは、仮名書きによる商品名を格納する。媒体フィールドは、広告媒体の種別情報を格納する。素材IDフィールドは、素材ファイルデータベース33の検索キーである素材IDを格納する。
【0027】
広告情報マスタデータベース31の格納するデータのうち、広告IDと素材IDとは、コンテンツ検索装置10が広告用コンテンツを取得する際の検索キーであるコンテンツ検索キーとして用いられる。また、広告主名や商品名等は、検索キーに対応付けられるキーワードとして、キーワード付与装置20によってキーワードデータベース37に書き込まれる。
【0028】
製品情報マスタデータベース32は、第2のデータベースの一例であり、各種製品に関するデータを予め格納する。
図3は、製品情報マスタデータベース32が格納しているデータの例を示す説明図である。同図において、製品情報マスタデータベース32の各レコードが、1つの製品に関する一連のデータを格納しており、各レコードは、製品IDフィールドと、メーカフィールドと、製品名フィールドと、製品名カナフィールドと、種別フィールドと、形態フィールドと、発売日フィールドとを有する。
【0029】
製品IDフィールドは、製品情報マスタデータベース32の検索キーである製品IDを格納する。メーカフィールドは、製品の製造メーカ名を格納する。製品名フィールドは、製品名を格納する。製品名カナフィールドは、仮名書きによる製品名を格納する。種別フィールドは、製品の種別情報を格納する。形態フィールドは、製品の形態(「缶」、「ビン」等)情報を格納する。発売日フィールドは、製品の発売日情報を格納する。
【0030】
製品情報マスタデータベース32の格納するデータのうち、製品IDは、コンテンツ検索装置10が広告用コンテンツを取得する際の検索キーであるコンテンツ検索キーとして用いられる。また、メーカ名や製品名等は、検索キーに対応付けられるキーワードとして、キーワード付与装置20によってキーワードデータベース37に書き込まれる。
【0031】
素材ファイルデータベース33は、テレビ広告画像を格納する動画像ファイルなど、広告用コンテンツを格納するコンテンツファイルを、素材ファイルデータベース33の検索キーである素材IDと対応付けて予め格納する。
広告情報マスタデータベース31と、製品情報マスタデータベース32と、素材ファイルデータベース33とは、いずれもコンテンツデータベースの一例であり、コンテンツ検索装置10は、素材ファイルデータベース33の格納するコンテンツファイルや、広告情報マスタデータベース31の格納する広告に関するデータや、製品情報マスタデータベース32の格納する製品に関するデータを、広告用コンテンツとしてクライアント装置9に提供(返信)する。
【0032】
広告情報フィールドデータベース34は、広告情報マスタデータベース31の格納するデータのうち、フィールド選択部201によって選択されるフィールドに格納されているデータを、広告IDと対応付けて格納する。
図4は、広告情報フィールドデータベース34が格納しているデータの例を示す説明図である。同図において、広告情報フィールドデータベース34の各レコードが、広告情報マスタデータベース31の各レコードに対応しており、広告情報フィールドデータベース34は、広告情報マスタデータベース31の格納するデータのうち、商品名カナフィールドのデータを、広告IDと対応付けて格納している。
後述するように、広告情報フィールドデータベース34の格納するデータは、フィールド選択部201によって書き込まれる。
【0033】
製品情報フィールドデータベース35は、対応関係取得部202が広告情報マスタデータベース31のデータと製品情報マスタデータベース32のデータとから生成する共通部分列を、広告情報マスタデータベース31の検索キーおよび製品情報マスタデータベース32の検索キーと対応付けて格納する。ここでいう「部分列」は、文字列から幾つかの文字を取り出し、元の文字列と同じ順番に並べて得られる文字列である。また、「共通部分列」は、複数の文字列に共通する部分列である。また、以下では共通部分列のうち最長のものを「最長共通部分列」と称する。
【0034】
図5は、製品情報フィールドデータベース35が格納しているデータの例を示す説明図である。同図において、共通部分列フィールドには、対応関係取得部202が生成する共通部分列が格納されている。なお、「(null)」は空文字列(文字列長が0の文字列)を示す。
また、広告IDフィールドには、広告情報マスタデータベース31において共通部分列生成の元となったデータを格納するレコードの検索キー(広告ID)が格納されている。また、製品IDフィールドには、製品情報マスタデータベース32において共通部分列生成の元データとなったもう1つのデータを格納するレコードの検索キー(製品ID)が格納されている。
対応関係取得部202の生成する共通部分列については後述する。
【0035】
基本データベース36は、広告情報マスタデータベース31のレコードと、製品情報マスタデータベース32のレコードとの対応関係を示すデータを格納する。
図6は、基本データベース36が格納しているデータの例を示す説明図である。同図において、基本データベース36の各レコードが、対応関係取得部202によって対応付けられた、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとを示すデータを格納しており、各レコードは、統合IDフィールドと、広告IDフィールドと、商品名カナフィールドと、製品IDフィールドと、製品名カナフィールドと、共通部分列フィールドとを有する。
【0036】
統合IDフィールドは、基本データベース36の検索キーである統合IDを格納する。広告IDフィールドは、対応関係取得部202によって対応付けられた、広告情報マスタデータベース31側のレコードを示す広告IDを格納する。商品名カナフィールドは、対応付けの際に用いられた、仮名書きによる商品名を格納する。製品IDフィールドと、製品名カナフィールドとは、それぞれ、対応関係取得部202によって対応付けられた、製品情報マスタデータベース32側のレコードを示す広告IDと、当該レコードに格納されている仮名書きによる製品名とを格納する。共通部分列フィールドは、対応付けの際に用いられた共通部分列を格納する。
【0037】
なお、基本データベース36が格納するデータは、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとを1対1に対応付けるものに限らない。
図7は、基本データベース36が格納しているデータの、もう1つの例を示す説明図である。同図の行L11〜L12に示されるように、1つの広告IDに複数の製品IDが対応付けられていてもよい。すなわち、広告情報マスタデータベース31の1つのレコードに、製品情報マスタデータベース32の複数のレコードが対応付けられていてもよい。
例えば、「林檎ジュース」という同一の商品名で、350ml(ミリリットル)入りの製品や、1.5L(リットル)入りの製品が販売されている場合など、1つの商品に対応する複数の製品が存在する場合に、基本データベース36が、各製品に対応する行を格納するようにする。これにより、「350ml」や「1.5L」など、製品毎のキーワードを商品(広告)と対応付けることが可能となり、ヒット率を高めることができる。
【0038】
また、同図の行L13と行L14とでは、異なる広告ID(D11とD21)に対して、同じ商品名カナ(D12とD22)が対応付けられている。ここで、商品名は広告の内容を示す目安として付されるにすぎないため、比較的おおまかな(文字数の少ない)名称が用いられている。このため、行L13と行L14とに示されるように、異なる広告に同じ商品名が対応付けられ得る。
一方、同じく行L13と行L14において、異なる製品ID(D13とD23)と、異なる製品名カナ(D14とD24)が格納されている。製品名は製品を識別するために用いられるため、比較的詳細な(文字数の多い)名称が用いられている。このため、行L13と行L14とに示されるように、製品毎に異なる製品名が対応付けられている。
この商品名カナのような、大まかなキーワードを格納しているデータベース(例えば広告情報マスタデータベース31)のデータに対して、他のデータベース(例えば製品情報マスタデータベース32)から、製品名カナのような詳細なキーワードを取得して対応付けることにより、キーワード数を増やしてヒット率を高め得る。
【0039】
また、同図の行L15に示されるように、いずれの製品IDとも対応付けられていない広告IDが存在してもよい。すなわち、製品情報マスタデータベース32のいずれのレコードとも対応付けられていない、広告情報マスタデータベース31のレコードが存在してもよい。
【0040】
キーワードデータベース37は、コンテンツデータベースである広告情報マスタデータベース31、製品情報マスタデータベース32および素材ファイルデータベース33の検索キーと、これらの検索キーに対応付けられるキーワードとを格納する。
図8は、キーワードデータベース37が格納しているデータの例を示す説明図である。同図において、キーワードデータベース37の各レコードは、基本データベース36の各レコードに対応しており、各レコードは統合IDフィールドと、広告IDフィールドと、製品IDフィールドと、素材IDフィールドと、広告主フィールドと、メーカフィールドと、商品名フィールドと、製品名フィールドと、商品名カナフィールドと、製品名カナフィールドと、種別フィールドとを有する。
【0041】
統合IDフィールドは、基本データベース36における統合IDを格納する。この統合IDは、キーワードデータベース37の検索キーとしても用いられる。
広告IDフィールドと製品IDフィールドとは、それぞれ、統合IDによって特定される、基本データベース36のレコードに格納されている、広告IDと製品IDとを格納する。この広告IDと製品IDとによって、広告情報マスタデータベース31のフィールドと製品情報マスタデータベース32のフィールドとの対応関係が示されている。
【0042】
素材IDフィールドと、広告主フィールドと、商品名フィールドと、商品名カナフィールドとは、それぞれ、広告IDによって特定される、広告情報マスタデータベース31のレコードに格納されている、素材IDと、広告主名と、商品名と、仮名書きによる商品名とを格納する。
メーカフィールドと、製品名フィールドと、製品名カナフィールドと、種別フィールドとは、それぞれ、製品IDによって特定される、製品情報マスタデータベース32のレコードに格納されている、メーカ名と、製品名と、仮名書きによる製品名と、製品の種別情報とを格納する。
【0043】
キーワードデータベース37に格納されている広告主名と、メーカ名と、商品名と、製品名と、仮名書きによる商品名と仮名書きによる製品名と、製品の種別情報とは、コンテンツ検索装置10が広告用コンテンツを検索する際に、コンテンツデータベースの検索キーに対応付けられたキーワードとして用いられる。コンテンツ検索装置10は、クライアント装置9からキーワードが送信されると、当該キーワードに類似するキーワードをキーワードデータベース37の格納するキーワードの中から取得し、取得したキーワードに対応付けられた検索キーを用いて広告用コンテンツを取得する。
【0044】
次に、図9〜図11を参照して、フィールド選択部201によるフィールドの選択について説明する。フィールド選択部201は、キーワード付与部203が行う検索キーとキーワードとの対応付けの前処理として、フィールドの選択を行う。
図9は、フィールド選択部201によって選択される、広告情報マスタデータベース31のフィールドの例を示す説明図である。また、図10は、フィールド選択部201による類否判定の例を示す説明図である。また、図11は、フィールド選択部201によって選択される、製品情報マスタデータベース32のフィールドの例を示す説明図である。
【0045】
フィールド選択部201は、まず、図9に示されるように、広告情報マスタデータベース31のフィールドの何れかを選択する。例えば、フィールド選択部201は、広告情報マスタデータベース31のフィールドのうち特定のフィールドを選択するよう予め設定されており、当該フィールドを選択する。本実施形態では、フィールド選択部201は、広告情報マスタデータベース31の商品名カナフィールドを選択する。以下では、フィールド選択部201の選択したフィールドを「選択フィールド」と称する。
【0046】
次に、フィールド選択部201は、広告情報マスタデータベース31の選択フィールドの各データについて、当該データと、製品情報マスタデータベース32の各データとの類否を判定する。例えば、図10の例では、フィールド選択部201は、広告情報マスタデータベース31の選択フィールドである商品名カナフィールドのデータD111「モカムトウ」と、製品情報マスタデータベース32の各データとの類否を判定する。そして、フィールド選択部201は、データD121「イチバン モカムトウ 200ml」がデータD111「モカムトウ」と類似であり、他のデータはデータD111と非類似であるとの判定結果を得る。さらに、フィールド選択部201は、データD112〜D114など、商品名カナフィールドの他のデータについても同様の判定を行う。
【0047】
ここで、フィールド選択部201は、例えば近似文字列照合において編集距離が所定の閾値以下の文字列(データ)を類似と判定し、編集距離が閾値よりも大きい文字列を非類似と判定する。ここでいう「近似文字列照合」は、編集操作として1文字挿入と1文字削除と1文字置換とのみを行って文字列Aから文字列Bを生成する際に、必要な編集操作の回数を、文字列Aと文字列Bとの編集距離として求める処理である。
例えば、データD112「イチバン モカムトウ 200ml」からは、1文字削除を11回行って、「イ」、「チ」、「バ」、「ン」、「 」(空白)、「 」(空白)、「2」、「0」、「0」、「m」、「l」の各文字を削除することによって、データD111「モカムトウ」を生成することができる。従って、データD112とデータD111との編集距離は11である。
近似文字列照合のアルゴリズムとしては様々なものが提案されており、フィールド選択部201は、公知のアルゴリズムを用いて近似文字列照会を行うことができる。
【0048】
なお、フィールド選択部201が行う類否判定方法としては、上述したものに限らず、2つの文字列の類否を判定可能な様々な方法を用いることができる。例えば、フィールド選択部201が、近似文字列照合において距離が最小となる1つの文字列を選択するなど、広告情報マスタデータベース31の選択フィールドのデータと、製品情報マスタデータベース32のデータとを1対1対応にて選択する(類似と判定する)ようにしてもよい。
あるいは、フィールド選択部201が、最長共通部分列長が所定の閾値以上の文字列を類似と判定し、所定の閾値未満の文字列を非類似と判定するなど、近似文字列照会以外の処理によって文字列の類否判定を行うようにしてもよい。最長共通部分列を求めるアルゴリズムとしては、Hunt-Szymanski LCSアルゴリズムなど様々なものが提案されており、フィールド選択部201は、公知のアルゴリズムを用いて最長共通文字列長を求めることができる。
【0049】
次に、フィールド選択部201は、類否判定結果に基づいて、広告情報マスタデータベース31の選択フィールドの何れかのデータに類似するデータを最も多く含むフィールドを、製品情報マスタデータベース32のフィールドから選択する。図11の例では、広告情報マスタデータベース31の選択フィールドである商品名カナフィールドの何れかのデータに類似するデータを最も多く含むフィールドは、製品名カナフィールドである。そこで、フィールド選択部201は、この製品名カナフィールドを製品情報マスタデータベース32の選択フィールドとする。
【0050】
このように、フィールド選択部201が、広告情報マスタデータベース31の選択フィールドおよび製品情報マスタデータベース32の選択フィールドとして、類似するデータを多く含むフィールドを選択することにより、共通性の高いフィールドを選択することが期待される。例えば、図11の例では、共に仮名書きによる物品の名称を示す商品名カナフィールドと製品名カナフィールドとが選択されている。
この共通性の高いフィールドのデータを用いて、対応関係取得部202が、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとの対応付けを行い、当該対応付けに従って、キーワード付与部203が、検索キーにキーワードを付与することにより、適切なキーワードを付与できることが期待される。
【0051】
例えば、図11の例において、データD111とデータD121とは、同一種類の物品(一番珈琲の製造するモカ無糖)を指す。従って、この物品の広告用コンテンツの検索キーD211に、メーカ名のデータD221「一番珈琲」や、製品名のデータD222「一番 モカ無糖 200ml」や、仮名書きによる製品名のデータD121「イチバン モカムトウ 200ml」や、種別情報のデータD223「缶コーヒー」をキーワードとして付与することにより、広告対象の商品に関連するキーワードを付与できる。従って、コンテンツ検索装置10がクライアント装置9からのキーワードに基づいて広告用コンテンツを取得する際に、適切なコンテンツを取得できることが期待される。
【0052】
次に、図12を参照して、対応関係取得部202による製品情報フィールドデータベース35のデータの生成について説明する。
図12は、対応関係取得部202が生成する最長共通文字列の例を示す説明図である。
対応関係取得部202は、広告情報マスタデータベース31の選択フィールドのデータと、製品情報マスタデータベース32の選択フィールドのデータとの各組み合わせについて、共通部分列として最長共通部分列を求め、広告IDおよび製品IDと対応付けて製品情報フィールドデータベース35に書き込む。前述したように、最長共通部分列は、複数の文字列に共通する部分列のうち最長のものであり、ここでは、広告情報マスタデータベース31の選択フィールドの何れかのデータと、製品情報マスタデータベース32の選択フィールドの何れかのデータとに共通する部分列のうち最長のものである。
【0053】
図12の例では、データD113「マメタップリノコーヒー」とデータD322「ボン マメタップリノコーヒー 200ml」との最長共通部分列は「マメタップリノコーヒー」である。対応関係取得部202は、この最長共通部分列と、データD113を含むレコードの検索キー(広告ID)D311と、データD322を含むレコードの検索キー(製品ID)D321とを対応付けて、製品情報フィールドデータベース35に書き込む。
対応関係取得部202は、広告情報マスタデータベース31の選択フィールドのデータと、製品情報マスタデータベース32の選択フィールドのデータとの、他の組み合わせについても同様の処理を行う。これにより、図5に示すデータが、製品情報フィールドデータベース35に格納される。
【0054】
この製品情報フィールドデータベース35に格納されるデータは、対応関係取得部202が、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとの対応付けを行う際に用いられる。
例えば、対応関係取得部202は、図2の商品名カナフィールドのデータと、図5の共通部分列フィールドのデータとの類否判定を、近似文字列照合によって行う。そして、対応関係取得部202は、図2における広告ID「M1012」のレコードの商品名カナフィールドのデータ「モカムトウ」と、図5における製品ID「PID0034」のレコードの共通部分列フィールドのデータ「モカムトウ」との編集距離が所定の閾値以下であることから、両データが類似すると判定する。そして、対応関係取得部202は、広告ID「M1012」と、商品名カナフィールドのデータ「モカムトウ」と、製品ID「PID0034」と、共通部分列フィールドのデータ「モカムトウ」とを基本データベース36の同一レコードに書き込む。対応関係取得部202は、図2の商品名カナフィールドのデータと、図5の共通部分列フィールドのデータとの他の組み合わせについても同様の処理を行い、さらに、基本データベース36の検索キーとして統合IDを書き込む。これにより、図6に示すデータが、基本データベース36に格納される。
【0055】
ここで、対応関係取得部202が、広告情報マスタデータベース31の選択フィールドのデータと、製品情報マスタデータベース32の選択フィールドのデータとを直接用いて、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとの対応付けを行うようにも出来る。しかし、製品名カナフィールドのデータには、仮名書きによるメーカ名や内容量情報が付加されているため、編集距離が大きくなり、適切な対応付けを行えなくなるおそれがある。
例えば、商品名カナフィールドのデータ「モカムトウ」(図11のデータD111)と、製品名カナフィールドのデータ「イチバン モカムトウ 200ml」(図11のデータD121)との編集距離は11である。従って、類否判定の閾値が10以下に設定されている場合、対応関係取得部202は、これらのデータが非類似であると判定し、レコードの対応付けを行わなくなってしまう。
【0056】
そこで、上述のように、対応関係取得部202が、最長共通部分列を用いて類否判定を行うようにする。これにより、製品名カナフィールドのデータから、メーカ名や内容量情報を予め削除でき、対応関係取得部202は、より適切な類否判定を行い、より適切な対応付けを行うことが出来る。
【0057】
なお、対応関係取得部202が行う類否判定方法としては、上述したものに限らず、2つの文字列の類否を判定可能な様々な方法を用いることができる。例えば、フィールド選択部201について上述したのと同様に、対応関係取得部202が、近似文字列照合において距離が最小となる1つの文字列を選択するなど、広告情報マスタデータベース31のレコードと、製品情報マスタデータベース32のレコードとを1対1対応にて選択する(類似と判定する)ようにしてもよい。あるいは、対応関係取得部202が、最長共通部分列長が所定の閾値以上の文字列を類似と判定し、所定の閾値未満の文字列を非類似と判定するなど、近似文字列照会以外の処理によって文字列の類否判定を行うようにしてもよい。
【0058】
次に図13〜図18を参照して、広告用コンテンツ提供システム1の動作について説明する。
図13は、キーワード付与装置20が広告用コンテンツの検索キーにキーワードを付与する処理手順の概略を示すフローチャートである。
キーワード付与装置20は、予め(コンテンツ検索装置10が、クライアント装置9からのキーワードを受信して広告用コンテンツを取得するための事前の処理として)同図の処理を行う。
【0059】
まず、フィールド選択部201が、広告情報マスタデータベース31のフィールドの何れかと、製品情報マスタデータベース32のフィールドの何れかとを選択する(ステップS101)。次に、対応関係取得部202が、広告情報マスタデータベース31の選択フィールドの各データと、製品情報マスタデータベース32の選択フィールドの各データとに基づいて、図4で説明した広告情報フィールドデータベース34のデータと、図5で説明した製品情報フィールドデータベース35のデータとを生成する(ステップS102)。そして、対応関係取得部202は、広告情報フィールドデータベース34のデータと製品情報フィールドデータベース35のデータとの類否に基づいて、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとの対応付けを行い、対応関係を示すデータを基本データベース36に書き込む(ステップS103)。次に、キーワード付与部203は、対応関係取得部202の行った対応付けに基づいて、広告情報マスタデータベース31の検索キーと、製品情報マスタデータベース32の検索キーと、素材ファイルデータベース33の検索キーとに、広告情報マスタデータベース31から読み出すキーワードおよび製品情報マスタデータベース32から読み出すキーワードを対応付け、この対応付けを示すデータをキーワードデータベース37に書き込む(ステップS104)。
【0060】
図14は、フィールド選択部201が、広告情報マスタデータベース31のフィールドおよび製品情報マスタデータベース32のフィールドを選択する処理手順を示すフローチャートである。フィールド選択部201は、図13のステップS101において同図の処理を行う。
まず、フィールド選択部201は、広告情報マスタデータベース31のフィールドの何れかを選択する(ステップS201)。例えば、フィールド選択部201は、広告情報マスタデータベース31のフィールドのうち特定のフィールドを選択するよう予め設定されており、当該フィールドを選択する。
【0061】
次に、フィールド選択部201は、ステップS201で選択したフィールドの各データに対する処理のループL11を開始する(ステップS211)。さらに、フィールド選択部201は、製品情報マスタデータベース32の各データに対する処理のループL12を開始する(ステップS212)。そして、フィールド選択部201は、ステップS201で選択したフィールドの各データと、製品情報マスタデータベース32の各データとの類否判定を行う(ステップS213)。
そして、フィールド選択部201は、ステップS201で選択したフィールドの各データと、製品情報マスタデータベース32の各データとの全ての組み合わせについて類否判定を行った後、ループL12およびL11を終了する(ステップS214、S215)。
【0062】
次に、フィールド選択部201は、製品情報マスタデータベース32の各フィールドに対する処理のループL13を開始する(ステップS221)。そして、フィールド選択部201は、製品情報マスタデータベース32のフィールド毎に、ステップS213で広告情報マスタデータベース31の選択フィールドの何れかのデータに類似すると判定したデータの数を、製品情報マスタデータベース32の当該フィールドと広告情報マスタデータベース31の選択フィールドとの類似度として算出(集計)する(ステップS222)。
そして、フィールド選択部201は、製品情報マスタデータベース32の全てのフィールドについて類似度の算出を行った後、ループL13を終了する(ステップS223)。
【0063】
次に、フィールド選択部201は、製品情報マスタデータベース32のフィールドのうち、ステップS222で算出した類似度が最も高いと判定したフィールドを選択する(ステップS231)。そして、フィールド選択部201は、ステップS201における広告情報マスタデータベース31の選択フィールドおよびステップS231における製品情報マスタデータベース32の選択フィールドを示す情報を対応関係取得部202に出力する。
その後、同図の処理を終了する。
【0064】
図15は、対応関係取得部202が、広告情報フィールドデータベース34のデータおよび製品情報フィールドデータベース35のデータを生成する処理手順を示すフローチャートである。対応関係取得部202は、図13のステップS102において同図の処理を行う。
まず、対応関係取得部202は、製品情報フィールドデータベース35の初期化として、製品情報フィールドデータベース35を空行(レコード数0)にする(ステップS301)。
【0065】
次に、対応関係取得部202は、広告情報マスタデータベース31の選択フィールドの各データに対する処理のループL21を開始する(ステップS311)。さらに、対応関係取得部202は、製品情報マスタデータベース32の選択フィールドの各データに対する処理のループL22を開始する(ステップS312)。そして、対応関係取得部202は、広告情報マスタデータベース31の選択フィールドの各データと製品情報マスタデータベース32の選択フィールドの各データとの最長共通部分列を生成する(ステップS313)。そして、対応関係取得部202は、製品情報フィールドデータベース35に1行(1レコード)追加し、追加した行に、ステップS313で生成した最長共通部分列と、最長共通部分列生成の元となった広告情報マスタデータベース31のデータを含むフィールドの広告IDと、最長共通部分列生成の元となった製品情報マスタデータベース32のデータを含むフィールドの製品IDとを書き込む(ステップS314)。
そして、対応関係取得部202は、広告情報マスタデータベース31の選択フィールドの各データと製品情報マスタデータベース32の選択フィールドの各データとの全ての組み合わせについてステップS314の処理を行った後、ループL22およびL21を終了する(ステップS315、S316)。
【0066】
次に、対応関係取得部202は、広告情報フィールドデータベース34の初期化処理として、広告情報フィールドデータベース34を空行にする。そして、対応関係取得部202は、広告情報マスタデータベース31のデータから広告IDフィールドと選択フィールドとを抽出し、これらを対応付けたデータを広告情報フィールドデータベース34に書き込む(ステップS321)。
その後、同図の処理を終了する。
【0067】
図16は、対応関係取得部202が、広告情報マスタデータベース31のレコードと製品情報マスタデータベース32のレコードとの対応付けを行う処理手順を示すフローチャートである。対応関係取得部202は、図13のステップS103において同図の処理を行う。
まず、対応関係取得部202は、基本データベース36の初期化処理として、基本データベース36を空行にする(ステップS401)。
【0068】
次に、対応関係取得部202は、広告情報フィールドデータベース34の各レコードに対する処理のループL31を開始する(ステップS411)。ここで、ループL31において処理対象となっているレコードをレコードiにて表す。
対応関係取得部202は、製品情報フィールドデータベース35から、レコードiの広告IDを格納しているレコードを抽出する(ステップS412)。
【0069】
さらに、対応関係取得部202は、ステップS412で抽出した各レコードに対する処理のループL32を開始する(ステップS413)。ここで、ループL32において処理対象となっているレコードをレコードjにて表す。
対応関係取得部202は、レコードiの選択フィールドのデータと、レコードjの共通部分列フィールドのデータとの類似度を算出し(ステップS414)、類否判定を行う(ステップS415)。
【0070】
類似すると判定した場合(ステップS415:YES)、対応関係取得部202は、基本DBに1行追加し、追加した行に、レコードiに格納されている広告IDと、レコードiの選択フィールドのデータと、レコードjに格納されている製品IDと、レコードjの共通分裂フィールドのデータとを書き込み、さらに当該追加した行を識別する統合IDを生成して当該追加した行に書き込む(ステップS416)。
その後、ステップS417に進む。
【0071】
一方、ステップS415において、レコードiの選択フィールドのデータと、レコードjの共通部分列フィールドのデータとが類似しないと判定した場合(ステップS415:NO)、対応関係取得部202は、基本データベース36の行追加やデータの書込を行わずに、そのままステップS417に進む。
そして、対応関係取得部202は、ステップS412で抽出した全てのレコードに対する処理を完了した後、ループL32を終了し(ステップS417)、広告情報フィールドデータベース34の全てのレコードに対する処理を完了した後、ループL31を終了する(ステップS418)。
その後、同図の処理を終了する。
【0072】
図17は、キーワード付与部203が、広告情報マスタデータベース31の検索キーと、製品情報マスタデータベース32の検索キーと、素材ファイルデータベース33の検索キーとに、キーワードを対応付ける処理手順を示すフローチャートである。キーワード付与部203は、図13のステップS104において同図の処理を行う。
まず、キーワード付与部203は、キーワードデータベース37の初期化処理として、キーワードデータベース37を空行にする(ステップS501)。
【0073】
次に、キーワード付与部203は、基本データベース36の各レコードに対する処理のループL41を開始する(ステップS511)。ここで、ループL41において処理対象となっているレコードをレコードkにて表す。
キーワード付与部203は、レコードkから広告IDを読み出す。そして、キーワード付与部203は、読み出した広告IDに基づいて広告情報マスタデータベース31を検索し、当該広告IDによって特定されるレコードの、予め定められたフィールドから検索キーやキーワードを読み出す。本実施形態では、キーワード付与部203は、検索キーとして広告IDと素材IDとを読み出し、キーワードとして広告主名と、商品名と、仮名書きによる商品名とを読み出す。
そして、キーワード付与部203は、キーワードデータベース37に1行追加し、読み出した検索キーやキーワードを書き込む(ステップS512)。
【0074】
また、キーワード付与部203は、レコードkから製品IDを読み出す。そして、キーワード付与部203は、読み出した製品IDに基づいて製品情報マスタデータベース32を検索し、当該製品IDによって特定されるレコードの、予め定められたフィールドから検索キーやキーワードを読み出す。本実施形態では、キーワード付与部203は、検索キーとして製品IDを読み出し、キーワードとしてメーカ名と、製品名と、仮名書きによる製品名と、製品の種別情報とを読み出す。
そして、キーワード付与部203は、ステップS512で追加した行に、読み出した検索キーやキーワードを書き込む(ステップS513)。
そして、キーワード付与部203は、基本データベース36の全てのレコードに対する処理を完了した後、ループL41を終了する(ステップS514)。
その後、同図の処理を終了する。
【0075】
図18は、コンテンツ検索装置10が広告用コンテンツを提供する処理手順を示すフローチャートである。コンテンツ検索装置10は、図13〜図17で説明したキーワード付与装置20の処理が完了してキーワードデータベース37のデータが生成された後、同図の処理を行う。
まず、通信部101は、クライアント装置9から送信されるキーワードを待ち受ける(ステップS601)。そして、通信部101は、クライアント装置9からのキーワードを受信すると、当該キーワードをコンテンツ検索キー取得部102に出力する。
【0076】
次に、コンテンツ検索キー取得部102は、キーワードデータベース37の各レコードに対する処理のループL101を開始する(ステップS611)。ここで、ループL101にいて処理対象となっているレコードをレコードmにて表す。
コンテンツ検索キー取得部102は、レコードmに格納されている各キーワードと、クライアント装置9から送信されたキーワードとの類似度を算出し(ステップS612)、類否判定を行う(ステップS613)。例えば、フィールド選択部201や対応関係取得部202について上述したのと同様、コンテンツ検索キー取得部102は、近似文字列照合における編集距離に基づいて類否判定を行う。あるいは、コンテンツ検索キー取得部102が最長共通文字列長に基づいて類否判定を行うなど、他の方法によって類否判定を行うようにしてもよい。
【0077】
レコードmに格納されているキーワードの何れかと、クライアント装置9から送信されたキーワードとが類似すると判定した場合(ステップS613:YES)、コンテンツ検索キー取得部102が、レコードmから検索キーを読み出し、コンテンツ取得部103が、当該検索キーに基づいてデータベースを検索して広告用コンテンツを取得し、取得したコンテンツを通信部101に出力する。本実施形態では、製品名と、素材ファイルデータベース33に格納されているファイルとを、クライアント装置9に返信することが予め定められている。そこで、コンテンツ検索キー取得部102は、レコードmから製品IDを読み出し、読み出した製品IDをコンテンツ取得部103に出力する。コンテンツ取得部103は、コンテンツ検索キー取得部102から出力される製品IDに基づいて製品情報マスタデータベース32を検索して製品名を取得し、通信部101に出力する(ステップS614)。また、コンテンツ検索キー取得部102は、レコードmから素材IDを読み出し、読み出した素材IDをコンテンツ取得部103に出力する。コンテンツ取得部103は、コンテンツ検索キー取得部102から出力される素材IDに基づいて素材ファイルデータベース33を検索してコンテンツファイルを取得し、通信部101に出力する(ステップS615)。
その後、ステップS616に進む。
【0078】
一方、ステップS613において、レコードmに格納されているキーワードのいずれも、クライアント装置9から送信されたキーワードと類似しないと判定した場合(ステップS613:NO)、コンテンツ検索キー取得部102は、広告用コンテンツの取得を行わずにそのままステップS616に進む。
【0079】
そして、コンテンツ検索キー取得部102は、キーワードデータベース37の全てのレコードに対する処理を完了した後、ループL101を終了する(ステップS616)。
そして、通信部101は、ステップS614でコンテンツ取得部103から出力される製品名、および、ステップS615でコンテンツ取得部103から出力されるコンテンツファイルを、クライアント装置9に送信(返信)する(ステップS621)。
その後、ステップS601に戻り、同図の処理を繰り返す。
【0080】
以上のように、キーワード付与装置20が、広告用コンテンツの検索キーと、キーワードとの対応付けを行う。すなわち、キーワード付与装置20は、広告情報マスタデータベース31に格納されている検索キーに、製品情報マスタデータベース32に格納されているキーワードを付与し、製品情報マスタデータベース32に格納されている検索キーに、広告情報マスタデータベース31に格納されているキーワードを付与する。これにより、検索キーとキーワードとの対応付けを手作業で行う必要がない。従って、データ入力作業者の負担を軽減し、かつ、キーワードとデータ(広告用コンテンツ)との対応付けを行うことができる。
【0081】
また、対応関係取得部202は、広告情報マスタデータベース31の選択フィールドのデータと、製品情報マスタデータベース32の選択フィールドのデータとの最長共通部分列を用いてデータの類否判定を行うので、一方の選択フィールドのデータにのみ文字列が付加されている場合にも、適切に類否判定を行うことができる。これにより、キーワード付与部203が、検索キーとキーワードとの対応付けを適切に行うことができ、コンテンツ検索装置10は、クライアント装置9から送信されるキーワードに対して適切な広告用コンテンツを返信できる。
【0082】
なお、本発明の適用範囲は、上述した広告用コンテンツに限らない。キーワードと対応付け可能な様々なデータに対して本発明を適用し得る。
【0083】
なお、広告用コンテンツ提供システム1の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、コンパクトディスク等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0084】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0085】
1 広告用コンテンツ提供システム
10 コンテンツ検索装置
101 通信部
102 コンテンツ検索キー取得部
103 コンテンツ取得部
20 キーワード付与装置
201 フィールド選択部
202 対応関係取得部
203 キーワード付与部
31 広告情報マスタデータベース
32 製品情報マスタデータベース
33 素材ファイルデータベース
34 広告情報フィールドデータベース
35 製品情報フィールドデータベース
36 基本データベース
37 キーワードデータベース

【特許請求の範囲】
【請求項1】
第1のデータベースの何れかのフィールドが選択されると、第2のデータベースの各フィールドと、前記選択されたフィールドとの、データの類似度を算出し、類似度が最も高いと判定した前記第2のデータベースのフィールドを選択するフィールド選択部と、
前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行い、類似すると判定したデータを含む前記第1のデータベースのレコードと前記第2のデータベースのレコードとを対応付ける対応関係取得部と、
前記第1のデータベースに格納された情報と、当該情報を含むレコードに対応付けられた前記第2のデータベースのレコードから得られるキーワードとを対応付けるキーワード付与部と、
を具備することを特徴とするキーワード付与装置。
【請求項2】
前記第1のデータベースの前記選択されたフィールドの各データ、および、前記第2のデータベースの前記選択されたフィールドの各データは、いずれも文字列データであり、
前記対応関係取得部は、前記第1のデータベースの前記選択されたフィールドの各文字列データと、前記第2のデータベースの前記選択されたフィールドの各文字列データとの最長共通部分列を求め、前記第1のデータベースの前記選択されたフィールドの各文字列データ、または、前記第2のデータベースの前記選択されたフィールドの各文字列データのいずれかと、前記最長共通部分列との近似文字列照合における編集距離に基づいて、前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行うことを特徴とする請求項1に記載のキーワード付与装置。
【請求項3】
クライアント装置に提供されるデータであるコンテンツを格納するコンテンツデータベースと、
前記コンテンツデータベースにおける前記コンテンツの検索キーであるコンテンツ検索キーを格納する第1のデータベースと、
第2のデータベースと、
検索キーデータベースと、
キーワード付与装置と、
コンテンツ検索装置と、
を具備するコンテンツ提供システムであって、
前記キーワード付与装置は、
前記第1のデータベースの何れかのフィールドが選択されると、前記第2のデータベースの各フィールドと、前記選択されたフィールドとの、データの類似度を算出し、類似度が最も高いと判定した前記第2のデータベースのフィールドを選択するフィールド選択部と、
前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行い、類似すると判定したデータを含む前記第1のデータベースのレコードと前記第2のデータベースのレコードとを対応付ける対応関係取得部と、
前記第1のデータベースに格納された前記コンテンツ検索キーと、当該コンテンツ検索キーを含むレコードに対応付けられた前記第2のデータベースのレコードから得られるキーワードとを対応付けるキーワード付与部と、
前記キーワード付与部による対応付けを示す情報を、前記検索キーデータベースに書き込む対応情報書込部と、
を具備し、
前記コンテンツ検索装置は、
前記コンテンツデータベースに格納されたコンテンツを検索するための検索語が前記クライアント装置から送信されると、前記検索語に基づいて前記検索キーデータベースを検索してコンテンツ検索キーを取得するコンテンツ検索キー取得部と、
前記コンテンツ検索キー取得部の取得する前記コンテンツ検索キーに基づいて前記コンテンツデータベースを検索してコンテンツを取得するコンテンツ取得部と、
前記コンテンツ取得部の取得する前記コンテンツを前記クライアント装置に送信する通信部と、
を具備することを特徴とするコンテンツ提供システム。
【請求項4】
キーワード付与装置のキーワード付与方法であって、
第1のデータベースの何れかのフィールドが選択されると、第2のデータベースの各フィールドと、前記選択されたフィールドとの、データの類似度を算出し、類似度が最も高いと判定した前記第2のデータベースのフィールドを選択するフィールド選択ステップと、
前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行い、類似すると判定したデータを含む前記第1のデータベースのレコードと前記第2のデータベースのレコードとを対応付ける対応関係取得ステップと、
前記第1のデータベースに格納された情報と、当該情報を含むレコードに対応付けられた前記第2のデータベースのレコードから得られるキーワードとを対応付けるキーワード付与ステップと、
を具備することを特徴とするキーワード付与方法。
【請求項5】
コンピュータに、
第1のデータベースの何れかのフィールドが選択されると、第2のデータベースの各フィールドと、前記選択されたフィールドとの、データの類似度を算出し、類似度が最も高いと判定した前記第2のデータベースのフィールドを選択するフィールド選択ステップと、
前記第1のデータベースの前記選択されたフィールドの各データと、前記第2のデータベースの前記選択されたフィールドの各データとの類否判定を行い、類似すると判定したデータを含む前記第1のデータベースのレコードと前記第2のデータベースのレコードとを対応付ける対応関係取得ステップと、
前記第1のデータベースに格納された情報と、当該情報を含むレコードに対応付けられた前記第2のデータベースのレコードから得られるキーワードとを対応付けるキーワード付与ステップと、
を実行させるためのプログラム。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate