説明

コンテンツ提供装置

【課題】大量のコンテンツから希望するコンテンツを迅速に抽出するとともに、コンテンツ取得のための操作を容易にする。
【解決手段】利用者から発せられた音声に基づきコンテンツを検索し、当該コンテンツをクライアント端末に提供するためのコンテンツ提供装置であり、コンテンツが属するジャンル毎にコンテンツ用音声辞書を備え、利用者から発せられたコンテンツを示す音声から音声認識により得られた語の読みを受信し、当該コンテンツのジャンルに対応したコンテンツ用音声辞書を選択し、そのコンテンツ用音声辞書を用いて当該読みに対応するキーワードを取得し、当該キーワードを用いてコンテンツ用属性情報データベースを検索する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、大量のコンテンツの中から視聴者が希望するコンテンツを音声認識を用いて抽出する技術に関するものである。
【背景技術】
【0002】
現在、インターネット等のネットワークに接続されたパソコンやテレビ等の端末を用いることにより、様々な動画を視聴することが可能である。このようなネットワークを介した動画配信サービスでは、センター側に蓄積された番組の中から、利用者が自分の好きな番組を選択して視聴することが可能である。
【0003】
しかしながら、提供する番組の数が大量になると、センター側は利用者からの選択要求に対し迅速に検索処理を行うことができず、スムーズにサービスを提供することができなくなるという問題がある。また、パソコンのキーボードの操作やリモコンの操作に慣れていない人にとっては番組を選択するための操作が面倒であるという問題もある。
【0004】
なお、番組の検索に関連する従来技術として、特許文献1に開示された技術がある。
【特許文献1】特開2004-336394号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
本発明は上記の点に鑑みてなされたものであり、大量のコンテンツから利用者が希望するコンテンツを迅速に抽出するとともに、利用者にとってコンテンツ取得のための操作を容易にすることができる技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記の課題は、利用者から発せられた音声に基づきコンテンツを検索し、当該コンテンツをクライアント端末に提供するためのコンテンツ提供装置であって、コンテンツのジャンルを示すキーワードとその読みを格納したジャンル用音声辞書と、コンテンツが属するジャンル毎に備えられた、コンテンツを示すキーワードとその読みを格納したコンテンツ用音声辞書と、ジャンルの属性情報をジャンル毎に格納したジャンル属性情報データベースと、コンテンツの属性情報をコンテンツ毎に格納したコンテンツ属性情報データベースと、利用者から発せられたジャンルを示す音声から音声認識により得られた語の読みを受信し、前記ジャンル用音声辞書を用いて当該読みに対応するキーワードを取得し、前記ジャンル用属性情報データベースから当該キーワードに対応するジャンルの属性情報を取得するジャンル取得手段と、前記ジャンルの属性情報が当該ジャンルに対応するコンテンツが存在することを示す場合に、前記コンテンツ属性情報データベースから当該ジャンルに対応するコンテンツ名を取得し、前記クライアント端末に表示するコンテンツ名取得手段と、利用者から発せられたコンテンツを示す音声から音声認識により得られた語の読みを受信し、前記ジャンルに対応したコンテンツ用音声辞書を選択し、そのコンテンツ用音声辞書を用いて当該読みに対応するキーワードを取得し、前記コンテンツ用属性情報データベースから当該キーワードに対応するコンテンツの所在情報を取得するコンテンツ情報取得手段と、当該所在情報を用いて前記コンテンツを前記クライアント端末に提供する手段とを備えたことを特徴とするコンテンツ提供装置により解決できる。
【0007】
前記ジャンルの属性情報が当該ジャンルに対応するコンテンツが存在しないことを示す場合に、当該ジャンルに関連付けられたジャンル名を前記クライアント端末に送信する。
【0008】
前記コンテンツ提供装置は、前記コンテンツ属性情報データベースに格納されるコンテンツ属性情報からキーワードを抽出し、前記コンテンツ用音声辞書に登録する手段を備えてもよい。た請求項1に記載のコンテンツ提供装置。また、利用者から発せられた音声に基づき取得したキーワードを格納するログ情報データベースを更に備え、当該ログ情報データベースに格納されたキーワードを用いて一時的な音声辞書を作成する手段を備えてもよい。また、前記コンテンツ名取得手段は、当該ログ情報データベースに格納された各キーワードの出現頻度の時間的変化の情報を用いることにより、複数のコンテンツの間で優先度を付け、前記クライアント端末に対し優先度順にコンテンツ名を表示することとしてもよい。
【発明の効果】
【0009】
本発明によれば、音声認識を用いるので視聴者は容易に所望のコンテンツを検索できる。また、コンテンツが属するジャンル毎にコンテンツ用音声辞書を備え、検索対象のジャンルに応じたコンテンツ用音声辞書を選択して用いることとしたので、大量のコンテンツを迅速に検索することが可能となる。
【発明を実施するための最良の形態】
【0010】
以下、図面を参照して本発明の実施の形態を説明する。
【0011】
(システムの概要)
図1に本発明の実施の形態におけるシステム構成を示す。図1に示すように、本システムは、動画配信サーバ1を備えたデータセンタ2と、TV等の表示装置3が接続されたクライアント端末4とがインターネット5に接続された構成を有している。また、クライアント側では、マイク付リモコン等の音声入力装置6を用いることにより、クライアント端末4に対して音声入力を行うことが可能である。
【0012】
本システムでは、視聴者からの番組選択に関する指示音声が音声入力装置6に入力され、クライアント端末4で音声認識され、音声認識の結果得られた語の読みに基づき動画配信サーバ1にて番組の抽出が行われる。番組はジャンルに分類されており、視聴者はジャンル毎に番組を選択することが可能である。また、ジャンルは例えば階層化といった形で互いに関連付けられており、例えば上位の階層から下位の階層へとジャンルを辿ることが可能である。
【0013】
動画配信サーバ1は、ジャンルを示すキーワードとその読みを格納したジャンル用音声辞書と、番組が属するジャンル毎に備えられ、番組を示すキーワードとその読みを格納した複数の番組用音声辞書と、ジャンルのメタデータ(属性情報)をジャンル毎に格納したジャンルメタデータDBと、番組のメタデータを番組毎に格納した番組メタデータDBを備えている。
【0014】
以下、フローチャートを参照して本システムにおける操作及び動作の概要を説明する。
【0015】
図2は、ジャンルが表示装置3に表示されてから、番組選択画面が表示されるまでのフローチャートである。以下、ジャンルが階層化されている場合について説明する。
【0016】
まず、クライアント端末4に接続された表示装置3にジャンル階層における最上段のジャンル一覧が表示される(ステップ1)。次に、表示装置3から「希望のジャンルを呼称して下さい」等の音声ガイダンスが流される(ステップ2)。ここで視聴者は表示装置3に表示されたジャンルの中から希望するジャンルを選択して呼称してもよいし、表示装置3に表示されたジャンル以外のキーワードを呼称してもよい。
【0017】
視聴者が表示されたジャンルもしくはキーワードを呼称することにより(ステップ3)、呼称された音声はクライアント端末4に入力され、クライアント端末4にて音声認識され、呼称内容に対応した語の読みが取得される。この読みは動画配信サーバ1に送られ、動画配信サーバ1はジャンル用音声辞書を用いてキーワード探索を行う(ステップ4)。なお、探索に用いられたキーワードは適宜利用情報ログに蓄積される。
【0018】
探索の結果、ジャンル用音声辞書内に登録されたキーワードを抽出することができた場合、当該キーワードを用いて動画配信サーバ1内のジャンルメタデータDBからジャンル情報(ジャンルメタデータ)を抽出する(ステップ5)。
【0019】
音声認識されたキーワードからジャンル用音声辞書内に登録されたキーワードを抽出することができなかった場合には、その旨の通知がクライアント端末4になされ、表示装置3から該当キーワードなしのメッセージが音声で出力される(ステップ6)。そして、表示装置3は最初に表示されていたジャンル一覧を再表示する(ステップ7)。その後はステップ2からの処理が再度実行される。
【0020】
ステップ5において取得したジャンルの情報において番組フラグが立っていた場合、動画配信サーバ1はそのジャンルに対応付けられた番組が存在すると判断し、そのジャンルに対応する番組選択画面を表示装置3に表示する(ステップ8)。番組が複数ある場合には人気度順に番組を表示する。
【0021】
ステップ5において取得したジャンルの情報において番組フラグが立っていない場合、動画配信サーバ1は、当該ジャンルのすぐ下に属するジャンルを取得し、その一覧をクライアント端末4に送信し、表示装置3はそのジャンル一覧を表示する(ステップ9)。そして、ステップ2からの処理が再度実行される。
【0022】
次に、図3のフローチャートを参照して番組選択画面を表示してから番組が放映されるまでの動作について説明する。
【0023】
ステップ8の後、表示装置3は「番組名を呼称して下さい」等の音声によるガイダンスメッセージを出力する(ステップ10)。ここで視聴者は、表示装置3に表示された番組の中から希望の番組を選択して呼称してもよいし、表示装置3に表示されていない番組名を呼称してもよい。
【0024】
視聴者が表示された番組名もしくは表示されていないキーワード(番組名)を呼称することにより(ステップ11)、呼称された音声はクライアント端末4に入力され、クライアント端末4にて音声認識され、呼称内容に対応した語の読みが抽出される。この読みは動画配信サーバ1に送られ、動画配信サーバ1は、ステップ5において取得し、保持しておいたジャンルに対応する番組用音声辞書を選択し、その番組用音声辞書を用いてキーワード探索を行う(ステップ12)。また、探索に用いられたキーワードは適宜利用情報ログに蓄積される。
【0025】
探索の結果、音声認識された読みから番組用音声辞書内に登録されたキーワードを抽出することができた場合、当該キーワードを用いて動画配信サーバ1内の番組メタデータDBから番組情報(番組メタデータ)を抽出する(ステップ13)。
【0026】
音声認識された読みから番組用音声辞書内に登録されたキーワードを抽出することができなかった場合には、その旨の通知がクライアント端末4になされ、表示装置3から該当キーワードなしのメッセージが音声で出力される(ステップ14)。そして、クライアント端末4は番組選択画面を再表示する(ステップ15)。その後はステップ10からの処理が再度実行される。
【0027】
ステップ13において取得した番組が1つであれば当該番組のメタデータから当該番組の所在情報を取得し、その所在情報に基づき番組が放映される(ステップ16)。ステップ13において取得した番組が複数であれば、複数の番組の一覧を表示装置3に表示し、ステップ10からの処理が再度実行される(ステップ17)。
【0028】
(詳細機能構成)
次に、クライアント端末4と動画配信サーバ1の詳細機能構成について図4を参照して説明する。
【0029】
図4に示すように、クライアント端末4は、IP放送変換・接続部41、音声認識部42、キャッシュ辞書使用判断部43、辞書選択機能部44、外部通信機能部45、及びキャッシュ辞書46を有している。
【0030】
IP放送変換・接続部41は動画配信サーバ1から配信される動画等を表示装置3に表示するための変換処理等を行う。音声認識部42は音声入力装置6から受信した音声に対して音響特徴を分析し、認識辞書を用いて音響特徴を「読み」に変換し、その「読み」を出力する。
【0031】
キャッシュ辞書使用判断部43はクライアント端末4に存在するキャッシュ辞書46を使用するか、動画配信サーバ1に存在する音声辞書を使用するかの判断を行う。辞書選択機能部44はキャッシュ辞書46を用いる場合に使用される機能部であり、キャッシュ辞書の中から最適な音声辞書を選択し、選択した音声辞書からキーワードを取得する。
【0032】
外部通信機能部45はインターネット等のネットワークを介して外部との通信を行うための機能部。キャッシュ辞書46内のオリジナル音声辞書には視聴者から発声された読みとキーワードとが蓄積される。これは例えば一連の操作の間だけ蓄積するようにしてもよいし、上限を決めて蓄積していき、所定の時間が経過したものから消去していくようにしてもよい。
【0033】
クライアント端末4はCPU及び記憶装置等を備えたコンピュータに上記各機能部の処理を実行するためのプログラムを搭載して実現することが可能である。
【0034】
次に、動画配信サーバ1の機能構成について説明する。図4に示すように、動画配信サーバ1は、辞書選択機能部11、ジャンル用音声辞書12と番組用音声辞書13を含む音声辞書14、全文検索機能部15、辞書メンテナンス機能部16、賑い抽出機能部17、関連キーワード抽出機能部18、データ記録部19、及び外部通信機能部20を有している。
【0035】
辞書選択機能部11は、ジャンル選択か番組選択かの場面に応じてジャンル用音声辞書12もしくは番組用音声辞書13の選択を行うとともに、対象ジャンルに対応した番組用音声辞書を選択し、選択した辞書からキーワードを取得する。
【0036】
ジャンル用音声辞書12はジャンル名をキーワードとする音声辞書であり、用意されている全てのジャンルを示すキーワードとその読みが登録されている。番組用音声辞書13は番組を検索する際に使うキーワードを抽出するための音声辞書である。全文検索機能部15はキーワードを検索キーとして、ジャンルメタデータDBもしくは番組用メタデータDBを対象に全文検索を行う。辞書メンテナンス機能部16は番組用メタデータの中の「番組概要」から形態素解析技術によりキーワードを抽出し、当該キーワードとその読みを番組用音声辞書に登録する。キーワードに対する読みは、キーワードがかなであればそのまま読みとして用い、キーワードが漢字であればその漢字をかなに変換して読みとして用いることが可能である。賑い抽出機能部17は、利用情報ログから、最近になって多くの視聴者に使われたキーワードを抽出する。
【0037】
関連キーワード抽出機能部18は利用情報ログや関連キーワード蓄積部から、例えば次に使われる可能性が高いキーワードを抽出する。外部通信機能部20はインターネット等のネットワークを介して外部との通信を行う。
【0038】
データ記録部における番組メタデータDBは番組名、キーワード、概要文、ジャンル名等といった番組属性情報(メタデータ)を番組毎に格納するものである。ジャンルメタデータDBはジャンル名、キーワード、親ジャンル、子ジャンル、ジャンルの概要文、番組フラグといった、ジャンルの属性情報をジャンル毎に格納するものである。動画DBは動画ファイルそのものを格納するものである。なお、動画DBは他のサーバに備えられていてもよい。
【0039】
利用情報ログDBには、動画配信サーバ1に接続されるクライアント端末4の利用者(視聴者)が発声した読みに対応するキーワード等が記録される。関連キーワード蓄積部には、キーワードと、そのキーワードと関連が深いキーワードが対にして格納されている。関連キーワード蓄積部に格納する情報は動画配信業者が予め登録しておく。また、賑い抽出結果DBには、最近になって頻繁に使用されているキーワードが格納される。なお、キャッシュ辞書を動画配信サーバ1に備えてもよい。
【0040】
動画配信サーバ1はCPU及び記憶装置等を備えたコンピュータに上記各機能部の処理を実行するためのプログラムを搭載して実現することが可能である。
【0041】
図5に、本発明の実施の形態におけるジャンルと番組の構成概念図を示す。図5に示すように、本実施の形態のジャンルは多段の階層構成となっており、最下層の各ジャンルに関連付けて番組が存在する。なお、番組は最下層ジャンルの下だけでなく、ルート配下のどのジャンルに関連付けてもよい。また、複数のジャンルに関連付けてもよい。例えば、図5に示す番組「日本のおいしい寿司」を“寿司”と“グルメ”に関連付けることができる。ジャンルの構成はこのような階層構成に限られるものではなく、互いに関連付けできるものであればどのような構成でもよい。
【0042】
図6に、音声辞書の構成の概念図を示す。図6に示すように、ジャンル用音声辞書にはジャンルを示すキーワードと読みが登録される。番組用音声辞書はジャンル毎に備えられ、各番組用音声辞書には、対応するジャンルに属する番組のキーワードと読みが登録される。番組用音声辞書には予め事業者が用意しておくキーワードに加えて、番組用メタデータから自動的に抽出したキーワードを当該番組の属するジャンルの配下の番組を表すキーワードとして登録しておくことができる。
【0043】
図7(a)〜(e)に各データのデータ項目例を示す。
【0044】
図7(a)は音声辞書のデータ項目例を示す図である。図7(a)に示すように、音声辞書には読みとキーワードが格納される。なお、1つの読みに対して複数のキーワードが登録される場合もあるし、1つのキーワードに対して複数の読みが登録される場合もある。
【0045】
図7(b)はジャンルメタデータDBに登録されるジャンルメタデータのデータ項目例を示す図である。図7(b)に示すように、ジャンルメタデータは、ジャンル名、キーワード、親ジャンル、子ジャンル、概要文、番組フラグを含む。ここでのキーワードは音声辞書に登録されているものと同じであり、検索キーに相当する。親ジャンルは自分の親のジャンルである。子ジャンルは自分の配下に属するジャンルである。概要文は当該ジャンルの概要をテキストで記述したものである。番組フラグは自分の配下に番組が存在するか否かを示すフラグであり、フラグが立っている場合に番組が存在することを示す。動画配信サーバ1は、ジャンル検索時に、フラグが立っていることを検出すると番組メタデータDBから、当該ジャンルに属する番組の検索を実行する。
【0046】
図7(c)に、番組メタデータDBに登録される番組メタデータのデータ項目例を示す。図7(c)に示すように、番組メタデータは番組名、キーワード、概要文、ジャンル名。動画DB上のポインタを含む。ここでのキーワードは番組の特徴を表す言葉である。概要文は番組の概要を表す文である。ジャンル名は番組が属するジャンルの名前である。動画DB上のポインタは、番組が動画DBのどの場所に格納されているかを示すポインタである。
【0047】
また、図7(d)に示すように、関連キーワード蓄積部には番組メタデータ、ジャンルメタデータで使用されているキーワードと、当該キーワードと関連が深いキーワードが格納されている。また、図7(e)に示すように、利用情報ログDBには、視聴者が発した音声に基づくキーワード、当該キーワードの次に発せられたキーワード、及び次に発せられたキーワードの登録日時が記録される。なお、利用情報ログDBには利用者毎にこれらに情報が記録される。もちろん、キーワードと読みを登録してもよいし、キーワード毎にそのキーワードが記録された日時を登録してもよい。
【0048】
(処理シーケンス)
次に、シーケンスチャートを参照して図4の構成を持つシステムの動作例を詳細に説明する。
【0049】
まず、図8に示すシーケンスチャートを参照して、最上段のジャンルが表示された後に選択されたジャンルの配下のジャンルが表示されるまでの処理の一例を詳細に説明する。
【0050】
視聴者がキーワードを発声すると、その音声が音声認識部42に入力される(ステップ31)。キャッシュ辞書使用判断部43がキャッシュ辞書の有無を判定した後(図8ではキャッシュ辞書が無の場合を示している)、音声認識部42による音声認識結果(読み)が動画配信サーバ1に送られる(ステップ32、33)。動画配信サーバ1では、辞書選択機能部11が音声辞書を選択する。現時点はジャンルを選択する段階であるため、辞書選択機能部11はジャンル用音声辞書を選択し、音声認識結果を用いてジャンル用音声辞書を検索し、キーワードを抽出する(ステップ34)。その後、キーワードは全文検索機能部15に渡され(ステップ35)、全文検索機能部15がジャンルメタデータDBを検索することにより、当該キーワードに対応するジャンル名とその配下にあるジャンル名を取得する(ステップ36)。そして、動画配信サーバ1は取得したジャンル名とその配下にあるジャンル名をクライアント端末4に送信し(ステップ37)、クライアント端末4側では発声されたジャンル名とその配下のジャンル名の一覧が表示される(ステップ38)。
【0051】
次に、クライアント端末4のオリジナル音声辞書にキャッシュ辞書となるキーワードと読みを登録する処理について説明する。この処理はジャンル名等取得の直後に行う。また、ジャンル表示等の処理と非同期に行うようにしてもよい。図8では破線矢印で処理の流れを示している。
【0052】
利用情報ログDBには、ジャンル取得等のために使用されたキーワードが随時記録される(ステップ40)。そして、関連キーワード抽出機能部18は、ジャンル取得等のための使用されたキーワードを用いて、関連キーワード蓄積部及び利用情報ログDBから当該キーワードに関連するキーワード群を抽出する(ステップ41〜43)。特に利用情報ログDBからは、当該キーワードの次に使用されたキーワードが、関連キーワードとして抽出される。なお、このキーワードは当該視聴者のものに限られず、他の視聴者のものでもよい。そして、これらの抽出されたキーワードがクライアント端末4のオリジナル音声辞書に登録される(ステップ44)。オリジナル音声辞書にはキーワードに加えてその読みも登録される。これらの処理は番組取得のために使用されたキーワードに対しても随時実行され、オリジナル辞書が作成される。上記のように、あるキーワードの次に使用されたキーワードや、関連するキーワードを登録することにより、クライアント端末4では、あるキーワード(語)を発声した後に、次に発声した語がキャッシュ辞書でヒットする可能性が高くなる。
【0053】
次に、図9のシーケンスチャートを参照して番組一覧が表示されるまでのシステムの動作について説明する。図9に示す例ではクライアント端末4にキャッシュ辞書が存在しているものとする。
【0054】
視聴者によるキーワード発声、音声認識部42による音声認識の後、キャッシュ辞書使用判断部43はキャッシュ辞書内でデータがあると判断し、キャッシュ辞書を使用することを決定する(ステップ50、51)。そして、辞書選択機能部44がオリジナル音声辞書から音声認識結果(読み)に対応するキーワードを取得し、そのキーワードを動画配信サーバ1に送信する(ステップ52〜54)。
【0055】
動画配信サーバ1では、全文検索機能部15が、受信したキーワードに該当するジャンルメタデータ(ジャンル名等)をジャンルメタデータDBから取得し(ステップ55)、当該ジャンルメタデータに番組フラグが立っていることを確認すると、当該ジャンルに属する番組名を番組メタデータDBから取得する(ステップ56)。そして、全文検索機能部15は、賑い抽出結果DBを参照し、ステップ56で取得した番組の優先度を決定する(ステップ57)。そして優先度付けされた番組名をクライアント端末4に送信し、クライアント端末4側では優先度に従った順番で番組名一覧が表示される(ステップ58、59)。例えば、優先度の高い番組名は画面内で上に表示される。
【0056】
次に、図9で破線矢印で示している賑い抽出処理について説明する。この処理は番組名取得等の処理と非同期に行われるものである。賑い抽出機能部17は、所定のタイミングで、利用情報ログDBから、最近になって頻繁に使用されているキーワードを抽出する(ステップ60)。例えば、ログを5世代に区切り、5世代前は使われていなかったが、最新世代でよく使われているものを抽出する。つまり、5世代前は全く使われておらず、最新世代で使われる回数の大きさに応じて順位付けして賑い抽出結果として記録する(ステップ61)。このような賑い抽出結果を用いることにより、視聴者は最近話題となっている番組を容易に選択できるようになる。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。例えば、本発明は動画像検索に限らず静止画像、文書等の他のコンテンツの検索に用いることも可能である。
【図面の簡単な説明】
【0057】
【図1】本発明の実施の形態におけるシステム構成図である。
【図2】ジャンルが表示されてから、番組選択画面が表示されるまでのフローチャートである。
【図3】番組選択画面が表示されてから、番組が放映されるまでのフローチャートである。
【図4】クライアント端末4と動画配信サーバ1の詳細機能構成図である。
【図5】ジャンルと番組の構成概念図である。
【図6】音声辞書の構成の概念図である。
【図7】各データの項目例を示す図である。
【図8】最上段のジャンルが表示された後に選択されたジャンルの配下のジャンルが表示されるまでのシーケンスである。
【図9】番組一覧が表示されるまでのシーケンスである。
【符号の説明】
【0058】
1 動画配信サーバ
2 データセンタ
3 表示装置
4 クライアント端末
5 インターネット
6 音声入力装置
11 辞書選択機能部
12 ジャンル用音声辞書
13 番組用音声辞書
14 音声辞書
15 全文検索機能部
16 辞書メンテナンス機能部
17 賑い抽出機能部
18 関連キーワード抽出機能部
19 データ記録部
20 外部通信機能部
41 IP放送変換・接続部
42 音声認識部
43 キャッシュ辞書使用判断部
44 辞書選択機能部
45 外部通信機能部
46 キャッシュ辞書

【特許請求の範囲】
【請求項1】
利用者から発せられた音声に基づきコンテンツを検索し、当該コンテンツをクライアント端末に提供するためのコンテンツ提供装置であって、
コンテンツのジャンルを示すキーワードとその読みを格納したジャンル用音声辞書と、
コンテンツが属するジャンル毎に備えられた、コンテンツを示すキーワードとその読みを格納したコンテンツ用音声辞書と、
ジャンルの属性情報をジャンル毎に格納したジャンル属性情報データベースと、
コンテンツの属性情報をコンテンツ毎に格納したコンテンツ属性情報データベースと、
利用者から発せられたジャンルを示す音声から音声認識により得られた語の読みを受信し、前記ジャンル用音声辞書を用いて当該読みに対応するキーワードを取得し、前記ジャンル用属性情報データベースから当該キーワードに対応するジャンルの属性情報を取得するジャンル取得手段と、
前記ジャンルの属性情報が当該ジャンルに対応するコンテンツが存在することを示す場合に、前記コンテンツ属性情報データベースから当該ジャンルに対応するコンテンツ名を取得し、前記クライアント端末に表示するコンテンツ名取得手段と、
利用者から発せられたコンテンツを示す音声から音声認識により得られた語の読みを受信し、前記ジャンルに対応したコンテンツ用音声辞書を選択し、そのコンテンツ用音声辞書を用いて当該読みに対応するキーワードを取得し、前記コンテンツ用属性情報データベースから当該キーワードに対応するコンテンツの所在情報を取得するコンテンツ情報取得手段と、
当該所在情報を用いて前記コンテンツを前記クライアント端末に提供する手段と
を備えたことを特徴とするコンテンツ提供装置。
【請求項2】
前記ジャンルの属性情報が当該ジャンルに対応するコンテンツが存在しないことを示す場合に、当該ジャンルに関連付けられたジャンル名を前記クライアント端末に送信する請求項1に記載のコンテンツ提供装置。
【請求項3】
前記コンテンツ属性情報データベースに格納されるコンテンツ属性情報からキーワードを抽出し、前記コンテンツ用音声辞書に登録する手段を備えた請求項1に記載のコンテンツ提供装置。
【請求項4】
利用者から発せられた音声に基づき取得したキーワードを格納するログ情報データベースを更に備え、当該ログ情報データベースに格納されたキーワードを用いて一時的な音声辞書を作成する手段を備えた請求項1に記載のコンテンツ提供装置。
【請求項5】
利用者から発せられた音声に基づき取得したキーワードを格納するログ情報データベースを更に備え、前記コンテンツ名取得手段は、当該ログ情報データベースに格納された各キーワードの出現頻度の時間的変化の情報を用いることにより、複数のコンテンツの間で優先度を付け、前記クライアント端末に対し優先度順にコンテンツ名を表示する請求項1に記載のコンテンツ提供装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2007−199315(P2007−199315A)
【公開日】平成19年8月9日(2007.8.9)
【国際特許分類】
【出願番号】特願2006−16989(P2006−16989)
【出願日】平成18年1月25日(2006.1.25)
【出願人】(000102717)エヌ・ティ・ティ・ソフトウェア株式会社 (43)
【出願人】(500040964)エヌ・ティ・ティ番号情報株式会社 (4)
【Fターム(参考)】