説明

データ処理装置及びデータ処理装置制御プログラム

話者の種類、発話語彙、発話様式、発話環境等の特定条件により多様化する特徴パラメータの分布を考慮して不特定話者用の音響モデルを生成するのに好適で、且つ、特定の個人の音声に最も適合した不特定話者用の音響モデルを提供するのに好適なデータ処理装置及びデータ処理装置制御プログラムを提供する。 データ処理装置1を、データ分類部1aと、データ記憶部1bと、パターンモデル生成部1cと、データ制御部1dと、数学的距離算出部1eと、パターンモデル変換部1fと、パターンモデル表示部1gと、領域区分部1hと、区分内容変更部1iと、領域選択部1jと、特定パターンモデル生成部1kと、を含んだ構成とした。


Notice: Undefined index: DEJ in /mnt/www/gzt_disp.php on line 298

【特許請求の範囲】
【請求項1】
複数対象に係る複数の所定データを、複数の特定条件に基づき、複数のグループに分類するデータ分類手段と、
前記データ分類手段によって分類された前記所定データに基づき、当該所定データの各グループ毎に4次元以上の高次元の要素を有する複数のパターンモデルを生成するパターンモデル生成手段と、
前記パターンモデル生成手段によって各グループ毎に生成されたパターンモデルの各パターンモデル相互間の数学的距離を算出する数学的距離算出手段と、
前記数学的距離算出手段によって算出された前記数学的距離に基づき、前記各パターンモデル相互間の距離関係を保持しながら、前記複数のパターンモデルをこれより低次元の同数のパターンモデル対応低次元ベクトルへと変換するパターンモデル変換手段と、
前記複数のパターンモデル対応低次元ベクトルを、低次元の要素の値に基づき、前記距離関係を保持した状態で、前記パターンモデル対応低次元ベクトルと同じ次元の低次元空間上の座標点として表示するパターンモデル対応低次元ベクトル表示手段と、を備えることを特徴とするデータ処理装置。
【請求項2】
前記複数対象に係る複数の所定データは、音声データ、生活周囲音データ、鳴声データ、画像データ、赤外線データ及び加速度データのいずれか1つであることを特徴とする請求の範囲第1項記載のデータ処理装置。
【請求項3】
前記複数対象に係る複数の所定データは、複数話者の発声した複数の音声のデータであり、
前記複数の特定条件は、少なくとも、話者の種類、発話語彙、発話様式及び発話環境を含むことを特徴とする請求の範囲第1項記載のデータ処理装置。
【請求項4】
前記データ分類手段は、前記複数の特定条件をそれぞれ任意に組み合わせた各組毎に前記グループを形成することを特徴とする請求の範囲第1項又は請求の範囲第2項記載のデータ処理装置。
【請求項5】
前記パターンモデルは、HMM(Hidden Markov Model)によって生成されることを特徴とする請求の範囲第1項乃至請求の範囲第3項のいずれか1項に記載のデータ処理装置。
【請求項6】
前記数学的距離算出手段は、前記HMMによって生成された、前記パターンモデルの正規分布の平均ベクトルに基づくユークリッド距離、前記パターンモデルの正規分布の標準偏差により正規化された当該パターンモデルの正規分布の平均ベクトルに基づくユークリッド距離、及び、前記パターンモデルの正規分布に基づくバタチャリア距離のいずれか1つを用いて前記数学的距離を算出することを特徴とする請求の範囲第5項記載のデータ処理装置。
【請求項7】
前記パターンモデル変換手段は、Sammon法を用いて、前記パターンモデルを前記パターンモデル対応低次元ベクトルへと変換することを特徴とする請求の範囲第1項乃至請求の範囲第6項のいずれか1項に記載のデータ処理装置。
【請求項8】
前記パターンモデル対応低次元ベクトル表示手段によって前記低次元空間上に表示される前記複数のパターンモデル対応低次元ベクトルの座標点を、前記低次元空間上において複数の領域に自動的に区分する領域区分手段を備えることを特徴とする請求の範囲第1項乃至請求の範囲第7項のいずれか1項に記載のデータ処理装置。
【請求項9】
前記領域区分手段は、前記複数のパターンモデル対応低次元ベクトルを、当該全パターンモデル対応低次元ベクトルの座標点の重心を中心とし且つ前記重心と当該重心から最も離れた位置のパターンモデル対応低次元ベクトルの座標点との距離を半径とした1つの外円と、前記重心を中心とし且つ前記外円よりも小さな半径のn個の内円(nは1以上の整数)と、により区分し、更に、前記外円及び内円からなる複数の同心円同士の各外周間に形成される環状の領域を、半径方向に伸びる線によって複数に区分することを特徴とする請求の範囲第8項記載のデータ処理装置。
【請求項10】
前記領域区分手段によって自動区分された区分内容を変更する区分内容変更手段を備えることを特徴とする請求の範囲第8項又は請求の範囲第9項記載のデータ処理装置。
【請求項11】
前記領域区分手段によって区分された各領域毎に複数の前記パターンモデル対応低次元ベクトルを選択可能な領域選択手段と、当該領域選択手段によって選択された領域内にある前記複数のパターンモデル対応低次元ベクトルにそれぞれ対応する前記パターンモデルに係る、前記所定データに基づき、前記パターンモデルを生成する領域パターンモデル生成手段と、を備えることを特徴とする請求の範囲第8項乃至請求の範囲第10項のいずれか1項に記載のデータ処理装置。
【請求項12】
請求の範囲第1項記載のデータ処理装置を制御するためのコンピュータが実行可能なプログラムであって、
複数対象に係る複数の所定データを、複数の特定条件に基づき、複数のグループに分類するデータ分類ステップと、
前記データ分類ステップにおいて分類された前記所定データに基づき、当該所定データの各グループ毎に4次元以上の高次元の要素を有する複数のパターンモデルを生成するパターンモデル生成ステップと、
前記パターンモデル生成ステップにおいて各グループ毎に生成されたパターンモデルの各パターンモデル相互間の数学的距離を算出する数学的距離算出ステップと、
前記数学的距離算出ステップにおいて算出された前記数学的距離に基づき、前記各パターンモデル相互間の距離関係を保持しながら、前記複数のパターンモデルをこれより低次元の同数のパターンモデル対応低次元ベクトルへと変換するパターンモデル変換ステップと、
前記複数のパターンモデル対応低次元ベクトルを、低次元の要素の値に基づき、前記距離関係を保持した状態で、前記パターンモデル対応低次元ベクトルと同じ次元の低次元空間上の座標点として表示するパターンモデル対応低次元ベクトル表示ステップと、を備えることを特徴とするデータ処理装置制御プログラム。
【請求項13】
前記パターンモデル対応低次元ベクトル表示ステップにおいて低次元空間上に表示される前記複数のパターンモデル対応低次元ベクトルを、前記低次元空間上において複数の領域に自動的に区分する領域区分ステップと、
前記領域区分ステップによって自動区分された区分内容を変更する区分内容変更ステップと、
前記領域区分ステップによって区分された各領域毎に複数の前記パターンモデル対応低次元ベクトルを選択する領域選択ステップと、
前記領域選択ステップによって選択された領域内の前記パターンモデル対応低次元ベクトルに対応する前記パターンモデルに係る、前記所定データに基づき、選択領域に対応した前記パターンモデルを生成する領域パターンモデル生成ステップと、を備えることを特徴とする請求の範囲第12項記載のデータ処理装置制御プログラム。
【請求項14】
請求の範囲第1項乃至請求の範囲第7項のいずれか1項に記載のデータ処理装置によって表示された前記低次元空間上の座標点を、前記低次元空間上において複数の領域に自動的に区分する領域区分手段と、
前記区分された領域内に含まれる前記パターンモデル対応低次元ベクトルの座標点に対応する所定データに基づき、各領域毎のパターンモデルを生成する領域パターンモデル生成手段と、
新規対象に係る所定データを取得する所定データ取得手段と、
前記取得した所定データに対する前記区分された各領域に対応した領域パターンモデルの尤度を算出し、当該算出した尤度に基づき前記新規対象の所定データの認識に適した認識性能の領域パターンモデルを探索する領域パターンモデル探索手段と、を備えることを特徴とするパターンモデル探索装置。
【請求項15】
請求の範囲第14項記載のパターンモデル探索装置を制御するためのコンピュータが実行可能なプログラムであって、
請求の範囲第1項乃至請求の範囲第7項のいずれか1項に記載の音声データ処理装置によって表示された前記低次元空間上の座標点を、前記低次元空間上において複数の領域に自動的に区分する領域区分ステップと、
前記区分された領域内に含まれる前記パターンモデル対応低次元ベクトルの座標点に対応する音声データに基づき、各領域毎のパターンモデルを生成する領域パターンモデル生成ステップと、
新規対象に係る所定データを取得する所定データ取得ステップと、
前記取得した所定データに対する前記区分された各領域に対応した領域パターンモデルの尤度を算出し、当該算出した尤度に基づき前記新規対象の所定データの認識に適した認識性能の領域パターンモデルを探索する領域パターンモデル探索ステップと、を備えることを特徴とするパターンモデル探索装置制御プログラム。
【請求項16】
複数対象に係る複数の所定データを、複数の特定条件に基づき、複数のグループに分類するデータ分類手段と、
前記データ分類手段によって分類された前記所定データに基づき、当該所定データの各グループ毎に4次元以上の高次元の要素を有する複数のパターンモデルを生成するパターンモデル生成手段と、
前記パターンモデル生成手段によって各グループ毎に生成されたパターンモデルの各パターンモデル相互間の数学的距離を算出する数学的距離算出手段と、
前記数学的距離算出手段によって算出された前記数学的距離に基づき、前記各パターンモデル相互間の距離関係を保持しながら、前記複数のパターンモデルをこれより低次元の同数のパターンモデル対応低次元ベクトルへと変換するパターンモデル変換手段と、
前記複数のパターンモデル対応低次元ベクトルを、低次元の要素の値に基づき、前記距離関係を保持した状態で、前記パターンモデル対応低次元ベクトルと同じ次元の低次元空間上の座標点として表示するパターンモデル対応低次元ベクトル表示手段と、を備え、
前記数学的距離算出手段は、前記数学的距離の算出において、前記複数対象に係る複数の所定データにおける各パターン単位の出現頻度を用いることを特徴とするデータ処理装置。
【請求項17】
前記パターン単位の出現頻度は、前記複数の所定データに対する前記パターンモデルを用いたパターン認識における前記複数対象に係る複数の所定データのうち、認識性能が所定の閾値より低いパターン単位の出現頻度であることを特徴とする請求の範囲第16項記載のデータ処理装置。
【請求項18】
複数対象に係る複数の所定データを、複数の特定条件に基づき、複数のグループに分類するデータ分類手段と、
前記データ分類手段によって分類された前記所定データに基づき、当該所定データの各グループ毎に4次元以上の高次元の要素を有する複数のパターンモデルを生成するパターンモデル生成手段と、
前記パターンモデル生成手段によって各グループ毎に生成されたパターンモデルの各パターンモデル相互間の数学的距離を算出する数学的距離算出手段と、
前記数学的距離算出手段によって算出された前記数学的距離に基づき、前記各パターンモデル相互間の距離関係を保持しながら、前記複数のパターンモデルをこれより低次元の同数のパターンモデル対応低次元ベクトルへと変換するパターンモデル変換手段と、
前記複数のパターンモデル対応低次元ベクトルを、低次元の要素の値に基づき、前記距離関係を保持した状態で、前記パターンモデル対応低次元ベクトルと同じ次元の低次元空間上の座標点として表示するパターンモデル対応低次元ベクトル表示手段と、
前記パターンモデル対応低次元ベクトル表示手段によって前記低次元空間上に表示される前記複数のパターンモデル対応低次元ベクトルの座標点を、前記低次元空間上において複数の領域に自動的に区分する領域区分手段と、
前記区分された領域内に含まれる前記パターンモデル対応低次元ベクトルの座標点に対応する所定データに基づき、各領域毎の領域パターンモデルを生成する領域パターンモデル生成手段と、
新規対象に係る所定データを取得する所定データ取得手段と、
前記取得した所定データに対する前記区分された各領域に対応した領域パターンモデルの尤度を算出し、当該算出した尤度に基づき、前記領域パターンモデル生成手段によって生成された領域パターンモデルの中から前記新規対象の所定データの認識に適した認識性能の領域パターンモデルを探索する領域パターンモデル探索手段と、を備えることを特徴とするデータ処理装置。
【請求項19】
前記数学的距離算出手段は、前記数学的距離の算出において、前記複数対象に係る複数の所定データにおける各パターン単位の出現頻度を用いることを特徴とする請求の範囲第18項記載のデータ処理装置。
【請求項20】
前記パターン単位の出現頻度は、前記複数対象に係る複数の所定データに対する前記パターンモデルを用いたパターン認識における前記複数対象に係る複数のパターン単位のうち、認識性能が所定の閾値より低いパターン単位の出現頻度であることを特徴とする請求の範囲第19項記載のデータ処理装置。
【請求項21】
前記領域区分手段は、前記複数のパターンモデル対応低次元ベクトルを、当該全パターンモデル対応低次元ベクトルの座標点の重心を中心とし且つ前記重心と当該重心から最も離れた位置のパターンモデル対応低次元ベクトルの座標点との距離を半径とした1つの外円と、前記重心を中心とし且つ前記外円よりも小さな半径のn個の内円(nは1以上の整数)と、により区分し、更に、前記外円及び内円からなる複数の同心円同士の各外周間に形成される環状の領域を、半径方向に伸びる線によって複数に区分することを特徴とする請求の範囲第18乃至請求の範囲第20項のいずれか1項に記載のデータ処理装置。
【請求項22】
前記領域区分手段は、最内円から外円方向に向かう程、前記各環状の領域に含まれるパターンモデル対応低次元ベクトルを細かく区分することを特徴とする請求の範囲第21項記載のデータ処理装置。
【請求項23】
前記領域区分手段は、区分結果の各領域において、当該各領域に含まれるパターンモデル対応低次元ベクトルとこれと隣り合う領域に含まれるパターンモデル対応低次元ベクトルとの一部が重複するように領域を区分することを特徴とする請求の範囲第21項又は請求の範囲第22項記載のデータ処理装置。
【請求項24】
前記領域パターンモデル探索手段は、前記区分結果の最内円から外円方向に向かって順に、前記取得した所定データに対する前記区分された領域に対応した領域パターンモデルの尤度を算出し、当該算出した尤度に基づき、前記領域パターンモデル生成手段によって生成された領域パターンモデルの中から前記新規対象の所定データの認識に適した認識性能の領域パターンモデルを探索することを特徴とする請求の範囲第21項乃至請求の範囲第23項のいずれか1項に記載のデータ処理装置。
【請求項25】
前記領域パターンモデル探索手段は、前記取得した所定データに対する、最内円の領域に対応した領域パターンモデルの尤度を算出し、次に、最内円に隣接する環状の領域における各区分領域に対応した領域パターンモデルの尤度を算出し、当該算出した尤度のうち最も高い尤度の領域パターンモデルに対応する領域に隣接した外円方向の領域に対応した領域パターンモデルの尤度を算出し、以降は、外円方向に向かって順に、一つ内側の環状の領域において算出された尤度の最も高い領域パターンモデルの対応した領域に隣接する外円方向の領域に対応した領域パターンモデルの尤度を算出することを特徴とする請求の範囲第24項に記載のデータ処理装置。
【請求項26】
前記領域パターンモデル探索手段は、前記取得した所定データに対する、最内円の領域に対応した領域パターンモデルの尤度を算出し、次に、最内円に隣接する環状の領域における各区分領域に対応した領域パターンモデルの尤度を算出し、当該算出した尤度のうち上位m個の尤度に対応する領域パターンモデル(mは2以上の整数)にそれぞれ対応する領域に隣接した外円方向の区分領域に対応した領域パターンモデルの尤度を算出し、以降は、外円方向に向かって順に、一つ内側の環状の領域において算出された尤度の最も高い領域パターンモデルの対応した領域に隣接する外円方向の領域に対応した領域パターンモデルの尤度を算出することを特徴とする請求の範囲第24項に記載のデータ処理装置。
【請求項27】
前記複数対象に係る複数の所定データは、複数話者の発声した複数の音声のデータであり、
前記複数の特定条件は、少なくとも、話者の種類、発話語彙、発話様式及び発話環境を含むことを特徴とする請求の範囲第18項乃至請求の範囲第26項のいずれか1項に記載のデータ処理装置。
【請求項28】
前記データ分類手段は、前記複数の特定条件をそれぞれ任意に組み合わせた各組毎に前記グループを形成することを特徴とする請求の範囲第18項乃至請求の範囲第27項のいずれか1項に記載のデータ処理装置。
【請求項29】
前記パターンモデルは、HMM(Hidden Markov Model)によって生成されることを特徴とする請求の範囲第18項乃至請求の範囲第28項のいずれか1項に記載のデータ処理装置。
【請求項30】
前記数学的距離算出手段は、前記HMMによって生成された、前記パターンモデルの正規分布の平均ベクトルに基づくユークリッド距離、前記パターンモデルの正規分布の標準偏差により正規化された当該パターンモデルの正規分布の平均ベクトルに基づくユークリッド距離、及び、前記パターンモデルの正規分布に基づくバタチャリア距離のいずれか1つを用いて前記数学的距離を算出することを特徴とする請求の範囲第29項記載のデータ処理装置。
【請求項31】
前記パターンモデル変換手段は、Sammon法を用いて、前記パターンモデルを前記パターンモデル対応低次元ベクトルへと変換することを特徴とする請求の範囲第18項乃至請求の範囲第30項のいずれか1項に記載のデータ処理装置。
【請求項32】
前記領域区分手段によって自動区分された区分内容を変更する区分内容変更手段を備えることを特徴とする請求の範囲第18項乃至請求の範囲第31項のいずれか記載のデータ処理装置。
【請求項33】
前記領域パターンモデル探索手段によって探索された領域パターンモデルを新規対象の所定データに基づき、前記新規対象用に適応するパターンモデル適応手段を備えることを特徴とする請求の範囲第18項乃至請求の範囲第32項のいずれか1項に記載のデータ処理装置。
【請求項34】
前記パターンモデル変換手段は、前記領域パターンモデル探索手段によって探索された領域パターンモデルに対応する領域内に含まれる前記複数のパターンモデル対応低次元ベクトルに対応する高次元パターンモデルを、前記パターンモデル対応低次元ベクトルに変換可能であり、
前記パターンモデル対応低次元ベクトル表示手段は、前記変換後のパターンモデル対応低次元ベクトルを、低次元の要素の値に基づき、前記距離関係を保持した状態で、前記パターンモデル対応低次元ベクトルと同じ次元の低次元空間上の座標点として表示可能であり、
前記領域区分手段は、前記低次元空間上に表示される前記複数のパターンモデル対応低次元ベクトルの座標点を、前記低次元空間上において複数の領域に自動的に区分可能であることを特徴とする請求の範囲第33項記載のデータ処理装置。
【請求項35】
請求の範囲第16項記載のデータ処理装置を制御するためのコンピュータが実行可能なプログラムであって、
複数対象に係る複数の所定データを、複数の特定条件に基づき、複数のグループに分類するデータ分類ステップと、
前記データ分類ステップにおいて分類された前記所定データに基づき、当該所定データの各グループ毎に4次元以上の高次元の要素を有する複数のパターンモデルを生成するパターンモデル生成ステップと、
前記パターンモデル生成ステップにおいて各グループ毎に生成されたパターンモデルの各パターンモデル相互間の数学的距離を算出する数学的距離算出ステップと、
前記数学的距離算出ステップにおいて算出された前記数学的距離に基づき、前記各パターンモデル相互間の距離関係を保持しながら、前記複数のパターンモデルをこれより低次元の同数のパターンモデル対応低次元ベクトルへと変換するパターンモデル変換ステップと、
前記複数のパターンモデル対応低次元ベクトルを、低次元の要素の値に基づき、前記距離関係を保持した状態で、前記パターンモデル対応低次元ベクトルと同じ次元の低次元空間上の座標点として表示するパターンモデル対応低次元ベクトル表示ステップと、を備え、
前記数学的距離算出ステップにおいては、前記数学的距離の算出において、前記複数対象に係る複数の所定データにおける各パターン単位の出現頻度を用いることを特徴とするデータ処理装置制御プログラム。
【請求項36】
請求の範囲第18項記載のデータ処理装置を制御するためのコンピュータが実行可能なプログラムであって、
複数対象に係る複数の所定データを、複数の特定条件に基づき、複数のグループに分類するデータ分類ステップと、
前記データ分類ステップにおいて分類された前記所定データに基づき、当該所定データの各グループ毎に4次元以上の高次元の要素を有する複数のパターンモデルを生成するパターンモデル生成ステップと、
前記パターンモデル生成ステップにおいて各グループ毎に生成されたパターンモデルの各パターンモデル相互間の数学的距離を算出する数学的距離算出ステップと、
前記数学的距離算出ステップにおいて算出された前記数学的距離に基づき、前記各パターンモデル相互間の距離関係を保持しながら、前記複数のパターンモデルをこれより低次元の同数のパターンモデル対応低次元ベクトルへと変換するパターンモデル変換ステップと、
前記複数のパターンモデル対応低次元ベクトルを、低次元の要素の値に基づき、前記距離関係を保持した状態で、前記パターンモデル対応低次元ベクトルと同じ次元の低次元空間上の座標点として表示するパターンモデル対応低次元ベクトル表示ステップと、
前記パターンモデル対応低次元ベクトル表示ステップにおいて前記低次元空間上に表示される前記複数のパターンモデル対応低次元ベクトルの座標点を、前記低次元空間上において複数の領域に自動的に区分する領域区分ステップと、
前記区分された領域内に含まれる前記パターンモデル対応低次元ベクトルの座標点に対応する所定データに基づき、各領域毎のパターンモデルを生成する領域パターンモデル生成ステップと、
新規対象に係る所定データを取得する所定データ取得ステップと、
前記取得した所定データに対する前記区分された各領域に対応した前記領域パターンモデルの尤度を算出し、当該算出した尤度に基づき前記新規対象の所定データの認識に適した認識性能の領域パターンモデルを探索する領域パターンモデル探索ステップと、を備えることを特徴とするデータ処理装置制御プログラム。
【請求項37】
システム利用者の管理下にある情報処理端末と、
請求の範囲第18項乃至請求の範囲第34項のいずれか1項に記載のデータ処理装置と、を備え、
前記情報処理端末及び前記データ処理装置を互いにデータ通信可能に接続し、
前記データ処理装置において、前記複数対象に係る複数の所定データは、複数話者の発声した複数の音声のデータであり、
前記情報処理端末は、
前記システム利用者の発声した音声のデータを取得し、当該取得した音声データを前記データ処理装置に送信する音声データ送信手段と、
前記データ処理装置から前記システム利用者の音声データをパターン認識するのに適した前記特定パターンモデルを取得する特定パターンモデル取得手段と、を備え、
前記データ処理装置は、
前記所定データ取得手段によって前記情報処理端末からの前記音声データを取得し、更に、当該取得した音声データに基づき前記システム利用者用の前記特定パターンモデルを生成するようになっており、
前記生成した特定パターンモデルを前記情報処理端末に送信する特定パターンモデル送信手段を更に備えることを特徴とする特定パターンモデル提供システム。
【請求項38】
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を記憶する音響空間記憶手段と、
対象話者の音声データを取得する音声データ取得手段と、
前記音声データ取得手段によって取得された前記対象話者の音声データと前記音響空間記憶手段が記憶する音響空間内の前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出する位置算出手段と、
前記位置算出手段によって算出された前記位置に基づき、前記対象話者の音声データの価値を評価する音声データ評価手段と、
前記音声データ評価手段の評価結果を表示する評価結果表示手段と、
前記算出された位置に基づき、前記音響空間内における、前記音声データとその周辺のパターンモデルとの位置関係を示す情報を表示する位置関係情報表示手段と、を備えることを特徴とするデータ処理装置。
【請求項39】
前記音声データ評価手段は、前記位置算出手段によって算出された前記対象話者の音声データの位置から所定距離の範囲内に存在する前記パターンモデルの数に基づき、前記音声データの価値を評価することを特徴とする請求の範囲第38項記載のデータ処理装置。
【請求項40】
前記所定距離は、段階的に設定されており、
前記音声データ評価手段は、各段階毎に設定された各距離範囲内における前記パターンモデルの数に基づき、前記音声データの価値を評価することを特徴とする請求の範囲第39項記載のデータ処理装置。
【請求項41】
前記音声データ評価手段は、前記位置算出手段によって算出された前記位置に基づき、前記複数のパターンモデルのうち、前記対象話者の音声データの特徴と類似した特徴を有するパターンモデルを、前記対象話者のパターンモデルとして前記評価に用いることを特徴とする請求の範囲第38項乃至請求の範囲第40項のいずれか1項に記載のデータ処理装置。
【請求項42】
前記音声データ評価手段は、前記複数のパターンモデルのうち、前記対象話者の音声データの特徴と類似した特徴を有する上位いくつかのパターンモデルを、前記対象話者のパターンモデルとして前記評価に用いることを特徴とする請求の範囲第41項記載のデータ処理装置。
【請求項43】
前記位置算出手段は、前記音声データ取得手段によって取得された音声データを高次元の特徴量データに変換し、当該特徴量データと前記複数話者の複数のパターンモデルとに基づき、前記特徴量データと各パターンモデルとの尤度を算出し、当該算出された尤度に基づき前記複数話者の複数のパターンモデルの中から特定のパターンモデルを選択し、当該選択された特定のパターンモデルと他のパターンモデルとの相互間の数学的距離を算出し、当該算出された数学的距離に基づき、前記音響空間内における、前記取得された音声データの位置を算出することを特徴とする請求の範囲第41項又は請求の範囲第42項記載のデータ処理装置。
【請求項44】
前記位置算出手段は、前記音声データ取得手段によって取得された音声データを高次元の特徴量データに変換し、当該特徴量データに基づき対象話者用のパターンモデルを生成し、当該生成されたパターンモデルと前記複数話者の複数のパターンモデルとの相互間の数学的距離を算出し、当該算出された数学的距離に基づき、前記音響空間内における、前記取得された音声データの位置を算出することを特徴とする請求の範囲第38項乃至請求の範囲第40項のいずれか1項に記載のデータ処理装置。
【請求項45】
前記パターンモデルは、4次元以上の高次元の要素から構成されており、
前記位置関係情報表示手段は、前記対象話者の音声データに対応するパターンモデルを含む前記音響空間内の複数のパターンモデルを、これらの距離関係を維持した状態で、これより低次元のパターンモデルに変換し、当該変換後のパターンモデルを低次元空間上の座標点として表示することを特徴とする請求の範囲第43項又は請求の範囲第44項記載のデータ処理装置。
【請求項46】
前記パターンモデルをHMM(Hidden Markov Model)により構成したことを特徴とする請求の範囲第38項乃至請求の範囲第45項のいずれか1項に記載のデータ処理装置。
【請求項47】
前記音声データ評価手段は、前記対象話者の音声データにおける音素毎の価値を評価するようになっており、
前記評価結果表示手段は、前記対象話者の音声データの音素毎の評価結果を表示することを特徴とする請求の範囲第38項乃至請求の範囲第46項のいずれか1項に記載のデータ処理装置。
【請求項48】
前記評価結果表示手段は、前記音声データ評価手段によって前記対象話者の音声データの価値が低いと評価された場合に、その音声データに対する補正情報を表示することを特徴とする請求の範囲第38項乃至請求の範囲第47項のいずれか1項に記載のデータ処理装置。
【請求項49】
前記対象話者との間で前記音声データの提供可否に関する交渉を行うための交渉手段と、
前記交渉手段によって交渉が成立した前記音声データを記憶する音声データ記憶手段と、を備えることを特徴とする請求の範囲第38項乃至請求の範囲第48項のいずれか1項に記載のデータ処理装置。
【請求項50】
対象話者の管理下にある情報処理端末と、
請求の範囲第38項乃至請求の範囲第49項のいずれか1項に記載のデータ処理装置と、を備え、
前記情報処理端末と前記データ処理装置とを互いにデータ通信可能に接続し、
前記情報処理端末は、前記対象話者の音声データを取得し、当該取得した音声データを前記データ処理装置に送信する音声データ送信手段と、前記データ処理装置から取得した、前記対象話者の音声データの評価結果に係る情報を表示する評価情報表示手段と、を備え、
前記データ処理装置は、前記評価結果に係る情報を前記情報処理端末に送信する評価情報送信手段を備えることを特徴とするデータ処理システム。
【請求項51】
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を用意し、
対象話者の音声データを取得し、
前記取得された前記対象話者の音声データと前記音響空間内の前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出し、
前記算出された前記位置に基づき、前記対象話者の音声データの価値を評価し、当該評価結果を表示することを特徴とするデータ処理方法。
【請求項52】
請求の範囲第38項記載のデータ処理装置を制御するためのコンピュータが実行可能なプログラムであって、
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を記憶する音響空間記憶ステップと、
対象話者の音声データを取得する音声データ取得ステップと、
前記音声データ取得ステップにおいて取得された前記対象話者の音声データと、前記音響空間記憶ステップにおいて記憶された音響空間内の前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出する位置算出ステップと、
前記位置算出ステップにおいて算出された前記位置に基づき、前記対象話者の音声データの価値を評価する音声データ評価ステップと、
前記音声データ評価ステップによる評価結果を表示する評価結果表示ステップと、を備えることを特徴とするデータ処理装置制御プログラム。
【請求項53】
請求の範囲第50項記載のデータ処理システムに適用可能な前記データ処理装置であって、
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を記憶する音響空間記憶手段と、
対象話者の音声データを取得する音声データ取得手段と、
前記音声データ取得手段によって取得された前記対象話者の音声データと前記音響空間記憶手段の記憶する音響空間内の前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出する位置算出手段と、
前記位置算出手段によって算出された前記位置に基づき、前記対象話者の音声データの価値を評価する音声データ評価手段と、
前記音声データ評価手段の評価結果を表示する評価結果表示手段と、
前記算出された位置に基づき、前記音響空間内における、前記音声データとその周辺のパターンモデルとの位置関係を示す情報を表示する位置関係情報表示手段と、
前記評価結果に係る情報を前記情報処理端末に送信する評価情報送信手段と、を備えることを特徴とするデータ処理装置。
【請求項54】
請求の範囲第50項記載のデータ処理システムに適用可能な前記情報処理端末であって、
前記対象話者の音声データを取得し、当該取得した音声データを前記データ処理装置に送信する音声データ送信手段と、
前記データ処理装置から取得した、前記対象話者の音声データの評価結果に係る情報を表示する評価情報表示手段と、を備えることを特徴とする情報処理端末。
【請求項55】
請求の範囲第53項記載のデータ処理装置を制御するためのコンピュータが実行可能なプログラムであって、
前記データ処理装置は、複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を備えており、
対象話者の音声データを取得する音声データ取得ステップと、
前記音声データ取得ステップにおいて取得された前記対象話者の音声データと前記音響空間内の前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出する位置算出ステップと、
前記位置算出ステップにおいて算出された前記位置に基づき、前記対象話者の音声データの価値を評価する音声データ評価ステップと、
前記音声データ評価ステップによる評価結果を表示する評価結果表示ステップと、
前記算出された位置に基づき、前記音響空間内における、前記音声データとその周辺のパターンモデルとの位置関係を示す情報を表示する位置関係情報表示ステップと、
前記評価結果に係る情報を前記情報処理端末に送信する評価情報送信ステップと、を備えることを特徴とするデータ処理装置制御プログラム。
【請求項56】
請求の範囲第54項記載の情報処理端末を制御するためのコンピュータが実行可能なプログラムであって、
前記対象話者の音声データを取得し、当該取得した音声データを前記データ処理装置に送信する音声データ送信ステップと、
前記データ処理装置から取得した、前記対象話者の音声データの評価結果に係る情報を表示する評価情報表示ステップと、を備えることを特徴とする情報処理端末制御プログラム。
【請求項57】
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を記憶する音響空間記憶手段と、
対象話者の音声データを取得する音声データ取得手段と、
前記対象話者の音声データと前記音響空間内の前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出する位置算出手段と、
前記位置と前記複数のパターンモデルとに基づき、前記複数話者の中から前記対象話者の音声と類似した音声を有する類似話者を検出する類似話者検出手段と、
前記位置と前記類似話者のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データと前記類似話者のパターンモデルとの位置関係を示す情報を表示する位置関係情報表示手段と、を備えることを特徴とするデータ処理装置。
【請求項58】
前記複数話者の中から特定話者を指定する特定話者指定手段と、
前記位置と前記音響空間内における前記特定話者のパターンモデルとに基づき、前記特定話者の音声と前記対象話者の音声との類似性を評価する類似性評価手段と、
前記類似性評価手段の評価結果を表示する評価結果表示手段と、を備え、
前記位置関係情報表示手段は、前記位置と前記特定話者のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データと前記特定話者のパターンモデルとの位置関係を示す情報を表示するようになっていることを特徴とする請求の範囲第57項記載のデータ処理装置。
【請求項59】
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を記憶する音響空間記憶手段と、
前記複数話者の中から特定話者を指定する特定話者指定手段と、
対象話者の音声データを取得する音声データ取得手段と、
前記対象話者の音声データと前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出する位置算出手段と、
前記位置と前記特定話者のパターンモデルとに基づき、前記特定話者の音声と前記対象話者の音声との類似性を評価する類似性評価手段と、
前記類似性評価手段の評価結果を表示する評価結果表示手段と、
前記位置と前記特定話者のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データと前記特定話者のパターンモデルとの位置関係を示す情報を表示する位置関係情報表示手段と、を備えることを特徴とするデータ処理装置。
【請求項60】
前記類似性評価手段の評価結果に基づき、前記対象話者の音声と前記特定話者の音声との類似性を高めるための前記対象話者の音声に対する矯正内容を示す矯正情報を生成する矯正情報生成手段と、
前記矯正情報を表示する矯正情報表示手段と、を備えることを特徴とする請求の範囲第58項又は請求の範囲第59項記載のデータ処理装置。
【請求項61】
前記類似話者検出手段は、前記位置に基づき、前記複数のパターンモデルのうち、前記対象話者の音声データの特徴と類似した特徴を有するパターンモデルを、前記対象話者のパターンモデルとして用い、
前記類似性評価手段は、前記位置に基づき、前記複数のパターンモデルのうち、前記対象話者の音声データの特徴と類似した特徴を有するパターンモデルを、前記対象話者のパターンモデルとして用いることを特徴とする請求の範囲第59項記載のデータ処理装置。
【請求項62】
前記類似話者検出手段は、前記位置に基づき、前記複数のパターンモデルのうち、前記対象話者の音声データの特徴と類似した特徴を有する上位いくつかのパターンモデルを、前記対象話者のパターンモデルとして用い、
前記類似性評価手段は、前記位置に基づき、前記複数のパターンモデルのうち、前記対象話者の音声データの特徴と類似した特徴を有する上位いくつかのパターンモデルを、前記対象話者のパターンモデルとして用いることを特徴とする請求の範囲第59項記載のデータ処理装置。
【請求項63】
前記位置算出手段は、前記音声データ取得手段によって取得された音声データを高次元の特徴量データに変換し、当該特徴量データと前記複数話者の複数のパターンモデルとに基づき、前記特徴量データと各パターンモデルとの尤度を算出し、当該算出された尤度に基づき前記複数話者の複数のパターンモデルの中から特定のパターンモデルを選択し、当該選択された特定のパターンモデルと他のパターンモデルとの相互間の数学的距離を算出し、当該算出された数学的距離に基づき、前記音響空間内における、前記取得された音声データの位置を算出することを特徴とする請求の範囲第61項又は至請求の範囲第62項記載のデータ処理装置。
【請求項64】
前記位置算出手段は、前記音声データ取得手段によって取得された音声データを高次元の特徴量データに変換し、当該特徴量データに基づき対象話者用のパターンモデルを生成し、当該生成されたパターンモデルと前記複数話者の複数のパターンモデルとの相互間の数学的距離を算出し、当該算出された数学的距離に基づき、前記音響空間内における、前記取得された音声データの位置を算出することを特徴とする請求の範囲第57項乃至請求の範囲第60項のいずれか1項に記載のデータ処理装置。
【請求項65】
前記パターンモデルは、4次元以上の高次元の要素から構成されており、
前記位置関係情報表示手段は、前記対象話者の音声データに対応するパターンモデルを含む前記音響空間内の複数のパターンモデルを、これらの距離関係を維持した状態で、これより低次元のパターンモデルに変換し、当該変換後のパターンモデルを低次元空間上の座標点として表示することを特徴とする請求の範囲第63項又は請求の範囲第64項記載のデータ処理装置。
【請求項66】
前記類似性評価手段は、前記対象話者の音声データにおける音素毎の類似性を評価するようになっていることを特徴とする請求の範囲第58項乃至請求の範囲第65項のいずれか1項に記載のデータ処理装置。
【請求項67】
前記音響空間は、複数種類の発話様式によりそれぞれ発声された前記複数話者の音声データより生成された複数のパターンモデルから構成されており、
前記類似性評価手段は、前記発話様式の種類毎に、前記類似性の評価を行うようになっていることを特徴とする請求の範囲第58項乃至請求の範囲第66項のいずれか1項に記載のデータ処理装置。
【請求項68】
前記位置関係表示手段は、前記複数のパターンモデルにそれぞれ対応した前記発話様式に基づき、前記低次元空間の座標軸を設定するようになっていることを特徴とする請求の範囲第67項記載のデータ処理装置。
【請求項69】
前記パターンモデルをHMM(Hidden Markov Model)により構成したことを特徴とする請求の範囲第57項乃至請求の範囲第68項のいずれか1項に記載のデータ処理装置。
【請求項70】
対象話者の管理下にある情報処理端末と、
請求の範囲第57項乃至請求の範囲第69項のいずれか1項に記載のデータ処理装置と、を備え、
前記情報処理端末と前記データ処理装置とを互いにデータ通信可能に接続し、
前記情報処理端末は、前記対象話者の音声データを取得し、当該取得した音声データを前記データ処理装置に送信する音声データ送信手段と、前記データ処理装置から取得した前記音声データの処理結果に係る情報を表示する情報表示手段と、を備え、
前記データ処理装置は、前記音声データの処理結果に係る情報を前記情報処理端末に送信する情報送信手段を備えることを特徴とするデータ処理システム。
【請求項71】
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を用意し、
対象話者の音声データを取得し、
前記対象話者の音声データと前記音響空間内の前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出し、
前記位置と前記複数のパターンモデルとに基づき、前記複数話者の中から前記対象話者の音声と類似した音声を有する類似話者を検出し、
前記位置と前記類似話者のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データと前記類似話者のパターンモデルとの位置関係を示す情報を表示することを特徴とするデータ処理方法。
【請求項72】
前記複数話者の中から特定話者を指定し、
前記位置と前記音響空間内における前記特定話者のパターンモデルとに基づき、前記特定話者の音声と前記対象話者の音声との類似性を評価し、
前記評価結果を表示することを特徴とする請求の範囲第71項記載のデータ処理方法。
【請求項73】
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を用意し、
前記複数話者の中から特定話者を指定し、
対象話者の音声データを取得し、
前記対象話者の音声データと前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出し、
前記位置と前記特定話者のパターンモデルとに基づき、前記特定話者の音声と前記対象話者の音声との類似性を評価し、
前記評価結果を表示し、
前記位置と前記特定話者のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データと前記特定話者のパターンモデルとの位置関係を示す情報を表示することを特徴とするデータ処理装置。
【請求項74】
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を記憶する音響空間記憶ステップと、
対象話者の音声データを取得する音声データ取得ステップと、
前記対象話者の音声データと前記音響空間内の前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出する位置算出ステップと、
前記位置と前記複数のパターンモデルとに基づき、前記複数話者の中から前記対象話者の音声と類似した音声を有する類似話者を検出する類似話者検出ステップと、
前記位置と前記類似話者のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データと前記類似話者のパターンモデルとの位置関係を示す情報を表示する位置関係情報表示ステップと、
特定話者を指定する特定話者指定ステップと、
前記位置と前記音響空間内における前記特定話者のパターンモデルとに基づき、前記特定話者の音声と前記対象話者の音声との類似性を評価する類似性評価ステップと、
前記類似性評価ステップによる評価結果を表示する評価結果表示ステップと、を備え、
前記位置関係情報表示ステップにおいては、前記位置と前記特定話者のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データと前記特定話者のパターンモデルとの位置関係を示す情報を表示するようになっていることを特徴とするデータ処理装置制御プログラム。
【請求項75】
複数話者の音声データから生成された複数のパターンモデルによって構成された音響空間を記憶する音響空間記憶ステップと、
前記複数話者の中から特定話者を指定する特定話者指定ステップと、
対象話者の音声データを取得する音声データ取得ステップと、
前記対象話者の音声データと前記複数のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データの位置を算出する位置算出ステップと、
前記位置と前記特定話者のパターンモデルとに基づき、前記特定話者の音声と前記対象話者の音声との類似性を評価する類似性評価ステップと、
前記類似性評価ステップによる評価結果を表示する評価結果表示ステップと、
前記位置と前記特定話者のパターンモデルとに基づき、前記音響空間内における、前記対象話者の音声データと前記特定話者のパターンモデルとの位置関係を示す情報を表示する位置関係情報表示ステップと、を備えることを特徴とするデータ処理装置制御プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate

【図35】
image rotate

【図36】
image rotate

【図37】
image rotate

【図38】
image rotate

【図39】
image rotate

【図40】
image rotate

【図41】
image rotate

【図42】
image rotate

【図43】
image rotate

【図44】
image rotate

【図45】
image rotate

【図46】
image rotate

【図47】
image rotate

【図48】
image rotate

【図49】
image rotate

【図50】
image rotate

【図51】
image rotate

【図52】
image rotate

【図53】
image rotate

【図54】
image rotate

【図55】
image rotate

【図56】
image rotate

【図57】
image rotate

【図58】
image rotate

【図59】
image rotate


【国際公開番号】WO2005/034086
【国際公開日】平成17年4月14日(2005.4.14)
【発行日】平成19年10月4日(2007.10.4)
【国際特許分類】
【出願番号】特願2005−514358(P2005−514358)
【国際出願番号】PCT/JP2004/010390
【国際出願日】平成16年7月22日(2004.7.22)
【出願人】(000000033)旭化成株式会社 (901)
【Fターム(参考)】