説明

株式会社ATR−Trekにより出願された特許

1 - 2 / 2


【課題】非定常な雑音環境下でも精度良く発話区間を検出できるようにする。
【解決手段】発話区間検出装置270は、音声信号のシーケンス中で発話開始位置である可能性の高いフレームを検出するクラスタリング開始位置判定部456と、クラスタリング開始位置が検出された後、その位置のフレームよりプレロール時間だけ前のフレームから最新に受信したフレームまでを音声パワーの値に基づき10ミリ秒ごとにクラスタリングする処理を開始して各フレームのクラスタレベルを算出するクラスタリング処理部490と、各フレームについて算出されたクラスタレベルのシーケンスに基づいて、50ミリ秒ごとに発話開始位置及び発話終了位置を検出する処理を繰返し行なう発話状態判定部492及び発話開始・終了判定部494とを含む。 (もっと読む)


【課題】音声認識精度を向上させる。
【解決手段】本発明に係る音声認識装置100は、音データに含まれる単語を抽出し、各単語の信頼度を算出する音声処理部130と、各単語に対応する音データの発話者の音声らしさを示す各単語の発話者度を算出する発話者度算出部140と、音声処理部130により算出された各単語の信頼度、及び発話者度算出部140により算出された各単語の発話者度に基づいて、各単語のスコアを算出するスコア算出部150と、所定の閾値を設定する閾値設定部160と、各単語のスコアと所定の閾値とに基づいて、音声認識結果として採用する単語を選定する単語選定部170とを備える。 (もっと読む)


1 - 2 / 2