日本放送協会により出願された特許

1 - 10 / 2,206


【課題】雑音混入音声から雑音を推定して雑音抑圧音声を得る方法および装置において、雑音抑圧音声の品質を高める。
【解決手段】付加雑音推定部が、周波数領域の音声データに基づき付加雑音を推定する。駆動音源推定部が、周波数領域の音声データと、付加雑音推定部によって推定された付加雑音とに基づき駆動音源の周波数領域における統計情報を推定する。そして、フィルター処理部は、周波数領域の音声データと、付加雑音推定部によって推定された付加雑音と、駆動音源推定部によって推定された駆動音源の周波数領域における統計情報とに基づき、フィルター処理によって周波数領域の雑音抑圧音声データを算出する。 (もっと読む)


【課題】概略の特徴を捉えて一般物体認識の精度を向上させる。
【解決手段】フレーム画像データから複数の特徴点を検出する特徴点検出部20と、これら複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部30と、フレーム画像データからエッジ成分を検出し、複数の特徴点それぞれについて、特徴点近傍の局所領域におけるエッジ成分の主方向を検出する特徴点主方向検出部40と、複数の特徴点それぞれについて、スケール推定値と主方向推定値とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴ベクトルを生成する共起特徴ベクトル生成部50とを備えた。 (もっと読む)


【課題】動画像のコンポーネント信号を修正する画像処理装置、符号化装置、復号装置及びプログラムを提供する。
【解決手段】画像処理装置1は、動画像のコンポーネント信号を修正する画像処理装置であって、非可逆な符号化方式を経て得られる所定の画像フォーマットの画像信号における第2のコンポーネント信号及び第3のコンポーネント信号について修正するために、第1のコンポーネント信号を正規化して第2のコンポーネント信号及び第3のコンポーネント信号の教師信号を生成する教師信号生成手段3−5と、前記第2のコンポーネント信号及び第3のコンポーネント信号と前記教師信号とを比較して得られる差分値が予め定めた閾値以下である場合に、前記教師信号に基づいて該第2のコンポーネント信号及び第3のコンポーネント信号を修正する修正手段9とを備える。 (もっと読む)


【課題】現在放送中の映像コンテンツに関する詳細な情報を受信機の周辺機器に入力する。
【解決手段】受信機20は、放送送出装置10から映像コンテンツと当該映像コンテンツのある時刻における内容に関連する関連情報及び当該関連情報を周辺機器に送信させる命令を含むBML情報とを受信する放送受信部21と、放送受信部21が受信したBML情報に含まれる命令に従ってBML情報に含まれる関連情報を周辺機器に送信する関連情報送信部26とを備える。 (もっと読む)


【課題】インテグラルフォトグラフィにおいて、視域内において高精細な立体像を得る。
【解決手段】それぞれ樽型歪の歪曲収差を有する複数の要素レンズを平面上に配列させて構成したレンズアレイ110と、レンズアレイ110を通して得られる光束を撮像し、複数の要素レンズそれぞれに対応する要素画像の集合であるインテグラル画像を生成する撮像部130とを備えた。また、相互に視差を有するとともに、樽型歪の歪曲収差にしたがって歪曲した複数の要素画像の集合であるインテグラル画像を表示する表示部220と、それぞれ樽型歪の歪曲収差を有する複数の要素レンズを平面上に配列させて構成し、表示部220が表示するインテグラル画像からの光束を複数の要素レンズに通すレンズアレイ240とを備えた。 (もっと読む)


【課題】自然で肉声感のある音声を合成する音声合成装置および音声合成プログラムを提供する。
【解決手段】音声合成装置1は、入力文を解析して音素ごとに分割する入力文解析手段30と、音素ごとに音声データの候補を列挙する音声データ候補列挙手段40と、音声データの候補の中から音響特徴量の差分の積算値が最小となる組み合わせを探索し、入力文に対応した音声データの組み合わせを決定する音声データ決定手段50と、入力文に対応する音響モデルの列を列挙する統計モデル列挙手段と、統計モデルを音声データの音響特徴量によって置き換えて統計モデルを修正する統計モデル修正手段60と、修正された統計モデルの列を平滑化して入力文に対応した音響特徴量の列として出力する音響特徴量列生成手段70と、生成された音響特徴量の列を音声波形に変換する音声波形変換手段80と、を備える。 (もっと読む)


【課題】韻律に関する適切なパラメータを用いた制御を行うことによって、入力される音声の韻律を逐次変換し、聞き取り易い音声を出力する。
【解決手段】韻律変換装置が、入力音声を分析し入力音声の韻律データを出力する音声分析部と、韻律データを変換し変換後の韻律データを出力する韻律データ作成部と、韻律データ作成部から出力される変換後の韻律データに基づき入力音声の韻律を変換し、変換後の音声を出力する韻律変換部と備える。韻律データ作成部は、音声分析部から出力される韻律データの所定の時間窓内のデータに基づく強調成分データを抽出するアクセント用パラメータ制御部と、韻律データと強調成分データとに基づき変換後の韻律データを作成する基本周波数構成部とを備える。 (もっと読む)


【課題】現在放送中の映像コンテンツに関する詳細な情報を受信機の周辺機器に入力する。
【解決手段】受信機20は、放送送出装置10から映像コンテンツと当該映像コンテンツのある時刻における内容に関連する関連情報及び当該関連情報を周辺機器に送信させる命令を含むBML情報と関連情報を含むイベントメッセージとを受信する放送受信部21と、放送受信部21が受信したBML情報に含まれる命令に従ってBML情報に含まれる関連情報を周辺機器に送信し、また放送受信部21がイベントメッセージを受信したときに、当該イベントメッセージに含まれる関連情報を周辺機器に送信する関連情報送信部26とを備える。 (もっと読む)


【課題】現在放送中の映像コンテンツに関する詳細な情報を受信機の周辺機器に入力する。
【解決手段】受信機20は、放送送出装置10から映像コンテンツと当該映像コンテンツのある時刻における内容に関連する関連情報及び当該関連情報を周辺機器に送信させる命令を含むBML情報とを受信する放送受信部21と、放送受信部21が受信したBML情報に含まれる命令に従ってBML情報に含まれる関連情報を周辺機器に送信する関連情報送信部26とを備える。 (もっと読む)


【課題】特定の話者の発話に関する過去のデータが少ない場合であっても、その特定の話者についての音声認識率を改善する。
【解決手段】音声認識装置1の音声言語資源記憶部2は、複数話者の発話の音声データと、その発話の正解文を示す文書データとを記憶している。音響特徴量変換部32は、音声データを用い、非目的話者の音声に目的話者の音声の特徴を反映するような特徴量変換写像を求める。そして、求めた変換写像を基に非目的発話の音声データの音響特徴量を変換し、音声認識を行う。言語特徴抽出部42は、着目話題についての文書データから話題性に関する言語特徴を抽出するとともに、他の文書データから話題に依存しない大局的な言語特徴を抽出する。誤り傾向学習部5は、音響特徴量変換部32が得た音声認識結果と、言語特徴抽出部42が得た言語特徴を用い、目的話者及び注目話題についての単語の誤り傾向を学習する。 (もっと読む)


1 - 10 / 2,206