説明

Fターム[5C164VA56]の内容

双方向TV、動画像配信等 (137,112) | TV電話、TV会議に特有な装置、処理 (4,386) | 話者、話者端末の特定 (187) | 特定するための情報 (125) | その他の音声情報(例;方向) (52)

Fターム[5C164VA56]に分類される特許

1 - 20 / 52


【課題】音声を発した人物の顔をカメラ映像から切り取り、資料映像に重畳して表示する仕組みを提供する。
【解決手段】送信端末1において、第一映像入力手段100により映像情報を入力し、顔認識手段101により顔を認識する。第二映像入力手段103により背景情報を入力し、音声入力手段106により音声がどの方位から到達したかを把握する。受信端末2において、指向情報取得手段207によりどの方位から音声が到達したかを把握し、切取情報取得手段により映像情報のどの位置に顔があるかを指定する。映像切取手段204により、音声の到達方向にある顔映像を切出し、映像重畳手段205により背景情報の上に顔映像を貼り付け、表示手段206により表示装置5に出力する。 (もっと読む)


【課題】会議の途中で話し手が変わる場合であっても、話し手の負担を従来よりも軽減しつつ、話し手が参照している資料の部分を聞き手に伝えることができる会議支援システムを提供する。
【解決手段】会議支援システム100は、会議支援装置1および複数台の端末装置2を有し、会議支援装置1には、複数台の端末装置2のうちの話し手に使用される端末装置2を特定する発表者特定部が設けられ、端末装置2には、資料の中の、話し手が注目している位置である注目位置を、会議支援装置1に通知する注目位置回答部が設けられ、会議支援装置1には、注目位置回答部から通知された注目位置を、複数台の端末装置2のうちの話し手以外に使用される端末装置2に通知する注目位置通知部が設けられている。 (もっと読む)


【課題】既存のテレビ会議システムの機器との互換性が高く、且つ映像と音像方向が一致するような実在感のあるテレビ会議を実施できるテレビ会議装置を、コストを大きく増加させずに提供する。
【解決手段】テレビ会議装置は、発話側の装置10として左右の2つのマイク11L,11Rとカメラ15を備え、受話側の装置30として3つ以上のスピーカ34が水平方向に並べられたスピーカアレイとディスプレイ35とを備える。装置10は、入力の左右2つの音声信号から、モノラル音声信号とその音像方向を示す音像方向情報を生成する。装置30は、発話側から受信の音像方向情報が示す音像方向を、スピーカアレイを発話側の2つのマイクの位置を結ぶ線分と見做した時の音像方向に変換し、発話側から受信のモノラル音声信号が変換後の音像方向に定位するように、変換後の音像方向に対応する1つあるいは複数のスピーカからモノラル音声信号が示す音声を出力させる。 (もっと読む)


【課題】高操作性を確保しつつ、ミスコミュニケーションの発生を軽減することができないという問題を解決することが可能なカメラシステムを提供する。
【解決手段】画像処理部16は、カメラ11で撮像された撮像画像に対して、その撮像画像内の所定領域を加工する画像処理を行って、加工画像を生成する。表示部は、加工画像を表示する。操作部は、カメラの向きを示す操作コマンドを受け付ける。モータ制御部18は、操作コマンドに応じてカメラ11の向きを調整する。 (もっと読む)


【課題】発言者の音声レベルを会議出席者の顔の上方(頭上)に画像表示するビデオ会議用カメラマイク装置を提供する。
【解決手段】本発明のカメラ・マイクユニット50は、カメラ3により撮影された画像を処理して会議出席者の顔を検出する顔検出手段15と、複数のマイク5によって音声の到来方向を検出する音声到来方向検出手段16と、ずれ時間情報22に基づいて音声を収音する方向を変更する音声収音方向変更手段17と、音声収音方向変更手段17により収音した音声レベルを算出する音声レベル算出手段18と、顔検出手段15により検出した顔検出情報20、音声到来方向検出手段16により検出した音声到来方向情報21、及び音声レベル算出手段18により算出した音声レベル情報24に基づいて、会議室画像の会議出席者の発言者の頭上に音声レベルを画像表示する画像信号25を生成する音声レベル表示合成手段19と、を備えて構成されている。 (もっと読む)


【課題】誰が発話しているのかを容易に把握することを主たる課題とし、誰が話を聞いているかや誰がいつ話し始めるかを容易に把握することを従たる課題とする。
【解決手段】会議参加者毎に固有の背景雑音データを生成し、会議参加者のうち発話者の背景雑音データを発話者の発する発話音声データに合成して再生する。被発話者の頷く動作、手部の動作、頭部の動作を検知する。 (もっと読む)


【課題】通信対象装置との間で通話に関する通信を行う場合において、ユーザのプライバシーの侵害を防止しつつ、コンテンツデータが示すコンテンツを通信対象装置との間で選択的に共有させることが可能な制御装置および制御方法を提供する。
【解決手段】通信対象装置との間で通話に関する通信を行う通信部と、コンテンツデータの再生を行う再生処理部と、コンテンツデータが示す音声を通信対象装置との間で共有するか否かを判定する判定部と、判定部において共有すると判定された場合に、コンテンツデータが示す音声、または、音声および画像を通信対象装置との間で共有する処理を選択的に行う共有処理部とを備え、共有処理部は、判定部において共有すると判定されない場合には、発話音声に対応する発話音声信号を通信対象装置へ送信させ、再生しているコンテンツデータに対応するコンテンツ音声信号を通信対象装置へ送信させない制御装置が提供される。 (もっと読む)


【課題】会議で行われた会話情報を記録して、記録した会話情報からコミュニケーション状態を把握して、会議の記録結果を人間の行動様式に近い自然な方法で情報を検索できるような会議支援装置を安価に提供する。
【解決手段】会議に参加したユーザによる発話を集音し、集音した音声情報を記録し、集音したユーザによる発話の発話方向を検出し、記録した発話情報の群から会話状況を推測し、会議の資料情報を表示し、表示した資料情報と推定した会話状況情報とを関連付けて記録する。 (もっと読む)


【課題】ビデオ会議中の参加者の映像を会議環境、参加者の配置、誰が発言しているかに基づいて動的に調整できることができるビデオ会議装置を提供する。
【解決手段】室内の話者を自動的に追跡し、制御された出席者ビューカメラ50Bと固定式の室内ビューカメラ50Aとの間を動的に切り換える。誰も発言していない場合、本装置10は遠端に室内ビューを示す。室内に優勢な話者がいる場合、本装置は、出席者ビューカメラを優勢な話者に向け、室内ビューカメラから出席者ビューカメラに切り換える。室内に新しい話者がいる場合、本装置は、最初に室内ビューカメラに切り換え、出席者ビューカメラを新しい話者に向け、そして新しい話者に向けられた出席者ビューカメラに切り換える。会話中の2人の近端話者がいる場合、本装置は、これらを追跡し、話者がともにビュー内に納まるように出席者ビューカメラをズームインする。 (もっと読む)


【課題】大部屋でも使用可能な音漏れの少ない局所再生装置を提供する。
【解決手段】この発明の局所再生装置は、2つのスピーカーアレーが向かい合わせに配置され、そのスピーカーアレーを構成するスピーカーにそれぞれ対応する互いに独立なディジタルフィルタを含み、ディジタルフィルタは、各スピーカーから出力される各音響信号を、各スピーカーから各制御点までが自由空間であると近似して各スピーカーから各制御点までの各距離によってそれぞれ定まる関数である各近似伝達関数を畳み込んで各制御点で混合した場合に、その畳み込み混合信号が2つのスピーカーアレーが対向する間に位置する再生領域における再生制御点で否零となり、再生領域を除く複数の抑圧制御点で零となるフィルタ係数が設定されたディジタルフィルタである。 (もっと読む)


【課題】音響エコーを的確に除去できるように、音声出力部の出力態様を調整して、音響エコーの低減を図ること
【解決手段】マイク214と、スピーカ213とを備えるテレビ会議端末110であって、テスト信号発生部301は、テスト音声信号を生成する。音声I/F205は、テスト音声信号をテスト音声に変換してスピーカ213によって出力させる。残留エコー測定部303は、出力されたテスト音声がマイク214によって入力されることによって生じる音響エコー情報を測定する。出力態様制御部302は、測定された音響エコー情報に基づいて、スピーカ213の出力態様を変更する。 (もっと読む)


【課題】複数の映像オブジェクトや音響オブジェクトが混在する中から、映像オブジェクトと音響オブジェクトとを対応づける映像音響処理装置、映像音響処理方法及びプログラムを提供すること。
【解決手段】本発明は、入力映像信号から映像オブジェクトを分離する映像オブジェクト分離部と、前記分離した映像オブジェクトの位置を算出する映像オブジェクト位置算出部と、入力音響信号から音響オブジェクトを分離する音響オブジェクト分離部と、前記分離された音響オブジェクトの位置を算出する音響オブジェクト位置算出部と、前記算出された映像オブジェクトの位置と前記算出された音響オブジェクトの位置との相関に基づいて、前記映像オブジェクトと音響オブジェクトとを対応付けるオブジェクト対応付け部とを有する映像音響処理装置である。 (もっと読む)


【課題】遠隔コミュニケーション装置、遠隔コミュニケーション方法、および遠隔コミュニケーションシステムを提供すること。
【解決手段】第1のユーザの映像を受信して第2のユーザに提示するための遠隔コミュニケーション装置であって、前記第1のユーザの映像を撮像する撮像装置のズームを制御するズーム制御部と、前記撮像装置のズーム量に基づき、前記撮像装置と前記第1のユーザとの間の距離を推定する推定部と、を備える遠隔コミュニケーション装置を構成する。 (もっと読む)


【課題】映像を表示する画面に対する操作から、制御対象の音声を特定し、制御することができる情報処理システム、情報処理装置、及び情報処理方法を提供すること。
【解決手段】情報処理システムは、複数のマイクロホンと、撮像装置と、音声を処理する音声処理装置と、音声処理装置に対して音声制御情報を出力する情報処理装置とを有し、情報処理装置は、映像を表示する表示部と、表示部の表示画面上の座標位置を入力する座標入力部と、座標入力部によって入力された座標位置付近に音声調整インタフェースを映像に重ねて表示部に表示させ、内部又は外部の記憶部に記憶された対応情報に基づいて、映像中の座標位置に対応する位置の音声を取得するマイクロホンのマイク識別子を特定し、特定されたマイク識別子及び音声調整インタフェースに対する座標入力部からの入力に応じた音声処理情報を含む音声制御情報を出力する制御部と、を有する。 (もっと読む)


【課題】テレビ会議システムにおいて、自拠点と通信相手拠点との会話を円滑に進めることができる映像通信装置を提供する。
【解決手段】映像通信装置100であって、マイク120に収音された音の音源の位置を示す音源位置情報を生成する音源位置情報生成部104と、音源位置情報が示す音源の位置に、音源を示す音源情報が表示されるように、映像に音源情報が付加された映像の映像信号を生成する映像信号生成部105と、映像信号生成部105が生成した映像信号を映像再生装置300へ送信する映像信号送信部106と、収音信号を映像再生装置300へ送信する収音信号送信部107と、音源からの音の音量を増減する指示を示す制御信号を映像再生装置300から受信し、収音信号を変化させる収音信号制御部108とを備え、収音信号送信部107は、さらに、収音信号制御部108が変化させた後の収音信号を映像再生装置300へ送信する。 (もっと読む)


【課題】演算量の増大を抑えつつ、スピーカ以外の放音位置を精度良く検出して、当該放音位置に撮像装置の画角を向けることが可能な音声処理装置を提供する。
【解決手段】スピーカ11により放音されてエコー信号b(t)として音声信号m(t)に重畳されてマイクロフォン12a、12bにより検出される伝搬経路の伝達関数h(t)の振幅周波数関数を用いて、音声信号m(t)に対するエコー信号b(t)を除いた音声信号s(t)の割合を示す振幅周波数関数G(ω)を算出し、算出された振幅周波数関数G(ω)を用いて重み付けした方向スペクトルに基づいて音声信号s(t)の放音位置を検出して、検出した音声信号s(t)の放音位置にカメラ13の画角を向けるように制御する。 (もっと読む)


【課題】発話者の追跡の精度を向上させる。
【解決手段】この発明の複数信号区間推定装置は、センサ部と、音声信号区間推定部と、発話者方向推定部と、顔位置検出部と、情報統合部とを具備する。音声信号区間推定部はマイクロホンからの音響信号を周波数分析した周波数スペクトルを入力として、センサ部を中心とする平面の全領域に対する音声の存在確率を推定する。発話者方向推定部は音響信号の周波数スペクトルを用いて各領域における発話者の存在確率を推定する。顔位置検出部はカメラからの映像信号を入力として、談話参加者の顔の重心の方向に基づき各領域における談話参加者の存在確率を推定する。情報統合部は音声の存在確率と発話者の存在確率と談話参加者の存在確率を入力として各領域内の特定領域において談話参加者が発話した確率を算出する。 (もっと読む)


【課題】複数の入力から決定される直接関係のある情報と、テレビ電話会議に関連した計算されたパラメータとを効果的に決定し表示する。
【解決手段】個人情報を効果的に決定し表示する方法は、現在話している人の個人情報をすべての参加者に提示するために、エンドポイントにおけるユーザからの入力と、テレビ会議中に計算される情報とを用いて実行される。テレビ会議システムは、典型的に、多地点で複数の人々によって用いられる。本方法は、より多くのユーザ相互作用および参加者間の知識の移転を可能にする。異なる場所において情報を共有することにより、参加者は、いつでも誰が話しているかと、その特定の人が言っていることに適用すべき重要性とをより意識する。 (もっと読む)


【課題】臨場感を維持しつつ、会議を効率的に再現可能とすること。
【解決手段】反射鏡によって入力された全周囲の画像を撮影する広角画像入力部801と、音声を入力する音声入力部802と、音声入力部802により入力された音声に基づいて音源方向を検出する音源方向検出部803と、広角画像入力部801により入力された画像をパノラマ画像に変形する画像変形部805と、前記パノラマ画像を構成する領域に含まれる画像のうち、音声入力部802から入力した音声の時間差もしくは強度に基づいて音源方向検出部803が検出した音源方向に対応する領域のパノラマ画像を抽出して、前記パノラマ画像ととともに部分画像として表示する画像音声出力部808と、を備える。 (もっと読む)


【課題】複数の通信端末を用いて遠隔会議等を行う際に、発言者の偏りを軽減することのできる技術を提供する。
【解決手段】端末10は、マイクロホンで収音した音声を表す音声データと撮影部で撮影した映像を表す映像データとを、他の端末10に送信する。また、端末10は、他の端末10から映像データと音声データとを受信し、受信した音声データをスピーカから音として放音するとともに、映像データを表示部に出力して映像を表示する。このとき、制御部は、マイクロホンで収音された音声を表す音声データの音圧を検出し、音圧の時間的な変化を解析して利用者の発言時間を算出する。制御部は、算出結果から端末10毎の発言時間の割合を算出し、算出結果を示すデータを表示部に出力することによって、算出結果を会議の参加者に報知する。 (もっと読む)


1 - 20 / 52