説明

音源方向推定装置

【課題】マイクロフォンの感度特性にばらつきがある場合であっても音源の方向を精度良く推定することができる音源方向推定装置を提供する。
【解決手段】音源方向推定装置20では、各マイク1〜4から出力され各アンプ5〜8によって増幅されたそれぞれの電気信号における可聴域内の所定範囲の周波数成分を各BPF21〜24により通過させ、音源方向演算部27によって、各BPF21〜24を通過した周波数成分に基づいて音源の方向を推定する。ここで、各マイク1〜4に対応して電気信号から周波数成分を生成する際の増幅度を増幅度調整部26により互いに調整することで、所定範囲の周波数において感度特性の相違を低減するような増幅度の調整を可能とし、各マイク1〜4ごとの感度特性のばらつきを低減した周波数成分を得、ばらつきを低減した周波数成分を用いて音源の方向を精度良く推定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音源方向推定装置に関する。
【背景技術】
【0002】
従来、下記特許文献1に示されるように、テレビ会議等に適用される制御システムであって、撮像装置と複数のマイクロフォンとが筺体に設けられ、各マイクロフォンにより話者の音声を集音して電気信号に変換し、変換された電気信号を用いて話者(音源)の方向を算出するシステムが知られている。このシステムでは、算出した方向に撮像装置が向けられるよう撮像装置の角度を制御することで、話者を撮像できるようにしている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−214753号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記のように複数のマイクロフォンによって話者の方向を算出するシステムでは、通常、各マイクロフォンから出力される電気信号をアンプにより増幅し、増幅された電気信号の出力値を用いて音源の方向を算出する。ところが各マイクロフォンは、個体差により感度特性に多少のばらつきを有している。そこで、個々のマイクロフォンにおける感度特性のばらつきを低減するため、例えばシステムの工場出荷前において、基準音源に対する出力値を合わせるようにアンプの増幅度を調整するのが一般的である。
【0005】
しかしながら、従来の技術では、アンプの増幅度の調整により一定の周波数に応じて出力値を合わせることはできたものの、個々のマイクロフォンの感度特性は周波数によってまちまちであるため、実際の使用時においてマイクロフォンに入力される音の周波数が調整時の基準音源の周波数とは異なる場合、結果的には各マイクロフォンにおける出力値に誤差が生じてしまっていた。そのため、音源の方向を精度良く算出することは難しかった。
【0006】
本発明は、マイクロフォンの感度特性にばらつきがある場合であっても音源の方向を精度良く推定することができる音源方向推定装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る音源方向推定装置は、音源で生じた音を入力し音を電気信号に変換する複数のマイクロフォンと、複数のマイクロフォンのそれぞれから出力された電気信号を増幅する増幅手段と、増幅手段によって増幅されたそれぞれの電気信号における可聴域内の所定範囲の周波数成分を通過させるバンドパスフィルタと、バンドパスフィルタを通過した周波数成分に基づいて音源の方向を推定する音源方向推定手段と、を備え、複数のマイクロフォンに対応して電気信号から周波数成分を生成する際の増幅度が互いに調整可能に構成されていることを特徴とする。
【0008】
本発明に係る音源方向推定装置によれば、複数のマイクロフォンのそれぞれから出力された電気信号が増幅手段によって増幅され、増幅されたそれぞれの電気信号における可聴域内の所定範囲の周波数成分がバンドパスフィルタを通過する。そして、音源方向推定手段によって、バンドパスフィルタを通過した周波数成分に基づいて音源の方向が推定される。ここで、複数のマイクロフォンに対応して電気信号から周波数成分を生成する際の増幅度が互いに調整可能に構成されているので、個々のマイクロフォンの感度特性が周波数により異なっている場合でも、所定範囲の周波数において感度特性の相違を低減するような増幅度の調整が可能となる。よって、マイクロフォンごとの感度特性のばらつきが低減された周波数成分が得られる。こうしてばらつきが低減された周波数成分を用いて、音源方向推定手段によって音源の方向が推定されるため、音源の方向を精度良く推定することができる。
【0009】
ここで、バンドパスフィルタを通過した周波数成分のうち、少なくとも一つのマイクロフォンに対応した周波数成分の増幅度を調整する増幅度調整手段を備えると好適である。
【0010】
このような構成によれば、バンドパスフィルタを通過した周波数成分のうち、少なくとも一つのマイクロフォンに対応した周波数成分の増幅度が増幅度調整手段によって調整されるので、バンドパスフィルタにより抽出された周波数成分における感度特性の相違を低減するように増幅度の調整を行うことができ、上記した方向推定精度の向上効果が好適に発揮される。
【0011】
また、増幅手段は、複数のマイクロフォンから出力された電気信号のうち、少なくとも一つのマイクロフォンから出力された電気信号の増幅度を調整する増幅度調整手段を有すると好適である。
【0012】
このような構成によれば、増幅手段では、複数のマイクロフォンから出力された電気信号のうち少なくとも一つのマイクロフォンから出力された電気信号の増幅度を増幅度調整手段によって調整することができ、所定範囲の周波数において感度特性の相違を低減するような増幅度の調整が可能となる。そして、所定範囲の周波数成分をバンドパスフィルタにより抽出することでマイクロフォンごとの感度特性のばらつきが低減された周波数成分が得られ、上記した方向推定精度の向上効果が好適に発揮される。
【0013】
ここで、複数のマイクロフォンは、音を取り込むための開口が形成された筺体の内部に埋設されており、開口を通って筺体内に伝搬する音を入力すると好適である。
【0014】
このような構成によれば、開口とマイクロフォンとを結ぶ方向線に対してある角度だけずれた位置で生じた音は、開口付近で回折してマイクロフォンに達する。この回折によって音は減衰するが、音源の位置する角度と音の減衰量とは、音の周波数に応じた相関関係を有する。すなわち、周波数が低い音では、角度が大きくなっても減衰量は小さいが、周波数が高い音では、角度が大きくなるほど減衰量は増大する。増幅手段によって増幅されたそれぞれの電気信号における所定範囲の周波数成分がバンドパスフィルタを通過することで、音源の位置する角度との高い相関関係を有する帯域の周波数成分を抽出することができる。そして、バンドパスフィルタを通過した周波数成分を用いて音源の方向が推定されるため、それ自体は指向性を有しない無指向性のマイクロフォンを用いた場合であっても、音源の方向を精度良く推定することができる。
【発明の効果】
【0015】
本発明によれば、マイクロフォンの感度特性にばらつきがある場合であっても音源の方向を精度良く推定することができる。
【図面の簡単な説明】
【0016】
【図1】本発明の一実施形態に係る音源方向推定装置が適用されたテレビ会議用カメラの斜視図である。
【図2】図2(a)は図1のテレビ会議用カメラにおける開口を含む位置の断面図であり、図2(b)は図2(a)中の筒状体の軸線方向から見た側面図である。
【図3】図1のテレビ会議用カメラの機能構成を示すブロック図である。
【図4】図3中の増幅度調整部における増幅度の調整を説明するための図である。
【図5】筒状体の軸線に対して音源の方向がなす角度を示す模式図である。
【図6】図6(a)はテレビ会議用カメラに対する音源の位置を示す図であり、図6(b)は図6(a)の場合のマイクロフォンの感度特性を示す図である。
【発明を実施するための形態】
【0017】
以下、本発明の一実施形態に係る音源方向推定装置について図面を参照しながら説明する。以下の説明では、音源方向推定装置がテレビ会議用カメラに適用される場合について説明する。
【0018】
図1〜図3に示すように、テレビ会議用カメラAは、例えばテレビ会議に参加する複数の参加者により囲まれた位置に設置されて、発言する参加者(以下、「発言者」という)の方向を推定してその方向へカメラ35を向けることにより、発言者の映像を取得するものである。テレビ会議用カメラAは、ネットワークを介して相手方のテレビ会議システムと通信可能になっている。
【0019】
テレビ会議用カメラAは、テーブル等に載置される直径約10cmの略円筒形状で樹脂製の第1筺体10aと、第1筺体10aの軸線に沿って鉛直方向に配置された軸(図示せず)を介して第1筺体10aの上側に取り付けられ、その軸を中心として第1筺体10aに対して回転可能な略直方体形状で樹脂製の第2筺体10bとを有している。カメラ35は、第2筺体10b内に収納されている。
【0020】
第1筺体10aの側面には、同じ高さで周方向に90°ずつ離間する位置に4つの円形の開口11〜14が形成されている。各開口11〜14は、テレビ会議用カメラAの周囲で発せられた発言者の音声を第1筺体10a内に取り込むための穴であり、内径が約8mmになっている。
【0021】
第1筺体10aの内面側には、各開口11〜14から第1筺体10a内に向けて第1筺体10aの半径方向に延びる円筒形状の4本の筒状体16〜19が固定されている。各筒状体16〜19の内径は約8mmであり、各開口11〜14の内周面と各筒状体16〜19の内壁面とは略面一になっている。各筒状体16〜19は、これらの内部に直径約8mmの円柱形上の伝搬路B1〜B4を形成している。すなわち、各伝搬路B1〜B4は、各開口11〜14から第1筺体10a内に向けて第1筺体10aの半径方向に水平に延びるように形成されている。なお、各開口11〜14は、第1筺体10aの外壁に形成された穴を意味しており、各開口11〜14には、各筒状体16〜19及び各伝搬路B1〜B4は含まれない。
【0022】
更に、第1筺体10aの中心側に位置する各筒状体16〜19の端部には、前面が各開口11〜14に平行になるようにして円柱形状の4個のマイクロフォン(以下、「マイク」という)1〜4が埋設されている。各マイク1〜4は、例えば直径約7mm、厚さ約4mmの、前面側でのみ集音可能な無指向性のエレクトリックコンデンサマイクである。各マイク1〜4は、直径約5mmの円形のダイヤフラムからなる振動板1a〜4aを内蔵している。各開口11〜14から各マイク1〜4の前面までの最短距離は約10mmであり、各開口11〜14の内径よりも長くなっている。また、上記したように、伝搬路B1〜B4の内径(断面)は、振動板1a〜4aよりも大きくなっている(図2参照)。これにより、伝搬路B1〜B4を通る音は振動板1a〜4aに確実に伝達されるようになっている。各マイク1〜4と各筒状体16〜19の内壁面との間には、スペーサ(図示せず)が配設されている。
【0023】
このような構成により、テレビ会議用カメラAでは、会議における発言者の音声が開口11〜14及び伝搬路B1〜B4を通じてマイク1〜4に入力される仕組みとなっている。そして、マイク1〜4に入力される音声により振動板1a〜4aが振動させられ、この振動に応じて音声が電気信号に変換され、電気信号がマイク1〜4からアンプ5〜8へ出力される(図3参照)。なお、マイク1〜4の背面側の内部空間Sには第1筺体10aの外部の音が伝搬しない構成になっている。
【0024】
図3に示すように、テレビ会議用カメラAは、マイク1〜4に入力された音声に基づいて所定の処理を施すことにより、発言者の方向を推定する機能を備えている。具体的には、テレビ会議用カメラAは、各マイク1〜4から出力された電気信号を入力し、入力した電気信号を増幅させる4個のアンプ(増幅手段)5〜8と、各アンプ5〜8によって増幅された各電気信号における所定範囲の周波数成分を通過させるバンドパスフィルタ(以下、「BPF」という)21〜24と、各BPF21〜24を通過した各周波数成分をアナログ−デジタル(Analog−Digital)変換するAD変換部25と、AD変換部25でデジタル変換された各周波数成分のうち、マイク1〜4の少なくとも一つに対応した周波数成分の増幅度を調整する増幅度調整部26と、増幅度調整部26から出力された周波数成分を用いて音源の方向を推定する音源方向演算部(音源方向推定手段)27、ヒストグラム登録部28、及び音源方向再演算部29とを備えている。
【0025】
アンプ5〜8は、マイク1〜4に各々接続されており、各マイク1〜4から出力された電気信号を増幅回路により増幅させる。各アンプ5〜8は、増幅させた電気信号を各BPF21〜24に出力する。
【0026】
各BPF21〜24は、各アンプ5〜8から出力された電気信号を入力し、入力した電気信号のうち、例えば2.5kHz以下及び6.5kHz以上の周波数成分を遮断することにより、2.5kHz〜6.5kHzの範囲の周波数成分を通過させる。各BPF21〜24によって通過させられる周波数の範囲は、可聴域内にある所定の範囲とされる。各BPF21〜24は、2.5kHz以下の周波数成分を遮断するハイパスフィルタと、6.5kHz以上の周波数成分を遮断するローパスフィルタとを組み合わせることにより構成される。
【0027】
AD変換部25は、各BPF21〜24を通過した各周波数成分をアナログ信号からデジタル信号に変換する。AD変換部25は、BPF21〜24のいずれから出力された周波数成分であるかを識別する機能を有してもよいし、各アンプ5〜8に対応して複数設けられてもよい。AD変換部25は、デジタル信号に変換した周波数成分を生成し、その周波数成分がマイク1〜4のいずれに対応する周波数成分であるかを示す信号と共にその周波数成分を増幅度調整部26に出力する。
【0028】
増幅度調整部26は、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成されている。増幅度調整部26は、AD変換部25から出力された周波数成分を入力し、入力した周波数成分のうち、感度特性が他のマイクに対してずれたマイクに対応する周波数成分の増幅度を調整する。言い換えれば、増幅度調整部26は、各マイク1〜4に対応して電気信号から周波数成分を生成する際の増幅度を互いに調整することができる。
【0029】
より具体的に説明すると、マイク1〜4の感度特性は、個体差によりばらつきを有している。図4は、増幅度調整部26における増幅度の調整を説明するための図である。図4において、横軸は周波数を示しており、縦軸は、ある基準音をマイクの正面の一定距離離れた位置から発生させた場合における、基準値に対するマイクの出力値の相対値(すなわち感度)を示している。図4に示す例では、マイク1とマイク2とでは周波数によって感度特性が異なっている。すなわち、マイク1では周波数が高くなるにつれて相対値が低下するのに対し、マイク2では周波数が高くなるにつれて相対値が上昇する。言い換えれば、マイク1は低い周波数で感度が高く、マイク2は高い周波数で感度が高くなっている。
【0030】
この場合、増幅度調整部26は、各BPF21〜24によって通過させられる2.5kHz〜6.5kHzの範囲における感度がマイク1とマイク2とで略等しくなるよう、マイク2の増幅度を調整する。増幅度調整部26による増幅度の調整は、AD変換部25から出力された周波数成分に対して感度特性の相違に応じた一定の係数を乗じることで行われる。より具体的には、増幅度を増加させる場合には1以上の係数が用いられ、増幅度を減少させる場合には1未満の係数が用いられる。この係数は、例えば工場出荷前において、基準音を用いた試験によって各マイク1〜4に応じて適宜設定され、増幅度調整部26に格納される。このように、増幅度調整部26による単純な演算によりマイク1〜4の感度特性を揃えることができるので、音源の方向の推定精度の向上が図られ、テレビ会議用カメラAによる発言者の撮影が確実に行われる。
【0031】
なお、増幅度調整部26による増幅度の調整は、係数を乗じる場合に限られず、各BPF21〜24によって通過させられる範囲の周波数において各マイク1〜4の感度のばらつきを低減し得る手法であれば、いずれの手法が用いられてもよい。また、図4ではマイク1及びマイク2がそれぞれ周波数に応じて一定の傾向で変化する感度特性を有する場合を例として示したが、実際にはマイクの感度特性は周波数に対して不規則にばらつくことが一般的であり、そのような場合でも、BPF21〜24における所定範囲の周波数成分の抽出と増幅度調整部26における増幅度の調整とによって、各マイク1〜4の感度特性のばらつきを低減することができる。
【0032】
増幅度調整部26は、増幅度が調整されたマイクに対応する周波数成分と、増幅度が調整されていないマイクに対応する周波数成分とを、各周波数成分がマイク1〜4のいずれに対応する周波数成分であるかを示す信号と共に音源方向演算部27に出力する。
【0033】
音源方向演算部27、ヒストグラム登録部28、及び音源方向再演算部29は、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成されている。音源方向演算部27、ヒストグラム登録部28、及び音源方向再演算部29は、増幅度調整部26から出力された周波数成分に基づいて発言者の方向を演算することにより、発言者の方向を推定する。
【0034】
具体的には、音源方向演算部27は、増幅度調整部26から出力された各周波数成分に基づいて、各マイク1〜4に対応する周波数成分の出力値(音の大きさ)を比較することにより、音声が発せられた音源の方向を演算する。音源方向演算部27での音源の方向の演算処理としては、公知の技術を用いることができる。テレビ会議用カメラAにおける音源の方向は、第1筺体10aの周方向の所定位置(例えば開口11の中心位置)を基準として、第1筺体10aの上方から見た場合に時計回りを正とした角度(0°〜360°)で表される。音源方向演算部27による音源の方向の演算は、所定時間毎、例えば40ミリ秒毎に実行される。
【0035】
前述したように、マイク1〜4は、開口11〜14から第1筺体10a内に所定長(例えば約10mm)入り込んだ位置に埋設されているため、周波数が高い音ほど、マイク1〜4に達する音は回折により減衰する。例えば、図5に示すように、マイク1の中心と開口11の中心とを結ぶ方向線(すなわち筒状体16の軸線)に対して音源の位置する方向が角度θだけずれていると、周波数の高い音は、角度θずれている分減衰してマイク1に達する。そして、各BPF21〜24により2.5kHz以上の周波数成分が通過させられるため、角度の影響を受けた出力値が音源方向演算部27に入力され、各マイク1〜4に対応する出力値の比較により、音源方向演算部27における音源の方向の演算が精度良く行われる。音源方向演算部27は、演算した所定時間毎の音源の方向をヒストグラム登録部28に出力する。
【0036】
ヒストグラム登録部28は、音源方向演算部27から出力された音源の方向を入力し、入力した音源の方向を逐次記憶する。ヒストグラム登録部28による音源の方向の記憶では、常に、最も古いデータに最新のデータが上書きされる。そして、ヒストグラム登録部28は、記憶した音源の方向を20°刻みで18段階の角度範囲に分類し、分類結果に応じてヒストグラムを生成する。ヒストグラム登録部28は、生成したヒストグラムを音源方向再演算部29に出力する。
【0037】
音源方向再演算部29は、ヒストグラム登録部28から出力されたヒストグラムを入力し、入力したヒストグラムの中で度数が最大である角度範囲における度数と、この角度範囲の近傍の角度範囲における度数とに基づいて角度範囲の平均値を求めることにより、音源の方向を再演算する。音源方向再演算部29は、再演算した音源の方向を発言者の方向としてモータ制御部31に出力する。
【0038】
こうして、音源方向演算部27、ヒストグラム登録部28、及び音源方向再演算部29による音源の方向の演算処理が行われ、発言者の方向が推定される。図1及び図3に示すように、テレビ会議用カメラAでは、第1筺体10a、開口11〜14、筒状体16〜19、マイク1〜4、アンプ5〜8、BPF21〜24、AD変換部25、増幅度調整部26、音源方向演算部27、ヒストグラム登録部28、及び音源方向再演算部29を備えて音源方向推定装置20が構成されている。
【0039】
更に、図3に示すように、テレビ会議用カメラAは、音源方向推定装置20によって推定された音源の方向へカメラ35を向け、カメラ35により発言者の映像を取得する機能を備えている。具体的には、テレビ会議用カメラAは、音源方向再演算部29から出力された音源の方向に基づいてモータ駆動部32を制御するモータ制御部31と、モータ制御部31により制御されてモータ33を駆動させるモータ駆動部32と、モータ駆動部32により駆動させられてカメラ回転機構34に回転力を与えるモータ33と、モータ33に連結されて回転により第2筺体10bと共にカメラ35を旋回させるカメラ回転機構34と、映像を取得するカメラ35と、カメラ35より取得された映像の映像データを映像処理する映像処理部36と、映像処理部36により処理された映像データを転送するデータ転送部37と、データ転送部37により転送された映像データをネットワークに送信するネットワーク通信部38とを備えている。
【0040】
次に、このようなテレビ会議用カメラAにおける動作について説明する。以下の説明では、図6(a)に示すように、開口11と開口12とから等しい距離で開口13及び開口14とは反対側の45°に位置する発言者から音声が発せられた場合を例として説明する。図6(b)に示すように、各マイク1〜4に対応する周波数成分の出力値は、2.5kHz〜10kHzの間でピーク値に差が見られる。より具体的には、2.5kHz〜10kHzの間に見られる出力値は、マイク1,2では同等であり、マイク3,4ではマイク1,2よりも減衰している。一方、2.5kHz以下に見られる出力値は、マイク1〜4で略等しくなっている。
【0041】
音源方向推定装置20では、各BPF21〜24によって2.5kHz以下及び6.5kHz以上の周波数成分は遮断されることにより、2.5kHz〜6.5kHzの範囲の周波数成分が通過させられる。図6(b)に示す例の場合、回折の影響を大きく受けた2.5kHz〜6.5kHzの範囲の成分が出力値として抽出される。更に、増幅度調整部26によって、2.5kHz〜6.5kHzの範囲で各マイク1〜4の感度が略等しくなるよう、マイク1〜4の少なくとも一つに対応した周波数成分の増幅度が調整される。そして、増幅度調整部26から出力された各周波数成分を用いて音源の方向が演算され、音源は、45°の位置にあると推定される。音源方向推定装置20は、45°を示す信号をモータ制御部31に出力する。
【0042】
モータ制御部31は、音源方向推定装置20から出力された45°を示す信号を入力し、モータ駆動部32を制御してモータ33を駆動させ、カメラ35が45°の方向へ向くように、カメラ回転機構34によってカメラ35を第2筺体10bと共に旋回させる。なお、モータ制御部31によるカメラ35の旋回制御は、所定時間連続して一定範囲内の音源の方向が入力された際に、入力された一定範囲内の音源の方向の平均値を用いて実行されてもよい。
【0043】
カメラ35は、前方の映像を取得し、取得した映像を示す映像データを生成する。カメラ35は、生成した映像データを映像処理部36に出力する。映像処理部36は、カメラ35から出力された映像データを入力し、入力した映像データに映像処理を施し、映像処理後の映像データをデータ転送部37に出力する。データ転送部37は、映像処理部36から出力された映像データを入力し、入力した映像データをネットワーク通信部38に転送する。そして、ネットワーク通信部38は、データ転送部37から転送された映像データをネットワークを介して相手方のテレビ会議システムに送信する。
【0044】
本実施形態の音源方向推定装置20によれば、各マイク1〜4から出力された電気信号が各アンプ5〜8によって増幅され、増幅されたそれぞれの電気信号における可聴域内の所定範囲の周波数成分が各BPF21〜24を通過する。そして、音源方向演算部27によって、各BPF21〜24を通過した周波数成分に基づいて音源の方向が推定される。ここで、各マイク1〜4に対応して電気信号から周波数成分を生成する際の増幅度は、増幅度調整部26によって互いに調整可能に構成されているので、各マイク1〜4の感度特性が周波数により異なっている場合でも、所定範囲の周波数において感度特性の相違を低減するような増幅度の調整が可能となる。よって、各マイク1〜4ごとの感度特性のばらつきが低減された周波数成分が得られ、ばらつきが低減された周波数成分を用いて、音源方向演算部27によって音源の方向が推定されるため、音源の方向を精度良く推定することができる。
【0045】
更に、各アンプ5〜8によって増幅された各電気信号における所定範囲の周波数成分がBPF21〜24を通過することで、音源の位置する角度との高い相関関係を有する帯域の周波数成分を抽出することができ、各BPF21〜24を通過した周波数成分を用いて音源の方向が推定されるため、無指向性のマイク1〜4を用いた場合であっても、音源の方向を精度良く推定することができる。
【0046】
以上、本発明の好適な実施形態について説明したが、本発明は上記実施形態に限られるものではない。
【0047】
例えば、上記実施形態では、各BPF21〜24を通過した周波数成分のうち少なくとも一つのマイクに対応した周波数成分の増幅度が増幅度調整部26によって調整される場合について説明したが、増幅度調整手段は、各アンプ5〜8に設けられてもよい。すなわち、各アンプ5〜8は、各マイク1〜4から出力された電気信号の増幅度を調整するための調整機構(例えば調整つまみ)を増幅度調整手段として有してもよい。この場合、各マイク1〜4から出力された電気信号のうち少なくとも一つのマイクから出力された電気信号の増幅度を調整機構によって調整することで、上記実施形態と同様にして、各マイク1〜4の感度特性のばらつきを低減することができる。
【0048】
また、上記実施形態では、4個のマイク1〜4が設けられる場合について説明したが、マイクの設置個数は2又は3個であってもよく、5個以上であってもよい。また、BPF21〜24によって通過させられる周波数の範囲は、マイクの特性に応じて可聴域内の範囲で適宜設定することができる。このように可聴域内の範囲とすることで、人によって聴くことのできるあらゆる周波数の音源に音源方向推定装置を適用することができ、音源方向推定装置としての汎用性が高められる。
【0049】
更にまた、上記実施形態では、音源方向推定装置20がテレビ会議用カメラAに適用される場合について説明したが、複数のマイクを備えて音源の方向を推定し、推定した音源の方向を利用する装置であればこれに限られない。例えば、本発明の音源方向推定装置は、異常音を検知して、その異常音が発生した音源の方向を映す監視カメラ等にも適用できる。
【符号の説明】
【0050】
1〜4…マイク、5〜8…アンプ(増幅手段)、10a…筺体、11〜14…開口、20…音源方向推定装置、21〜24…BPF、26…増幅度調整部(増幅度調整手段)、27…音源方向演算部(音源方向推定手段)。

【特許請求の範囲】
【請求項1】
音源で生じた音を入力し前記音を電気信号に変換する複数のマイクロフォンと、
前記複数のマイクロフォンのそれぞれから出力された前記電気信号を増幅する増幅手段と、
前記増幅手段によって増幅されたそれぞれの前記電気信号における可聴域内の所定範囲の周波数成分を通過させるバンドパスフィルタと、
前記バンドパスフィルタを通過した前記周波数成分に基づいて前記音源の方向を推定する音源方向推定手段と、を備え、
前記複数のマイクロフォンに対応して前記電気信号から前記周波数成分を生成する際の増幅度が互いに調整可能に構成されている
ことを特徴とする音源方向推定装置。
【請求項2】
前記バンドパスフィルタを通過した前記周波数成分のうち、少なくとも一つの前記マイクロフォンに対応した周波数成分の増幅度を調整する増幅度調整手段を備えることを特徴とする請求項1記載の音源方向推定装置。
【請求項3】
前記増幅手段は、前記複数のマイクロフォンから出力された前記電気信号のうち、少なくとも一つの前記マイクロフォンから出力された電気信号の増幅度を調整する増幅度調整手段を有することを特徴とする請求項1又は2記載の音源方向推定装置。
【請求項4】
複数の前記マイクロフォンは、前記音を取り込むための開口が形成された筺体の内部に埋設されており、前記開口を通って前記筺体内に伝搬する前記音を入力することを特徴とする請求項1〜3のいずれか一項記載の音源方向推定装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−234213(P2011−234213A)
【公開日】平成23年11月17日(2011.11.17)
【国際特許分類】
【出願番号】特願2010−103979(P2010−103979)
【出願日】平成22年4月28日(2010.4.28)
【出願人】(000001225)日本電産コパル株式会社 (755)
【Fターム(参考)】