説明

オーディオ信号処理装置およびホール

【課題】音声コンテンツの途切れ目などで、聴取者が周囲の音に意識をそらしてしまうことを回避する技術を提供する。
【解決手段】音声コンテンツの音量レベルを検出し、音量レベルが予め規定された規定値を下回り、且つその下回る期間が予め規定された時間を越えるコンテンツ部分を特定し、そのコンテンツ部分に対しマスキングサウンドを重ね合わせる。コンテンツの途切れ目の無音部分などにおいてマスキングサウンドが付加されることにより、その期間には周囲の音が聞こえにくくなるマスキング効果を生じる。その結果、聴取者はコンテンツに意識を集中することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号の処理技術に関する。
【背景技術】
【0002】
ある音(対象音)が聞こえているときに、対象音に近い周波数を持つ別の音(マスキングサウンド)が存在すると、その対象音が聞こえにくくなるという現象が一般に知られており、マスキング効果と呼ばれている。マスキング効果は、人間の聴覚特性に根ざしたものであり、マスキングサウンドと対象音の周波数が近いほど、また、マスキングサウンドの音量レベルが対象音の音量レベルに対して相対的に高いほど、顕著になることが知られている。
【0003】
このマスキング効果を利用した音響技術は、従来種々提案されており、その一例として特許文献1に開示された技術が挙げられる。特許文献1には、自動車において車内にまで届くギアのノイズをマスキング効果により聞こえにくくする技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005−343401号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、ホールや喫茶店などにおいては、たとえばエリアごとに異なった音声コンテンツ(情報や音楽など)を提供するという必要性が生じることがある。そのような場合、従来はスピーカの配置や音量レベルを調整したり、遮音壁を設置したりするなどの方法がとられてきた。しかしながら、これらの方法を用いたとしても周囲のエリアにおける音声コンテンツが全く聞こえないわけではない。このため、自身に向けられたコンテンツの音量レベルが高い時には聴取者はそのコンテンツに意識を集中しやすいが、曲と曲の間など音量レベルの低い時に、周囲の音に注意をそらしてしまう傾向があった。
【0006】
本発明は、上記の問題に鑑みてなされたものであり、その目的は、聴取者が音声コンテンツの途切れ目などで周囲の音に注意をそらしてしまうことを回避する技術を提供することにある。
【課題を解決するための手段】
【0007】
上述した課題を解決するため、本発明に係るオーディオ信号処理装置は、第1の音声に応じた第1オーディオ信号を受取る受取り手段と、前記受取り手段が受取る第1オーディオ信号から前記第1の音声の音量レベルを検出する検出手段と、前記検出手段により検出される前記第1の音声の音量レベルに連動して連続的に音量レベルが変化させられた第2の音声に応じた第2オーディオ信号を生成する生成手段と、前記生成手段により生成された第2オーディオ信号を出力する出力手段とを有する。
【0008】
好ましくは、前記出力手段は、前記受取り手段により受取られた第1オーディオ信号と前記生成手段により生成された第2オーディオ信号とを出力し、前記生成手段は、前記検出手段により検出される前記第1の音声の音量レベルが低いほど音量レベルが高く設定された第2の音声に応じた第2オーディオ信号を生成するとよい。
【発明の効果】
【0009】
本発明に係るオーディオ信号処理装置およびホールにより、自身に向けられたコンテンツの音量レベルが低いときなどにも聴取者が周囲の音に注意をそらすことを回避し、コンテンツに集中しやすくすることができる。
【図面の簡単な説明】
【0010】
【図1】実施形態に係るオーディオ信号処理装置1が設置されたホール200の全体構成を示した図である。
【図2】実施形態に係るオーディオ信号処理装置1を含む、コンテンツの生成に係る装置の機能構成を示すブロック図である。
【図3】コンテンツAの音量レベルを示したグラフである。
【図4】実施形態に係るオーディオ信号処理装置1が実行する処理を示したフローチャートである。
【図5】変形例(4)におけるオーディオ信号処理装置1の機能構成を示すブロック図である。
【図6】変形例(8)におけるオーディオ信号処理装置1の機能構成を示すブロック図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施形態について図面を用いて説明する。
(構成)
図1は、本発明の実施形態に係るオーディオ信号処理装置が設置されたホール200の概観を示す図である。図1に示すように、ホール200は、15メートル四方で天井の高さは3メートルである。ホール200には、テーブル500A、500Bおよび500Cの3つのテーブルが、各々の中心間の距離が7メートルになるように互いに離されて設置されている。各テーブルには、椅子600が4脚ずつ設置されている。なお、本実施形態では、ホール200は15メートル四方であり、高さが3mである場合について説明するが、ホールの大きさはこのような値に限定されるものではないことは言うまでもない。また、本実施形態では、ホール200に3つのテーブルが配置される場合について説明するが、ホール内に配置されるテーブルの数は2つであってもよく、また、4つ以上であっても勿論良い。同様に、各テーブルに配置される椅子の数も4に限定されるものではなく、また、テーブル毎に椅子の数が異なっていても勿論良い。
【0012】
図1に示すように、テーブル500A、500Bおよび500Cの各々の上方には、照明300A、300Bおよび300Cが天井から釣り下げられ設置されている。各々の照明において、電球は“かさ”で覆われている。それら照明300A、300Bおよび300Cの“かさ”の内側には、それぞれスピーカ400A、400Bおよび400Cが設置されている。
スピーカ400A、400Bおよび400Cの各々には、それぞれ個別に音声コンテンツを出力するオーディオ信号処理装置1A、1Bおよび1Cが接続されている。
【0013】
なお以下では、テーブル500A、500Bおよび500Cの各々を区別する必要がない場合には、「テーブル500」と表記する。同様に上記3つのスピーカについても、その各々を区別する必要がない場合には、「スピーカ400」と表記し、上記3つの照明の各々を区別する必要がない場合には、「照明300」と表記する。また、上記3つのオーディオ信号処理装置の各々を区別する必要がない場合には、「オーディオ信号処理装置1」と表記する。
【0014】
さて、本実施形態に係るオーディオ信号処理装置1は、コンテンツの音量レベルが低くなったときに聴取者が周囲の音に注意をそらしてしまうことを回避するといった課題を、前述したマスキング効果を利用して解決するものである。具体的には、オーディオ信号処理装置1は、音声コンテンツの音量レベルが低くなったときに、上記マスキングサウンドとしてホワイトノイズを再生することによって、上記課題を解決するものである。ここで、ホワイトノイズとは、連続スペクトルを有し、かつ、単位周波数帯域に含まれる各周波数成分の強さがその周波数とは無関係に一定であるノイズのことである。
【0015】
本実施形態において、マスキングサウンドとしてホワイトノイズを用いる理由は、以下の通りである。例えば、スピーカ400Aにより再生される音楽コンテンツの聴取者にとっては、スピーカ400Bや400Cにより再生される他の音声コンテンツや、周囲の人々の会話やざわめきなどの環境音が、注意をそらす原因となり得る。このような他の音声コンテンツや環境音(または、これらを重ね合わせた音)には様々な周波数成分が含まれていることが一般的であり、それらを一括してマスクするマスキングサウンドとしては、連続的な周波数スペクトルを有するホワイトノイズが好適だからである。
【0016】
オーディオ信号処理装置1には、マスキングサウンドとして使用するホワイトノイズの周波数帯域および音量レベルを適宜設定するマスキングサウンド設定手段(図示省略)が設けられている。このため、オーディオ信号処理装置1の操作者は、上記マスキングサウンド設定手段を適宜操作することによって、周囲のエリアにおける音声コンテンツや環境音の周波数帯域をカバーするのに十分な周波数帯域のホワイトノイズを使用するとともに、上記他の音声コンテンツや環境音の音量を考慮して、そのホワイトノイズの音量レベルを適切な値に設定することができる。
以下、本発明の実施形態に係るオーディオ信号処理装置1の構成を詳細に説明する。
【0017】
図2に示すように、オーディオ信号処理装置1には、オーディオ信号出力部10とスピーカ400とが接続されている。オーディオ信号出力部10は、たとえばステレオなどにおけるCD(登録商標)ドライブであり、CDに記録された情報や音楽などのデータを読取り、そのデジタル方式のオーディオ信号を出力する。なお、オーディオ信号出力部10は、CDドライブに限定されるものではなく、ラジオの電波受信部や、マイクなどの音声入力機器なども含まれる。要するに、オーディオ信号出力部10は、オーディオ信号を出力するものであればよい。なお、オーディオ信号出力部10がアナログ方式の信号を出力する機器である場合には、オーディオ信号出力部10とオーディオ信号処理装置1の間に、アナログ方式の信号をデジタル方式に変換する機能を持つA/Dコンバータを設け、オーディオ信号出力部10により出力されるアナログ方式の信号をA/Dコンバータによってデジタル方式へ変換して、オーディオ信号処理装置1へ受け渡すようにすればよい。
【0018】
オーディオ信号処理装置1は、図2において一点鎖線で囲まれた構成、すなわちバッファ20、音量レベル検出部30、判断部40、マスキングサウンド信号生成部50、信号合成部60、D/Aコンバータ70、アンプ80を有する。また、オーディオ信号処理装置1は、これら構成要素のほかに図示せぬ制御部を備える。この制御部はオーディオ信号処理装置1の各部から動作に関する情報を受取り、各部の作動制御を行う。
バッファ20は、RAM(Random Access Memory)であり、オーディオ信号出力部10から出力されたオーディオ信号が書き込まれる。なお、バッファ20に記憶されているオーディオ信号は、その時点で再生されているオーディオ信号よりも時間txだけ後に再生されるオーディオ信号である。
音量レベル検出部30は、バッファ20に記憶されたオーディオ信号を読取り、そのオーディオ信号からコンテンツの音量レベルを検出する。
【0019】
判断部40は、音量レベル検出部30によって検出されたコンテンツの音量レベルから、マスキングサウンドを重ね合わせるコンテンツ部分を後述する基準により特定し、マスキングサウンド信号生成部50に対しマスキングサウンドを重ね合わせるコンテンツ部分を示す信号(たとえば該当するコンテンツ部分の開始および終了時刻を示す信号)を送る。
【0020】
具体的には、判断部40はコンテンツの音量レベルを参照し、次の2点の基準を満たすコンテンツ部分を特定する。
(1)コンテンツの音量レベルが予め規定された規定値を下回る。
(2)(1)を満たすコンテンツ部分について、音量レベルが規定値を継続して下回る期間が予め規定された時間tmを越える。
判断部40は、上記2点の基準を満たすコンテンツ部分を、マスキングサウンドを重ね合わせるコンテンツ部分と特定する。
【0021】
図3dは、時刻t1からt10におけるコンテンツAの音量レベルを示すグラフである。縦軸にコンテンツの音量レベルを、横軸に時刻(コンテンツAの再生開始時からの経過時間)をとっている。図に示すように、コンテンツAは時刻t1からt10において楽曲1と曲間部分と楽曲2を含み、時刻t1において再生途中の楽曲1は時刻t3に終了し、続いて楽曲2は時刻t4に始まり時刻t10に終了する。以下ではこのコンテンツAについて、判断部40がマスキングサウンドを重ね合わせるコンテンツ部分を決定する方法について、具体的に説明する。
【0022】
図3aにおいて前述の音量レベルの規定値は破線で示されている。この場合、時刻taからta+txにおいて、コンテンツAの音量レベルは、時刻t2からt5において規定値を継続して下回り(条件(1))また下回る期間は時間tmを越える(条件(2))。従って判断部40は、時刻t2からt5においてコンテンツAに対しマスキングサウンドを重ね合わせることを決定する。
マスキングサウンド信号生成部50は、判断部40から受信した信号で示されるコンテンツ部分に対応するようにマスキングサウンドのオーディオ信号を生成し、それを前述のコンテンツ部分を示す信号と共に信号合成部60に出力する。
信号合成部60は、生成されたマスキングサウンドのオーディオ信号を、バッファ20に記憶されたコンテンツのオーディオ信号において前述の信号で示されるコンテンツ部分に重ねあわせる。
【0023】
D/Aコンバータ70は、信号合成部60により生成されたオーディオ信号をアナログ信号に変換してアンプ80へ出力する。アンプ80は該アナログオーディオ信号を所定の増幅率で増幅してスピーカ400へ出力する。その結果、スピーカ400からは、オーディオ信号処理装置1により信号処理がなされたオーディオ信号に応じた音声が再生(放音)されることになる。
【0024】
(動作)
次に、本実施形態の動作について、図3dに示すように音量レベルが経時変化するコンテンツAを取り上げて具体的に説明する。
図4は、オーディオ信号処理装置1が実行するオーディオ信号処理の流れを示すフローチャートである。
【0025】
オーディオ信号出力部10でコンテンツAのオーディオ信号が出力され、バッファ20には、その時点で再生されているオーディオ信号よりも時間txだけ後のオーディオ信号まで記憶されている。図3aの時刻taの時点において、音量レベル検出部30はバッファ20に記憶された時刻taからta+txにおけるオーディオ信号を読取り、その音量レベルを検出する。(ステップSA10)図3aには、そのようにして検出された音量レベルが実線で示されている。
【0026】
判断部40は検出された音量レベルと前述した2つの基準とから、マスキングサウンドを重ねあわせる部分が存在するか否か判断し(ステップSA20)、その判断の結果“Yes”ならば、ステップSA30以降の処理を行い、“No”ならばステップSA60以降の処理を行う。
【0027】
本動作例では、時刻taからta+txの間では、時刻t2からt5においてコンテンツAは上記判断基準(1)および(2)を満たすことから(図3a参照)、ステップSA20における判断は“Yes”となり、ステップSA30の処理が実行される。このステップSA30において、判断部40は、マスキングサウンドを重ねあわせるコンテンツAの部分は時刻t2からt5であることを特定し、マスキングサウンドを重ね合わせるコンテンツ部分を示す信号をマスキングサウンド信号生成部50に対し送信する。
【0028】
マスキングサウンド信号生成部50は、判断部40から受信した信号に記されたコンテンツ部分に対応するようにマスキングサウンドのオーディオ信号を生成し(ステップSA40)、生成したマスキングサウンドのオーディオ信号を信号合成部60に送信する。
信号合成部60は、バッファ20からコンテンツAのオーディオ信号を、マスキングサウンド信号生成部50からマスキングサウンドのオーディオ信号を受信し、両者を重ねあわせる(ステップSA50)。信号合成部60により生成されたオーディオ信号は、D/Aコンバータ70およびアンプ80における処理を経て、スピーカ400から再生される(ステップSA60)。
【0029】
次いで、オーディオ信号処理装置1の制御部は、ステップSA60が完了し尚コンテンツが継続しているかどうか判断する(ステップSA70)。コンテンツが継続している場合、ステップSA70における判断は“Yes”となり、コンテンツの続きの部分に対してステップSA10から一連の処理を行う。従って、コンテンツが継続している間は、以上に説明したステップSA10以降の処理が繰り返し実行される。
一方コンテンツが終了した場合、すなわちオーディオ信号出力部10で読取ったCDの楽曲が全て終了したり、CDの再生が停止されたりした場合、ステップSA70における判断は“No”となり、動作を終了する。
以上で説明したように、コンテンツに対してマスキングサウンドを重ねあわせ再生する動作が、コンテンツの終了まで繰り返される。その結果、コンテンツの音量レベルが低いときにコンテンツに対してマスキングサウンドが重ねあわされ、周囲のノイズはマスクされる。
【0030】
上記ステップSA20において、“No”と判断される場合を以下に説明する。図3bは、音量レベル検出部30が検出した時刻tbからtb+txにおけるコンテンツAの音量レベルである。この場合、時刻t6前後において音量レベルに一時的な低下が見られるものの規定値を下回ることはないため、上記判断基準(1)を満たさない。従って判断部40は、時刻tbからtb+txにおいてコンテンツAにはマスキングサウンドを重ねあわせる部分はないと判断する。その結果、マスキングサウンドは重ねあわされることはない。
【0031】
また、図3cには、音量レベル検出部30が検出した時刻tcからtc+txにおけるコンテンツAの音量レベルが示されている。この場合、時刻t7からt8においてコンテンツ中に無音部分が検出される。しかし、音量レベルが規定値を継続して下回る期間は、時間tmを下回っているため、上記判断基準(2)を満たさない。従って判断部40は、時刻tcからtc+txにおいてもコンテンツAにはマスキングサウンドを重ね合わせる部分はないと判断する。その結果、マスキングサウンドは重ねあわされることはない。
【0032】
(変形例)
以上、本発明の一実施形態について説明したが、かかる実施形態に以下に述べるような変形を加えても良いことは勿論である。また、以下に述べる変形を組み合わせて用いてもよい。
【0033】
(1)上記実施例において、判断部40は音量レベルが規定値を下回るコンテンツ部分に対してマスキングサウンドを重ね合わせるよう制御を行った。しかし、上記実施例に示した制御方法以外に、以下に述べる制御方法を用いても良い。すなわち、音量レベル検出部30は、音量レベルを先読みする時間txを更に複数の期間に分割しそれぞれの期間ごとに音量レベルの平均値を検出し、判断部40は、その平均値が規定値を下回った場合に、その期間のコンテンツに対してマスキングサウンドを重ね合わせるという制御を行っても良い。
【0034】
(2)また上記実施例においては、ホワイトノイズをマスキングサウンドとして用いた。しかし、ホワイトノイズ以外の人工的に作成された音や、録音された環境音をホワイトノイズの代わりに用いても良い。この場合、環境音はホール200やその他の場所で予め録音されたものを用いても良いし、別途設けられた録音装置(図示省略)でコンテンツ再生中にホール200の環境音を録音し、それを用いても良い。
【0035】
(3)また上記実施例においては、マスキングサウンドの音量レベルが矩形波状になるように、マスキングサウンドのON/OFFの制御をする場合について説明した。しかし、マスキングサウンドのON/OFFの際に、その音量にフェードインフェードアウトの効果を付しても良い。
【0036】
(4)オーディオ信号処理装置1に、ノイズの音量レベルおよび周波数特性などを検出するノイズ検出部90を設け(図5参照)、ノイズ検出部90により検出されたノイズの特性をマスキングサウンドの制御に反映させても良い。具体的には、検出されたノイズの音量レベルが高いときマスキングサウンドの音量レベルを高くする、もしくは検出されたノイズの周波数に基づき、効果的にノイズをマスクする周波数帯域からなるホワイトノイズを生成すると良い。
【0037】
(5)また上記実施例においては、コンテンツの音量レベルのみに基づいてマスキングサウンドを再生するか否かの制御を行う態様について説明した。しかしながら、コンテンツの音量レベルとノイズのレベルのバランスに基づいて上記の制御を行っても良い。具体的には、コンテンツの音量レベルをノイズの音量レベルで除した比の値が所定の閾値より小さくなった場合にマスキングサウンドを重ね合わせるという制御を行っても良い。なお、上記閾値はオーディオ信号処理装置1の操作者が値を適宜設定できるようにしてもよい。
【0038】
(6)上記実施例においては、コンテンツの音量レベルに規定値を設け、その規定値と比較することによりマスキングサウンドの重ねあわせを行うか否かを決定した。しかし、規定値を設けずにコンテンツの音量レベルに連動して連続的にマスキングサウンドの音量レベルを変化させても良い。具体的には、コンテンツの音量レベルが低いときにはマスキングサウンドの音量レベルを高くするというように、コンテンツの音量レベルとマスキングサウンドの音量レベルに負の相関を持たせるように制御を行うと良い。
【0039】
(7)上述した実施例では、音声コンテンツの音量レベルを、バッファ20および音量レベル検出部30を用いて検出する場合について説明した。しかしながら、コンテンツの音量レベルがどのように経時変化するか予めわかっている場合(たとえば、音声コンテンツに含まれる各楽曲の再生開始時刻、再生終了時刻が記録されたタイムチャートを取得できる場合)、バッファ20および音量レベル検出部30は必須ではない。その場合、判断部40は予めわかっている音量レベルを参照してマスキングサウンドの制御を行えばよい。
【0040】
(8)上記実施形態においては、マスキングサウンドを用いることによりノイズに対して意識が向かないようにすることが可能になるが、マスキングサウンドと併せて、もしくはマスキングサウンドの代わりに振動や光を制御することにより同様の効果を奏することもできる。
具体的には、図6に示すように判断部40に体感振動発生部100および照明制御部110を接続する。体感振動発生部100は、椅子600の内部に設けられた図示せぬ振動体の振動を行う。判断部40は、マスキングサウンドの再生と同じ期間、体感振動発生部100を介し椅子600の振動を行う。その振動の様式(振幅、周波数および振動パターンなど)は、さまざまな制御をおこなっても良い。一方照明制御部110は、照明の明滅および光量を制御する。判断部40は、マスキングサウンドの再生と同じ期間、照明制御部110を介し照明300を制御する。光の明滅パターンや光量変化などは、さまざまな制御をおこなっても良い。振動や光はノイズに対してマスキング効果を持つものではないが、コンテンツの音量レベルが低い時に振動や照明に対して聴取者の意識が向けられることにより、結果的にノイズに意識が向かないようにする効果がある。
【0041】
(9)上記実施例においては、コンテンツのオーディオ信号に対しマスキングサウンドのオーディオ信号を重ねあわせて再生した。しかし、コンテンツとマスキングサウンドのオーディオ信号を重ねあわせることなく近接して設置された別々のスピーカから再生することも可能である。
【符号の説明】
【0042】
1…オーディオ信号処理装置、10…オーディオ信号出力部、20…バッファ、30…音量レベル検出部、40…判断部、50…マスキングサウンド信号生成部、60…信号合成部、70…D/Aコンバータ、80…アンプ、90…ノイズ検出部、100…体感振動発生部、110…照明制御部、200…ホール、300…照明、400…スピーカ、500…テーブル、600…椅子

【特許請求の範囲】
【請求項1】
第1の音声に応じた第1オーディオ信号を受取る受取り手段と、
前記受取り手段が受取る第1オーディオ信号から前記第1の音声の音量レベルを検出する検出手段と、
前記検出手段により検出される前記第1の音声の音量レベルに連動して連続的に音量レベルが変化させられた第2の音声に応じた第2オーディオ信号を生成する生成手段と、
前記生成手段により生成された第2オーディオ信号を出力する出力手段と
を有するオーディオ信号処理装置。
【請求項2】
前記出力手段は、前記受取り手段により受取られた第1オーディオ信号と前記生成手段により生成された第2オーディオ信号とを出力し、
前記生成手段は、前記検出手段により検出される前記第1の音声の音量レベルが低いほど音量レベルが高く設定された第2の音声に応じた第2オーディオ信号を生成する
ことを特徴とする請求項1に記載のオーディオ信号処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−76108(P2011−76108A)
【公開日】平成23年4月14日(2011.4.14)
【国際特許分類】
【出願番号】特願2010−263668(P2010−263668)
【出願日】平成22年11月26日(2010.11.26)
【分割の表示】特願2006−185945(P2006−185945)の分割
【原出願日】平成18年7月5日(2006.7.5)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】