音声信号処理装置及び方法

【課題】楽曲の音楽性を損ねることなく、聴感的に聞き取りやすい再生音を得ることができる音声信号処理装置を提供する。
【解決手段】帯域分割フィルタ２ａ〜２ｅは、第１の音声信号を複数の周波数帯域に分割して、複数の周波数帯域毎の第２の音声信号を出力する。音圧レベル増幅部３ａ〜３ｅは、第２の音声信号を、低音圧レベル領域と高音圧レベル領域とを除く中間音圧レベル領域で、音圧レベルを低音圧レベル領域側から中間音圧レベル領域内の中間点まで順次大きくし、中間点から高音圧レベル領域側まで順次小さくする増幅特性で増幅する。加算部５は、アンプ４ａ〜４ｅの出力を加算して第３の音声信号とする。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、音声信号を処理する音声信号処理装置及び方法に係り、特に、聴感的に聞き取りやすい再生音を得ることができる音声信号処理装置及び方法に関する。
【背景技術】
【０００２】
聴取者が音声信号を聴取する際、スピーカまたはヘッドホンから発せられる再生音が聴感的に聞き取りやすければ、聴取者は聞き疲れしにくい。従って、音声信号を再生するオーディオ機器としては、聴取者が聞き取りやすいと感じる音を再生することが好ましい。このとき、聞き取りやすい音であったとしても、聴取する楽曲の音楽性を損ねることは好ましくない。
【０００３】
従来の音声信号処理装置としては、例えば、特許第３３７３１０３号公報（特許文献１），特開２００２−２８１５９９号公報（特許文献２），特開２０００−２２４６９号公報（特許文献３）に記載のものがある。なお、特許文献１，２には音声信号を帯域分割フィルタによって複数の帯域に分割して信号処理を施すことが記載されている。特許文献３には音声信号の過渡応答特性を改善した音声信号処理装置が記載されている。
【特許文献１】特許第３３７３１０３号公報
【特許文献２】特開２００２−２８１５９９号公報
【特許文献３】特開２０００−２２４６９号公報
【発明の開示】
【発明が解決しようとする課題】
【０００４】
上記特許文献１〜３に記載の発明は、聴感的な聞き取りやすさをある程度改善することはできるが、楽曲の音楽性を損ねてしまうという問題点がある。そこで、楽曲の音楽性を損ねることなく、聴感的に聞き取りやすい再生音を得ることができる音声信号処理装置及び方法の登場が望まれていた。
【０００５】
本発明はこのような問題点に鑑みなされたものであり、楽曲の音楽性を損ねることなく、聴感的に聞き取りやすい再生音を得ることができる音声信号処理装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【０００６】
本発明は、上述した従来の技術の課題を解決するため、第１の音声信号を複数の周波数帯域に分割して、前記複数の周波数帯域毎の第２の音声信号を出力する帯域分割フィルタ（２ａ〜２ｅ）と、前記複数の周波数帯域それぞれの前記第２の音声信号を、前記第２の音声信号の最小音圧レベルから最大音圧レベルまでの範囲における前記最小音圧レベルから所定の範囲の低音圧レベル領域と前記最大音圧レベルから所定の範囲の高音圧レベル領域とを除く中間音圧レベル領域で、音圧レベルを前記低音圧レベル領域側から前記中間音圧レベル領域内の中間点まで順次大きくし、前記中間点から前記高音圧レベル領域側まで順次小さくする増幅特性で増幅する音圧レベル増幅部（３ａ〜３ｅ）と、前記音圧レベル増幅部によって増幅された前記複数の周波数帯域それぞれの前記第２の音声信号を加算して第３の音声信号として出力する加算部（５）とを備えることを特徴とする音声信号処理装置を提供する。
ここで、前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置を少なくとも一部で異ならせることが好ましい。
前記音圧レベル増幅部は、最小可聴限界の音圧レベルが最も小さい部分を含む周波数帯域における前記中間点の位置を、最も前記高音圧レベル領域側に位置させることが好ましい。
前記音圧レベル増幅部は、前記複数の周波数帯域の内の最も低域の周波数帯域における前記中間点の位置を、最も前記低音圧レベル領域側に位置させることが好ましい。
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置での増幅度を、少なくとも一部で異ならせることが好ましい。
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置での増幅度の内、最小可聴限界の音圧レベルが最も小さい部分を含む周波数帯域における前記中間点の位置での増幅度を最も小さくすることが好ましい。
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置での増幅度の内、最も低域の周波数帯域における前記中間点の位置での増幅度を最も大きくすることが好ましい。
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置での増幅度を、前記第１の音声信号が有するダイナミックレンジに基づいて算出した最小増幅度から最大増幅度までの範囲で設定することが好ましい。
さらに、前記第１の音声信号はダイナミックレンジが異なる複数の音声信号の内のいずれかの音声信号であり、前記音圧レベル増幅部は、複数のダイナミックレンジそれぞれで前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、前記第１の音声信号が有するダイナミックレンジに応じて前記増幅度の組を切り換えるよう制御する制御部を備えることが好ましい。
前記第１の音声信号は複数種類のジャンルのコンテンツの音声信号の内のいずれかの音声信号であり、前記音圧レベル増幅部は、前記複数種類のジャンルそれぞれで前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、前記第１の音声信号のジャンルに応じて前記増幅度の組を切り換えるよう制御する制御部を備えることが好ましい。
前記音圧レベル増幅部は、前記第３の音声信号を聴取する際の複数の聴取モードに対応して、前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、前記複数の聴取モードを選択するための操作部と、前記操作部によって選択した聴取モードに応じて前記増幅度の組を切り換えるよう制御する制御部を備えることが好ましい。
さらにまた、前記音圧レベル増幅部は、前記複数の周波数帯域の前記第２の音声信号に対して、前記第２の音声信号の音圧レベルが第１の音圧レベルから第２の音圧レベルへと上昇した時点で第１の時間のアタックタイムを有する過渡応答特性を付与すると共に、前記第２の音声信号の音圧レベルが第３の音圧レベルから第４の音圧レベルへと低下した時点で前記第１の時間よりも長い第２の時間のリリースタイムを有する過渡応答特性を付与することが好ましい。
このとき、前記音圧レベル増幅部は、前記複数の周波数帯域の前記第２の音声信号に対して、高い周波数帯域ほど前記第１及び第２の時間が短い過渡応答特性を付与することが好ましい。
前記最小可聴限界は、人間の標準的な聴力特性に基づく最小可聴限界でよく、好ましくは、予め測定した前記第３の音声信号を聴取する聴取者の聴力特性に基づく最小可聴限界である。
【０００７】
また、本発明は、上述した従来の技術の課題を解決するため、第１の音声信号を複数の周波数帯域に分割して、前記複数の周波数帯域毎の第２の音声信号を出力し、前記複数の周波数帯域それぞれの前記第２の音声信号を、前記第２の音声信号の最小音圧レベルから最大音圧レベルまでの範囲における前記最小音圧レベルから所定の範囲の低音圧レベル領域と前記最大音圧レベルから所定の範囲の高音圧レベル領域とを除く中間音圧レベル領域で、音圧レベルを前記低音圧レベル領域側から前記中間音圧レベル領域内の中間点まで順次大きくし、前記中間点から前記高音圧レベル領域側まで順次小さくする増幅特性で増幅し、増幅された前記複数の周波数帯域それぞれの前記第２の音声信号を加算して第３の音声信号として出力することを特徴とする音声信号処理方法を提供する。
ここで、前記複数の周波数帯域における前記中間点の位置を少なくとも一部で異ならせることが好ましい。
最小可聴限界の音圧レベルが最も小さい部分を含む周波数帯域における前記中間点の位置を、最も前記高音圧レベル領域側に位置させることが好ましい。
前記複数の周波数帯域の内の最も低域の周波数帯域における前記中間点の位置を、最も前記低音圧レベル領域側に位置させることが好ましい。
前記複数の周波数帯域における前記中間点の位置での増幅度を、少なくとも一部で異ならせることが好ましい。
前記複数の周波数帯域における前記中間点の位置での増幅度の内、最小可聴限界の音圧レベルが最も小さい部分を含む周波数帯域における前記中間点の位置での増幅度を最も小さくすることが好ましい。
前記複数の周波数帯域における前記中間点の位置での増幅度の内、最も低域の周波数帯域における前記中間点の位置での増幅度を最も大きくすることが好ましい。
前記複数の周波数帯域における前記中間点の位置での増幅度を、前記第１の音声信号が有するダイナミックレンジに基づいて算出した最小増幅度から最大増幅度までの範囲で設定することが好ましい。
さらに、前記第１の音声信号はダイナミックレンジが異なる複数の音声信号の内のいずれかの音声信号であり、複数のダイナミックレンジそれぞれで前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、前記第１の音声信号が有するダイナミックレンジに応じて前記増幅度の組を切り換えることが好ましい。
前記第１の音声信号は複数種類のジャンルのコンテンツの音声信号の内のいずれかの音声信号であり、前記複数種類のジャンルそれぞれで前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、前記第１の音声信号のジャンルに応じて前記増幅度の組を切り換えることが好ましい。
前記第３の音声信号を聴取する際の複数の聴取モードに対応して、前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、前記複数の聴取モードのいずれかを選択し、選択した聴取モードに応じて前記増幅度の組を切り換えることが好ましい。
さらにまた、前記複数の周波数帯域の前記第２の音声信号に対して、前記第２の音声信号の音圧レベルが第１の音圧レベルから第２の音圧レベルへと上昇した時点で第１の時間のアタックタイムを有する過渡応答特性を付与すると共に、前記第２の音声信号の音圧レベルが第３の音圧レベルから第４の音圧レベルへと低下した時点で前記第１の時間よりも長い第２の時間のリリースタイムを有する過渡応答特性を付与することが好ましい。
ここで、前記複数の周波数帯域の前記第２の音声信号に対して、高い周波数帯域ほど前記第１及び第２の時間が短い過渡応答特性を付与することが好ましい。
前記最小可聴限界は、人間の標準的な聴力特性に基づく最小可聴限界でよく、好ましくは、予め測定した前記第３の音声信号を聴取する聴取者の聴力特性に基づく最小可聴限界である。
【発明の効果】
【０００８】
本発明の音声信号処理装置及び方法によれば、楽曲の音楽性を損ねることなく、聴感的に聞き取りやすい再生音を得ることができる。聴取者は聞き疲れしにくいので、楽曲の聴取を十分に楽しむことができるオーディオ機器を提供することが可能となる。
【発明を実施するための最良の形態】
【０００９】
以下、本発明の音声信号処理装置及び方法の各実施形態について、添付図面を参照して説明する。各実施形態をハードウェア構成のブロック図を用いて説明するが、各実施形態の一部をソフトウェアとして構成してもよい。ソフトウェアとして構成することが可能な部分を全てソフトウェアで構成してもよく、ハードウェアとソフトウェアの使い分けは任意でよい。
【００１０】
＜第１実施形態＞
図１は本発明の音声信号処理装置の第１実施形態を示すブロック図である。第１実施形態の音声信号処理装置１００は本発明の音声信号処理装置の各実施形態における基本的な構成を示すものである。図１において、入力端子１に入力されたデジタル音声信号（第１の音声信号）は帯域分割フィルタ２ａ〜２ｅに供給される。帯域分割フィルタ２ａ〜２ｅは互いの通過周波数帯域が異なる。人間の可聴範囲を２０Ｈｚ〜２０ｋＨｚとすると、帯域分割フィルタ２ａは例えば２０Ｈｚ〜２００Ｈｚの低域を通過させるフィルタであり、帯域分割フィルタ２ｂは例えば２００Ｈｚ〜６００Ｈｚの中低域を通過させるフィルタである。帯域分割フィルタ２ｃは例えば６００Ｈｚ〜１．８ｋＨｚの中域を通過させるフィルタであり、帯域分割フィルタ２ｄは例えば１．８ｋＨｚ〜５．４ｋＨｚの中高域を通過させるフィルタである。帯域分割フィルタ２ｅは例えば５．４ｋＨｚ〜２０ｋＨｚの高域を通過させるフィルタである。
【００１１】
２００Ｈｚ〜６００Ｈｚの中低域は音声の基本波を含む帯域であり、６００Ｈｚ〜１．８ｋＨｚの中域はホルマントを含む帯域であり、１．８ｋＨｚ〜５．４ｋＨｚの中高域は子音成分を含む帯域である。帯域分割フィルタの個数、即ち、音声信号をいくつの帯域に分割するかは任意であり、図１に示す５分割に限定されるものではない。例えば音声信号を３つの帯域に分割する場合は、２０Ｈｚ〜２００Ｈｚの低域と、２００Ｈｚ〜５．４ｋＨｚの中域と、５．４ｋＨｚ〜２０ｋＨｚの高域とに分割するのが好ましい。
【００１２】
帯域分割フィルタ２ａ〜２ｅの後段には、帯域分割フィルタ２ａ〜２ｅそれぞれに対応するよう音圧レベル増幅部３ａ〜３ｅが設けられている。音圧レベル増幅部３ａ〜３ｅとしては、一般的にダイナミックレンジ制御回路（ＤＲＣ（Dynamic Range Control）回路）と称されている回路を用いることができる。音圧レベル増幅部３ａ〜３ｅは帯域分割フィルタ２ａ〜２ｅより出力されたそれぞれの音声信号（第２の音声信号）の音圧レベルを後に詳述するよう増幅する。音圧レベル増幅部３ａ〜３ｅの内部構成は互いに同一であるが、音圧レベルを増幅する際の増幅特性を音圧レベル増幅部３ａ〜３ｅそれぞれで個別に設定している。但し、音圧レベル増幅部３ａ〜３ｅにおける増幅特性の全てが互いに異なっている必要はなく、一部で重複した増幅特性であってもよい。
【００１３】
音圧レベル増幅部３ａ〜３ｅの後段には、音圧レベル増幅部３ａ〜３ｅそれぞれに対応するようアンプ４ａ〜４ｅが設けられている。アンプ４ａ〜４ｅは音圧レベル増幅部３ａ〜３ｅより出力されたそれぞれの音声信号を予め定められたゲインで増幅して出力する。アンプ４ａ〜４ｅにおけるゲインは基本的には同一でよいが、所望の再生音を得るため一部のアンプのゲインを異ならせてもよいし、周波数帯域毎に異なるゲインを設定してもよい。アンプ４ａ〜４ｅは場合によっては削除可能である。アンプ４ａ〜４ｅより出力された音声信号は加算部５に入力されて加算され、出力端子６より出力される。加算部５より出力された音声信号（第３の音声信号）は、ここでは図示していないスピーカまたはヘッドホンによって聴取者に聴取される。
【００１４】
ここで、図２を用いて音圧レベル増幅部３ａ〜３ｅの具体的構成について説明する。図２において、帯域分割フィルタ２ａ〜２ｅのいずれかから出力された音声信号はレベル検出部３１及び遅延部３９に入力される。音圧レベル増幅部３ａ〜３ｅに入力される音声信号は、図３に示すように、−１００ｄＢＦＳ〜０ｄＢＦＳの範囲の音圧レベルを有するものとする。ＦＳとはフル・スケールを意味する。レベル検出部３１は入力された音声信号が最小音圧レベルの−１００ｄＢＦＳから最大音圧レベルの０ｄＢＦＳまでのいずれの音圧レベルであるかを検出する。レベル検出部３１で検出された入力信号の音圧レベルは動作範囲設定部３２及び倍率発生部３３に入力される。
【００１５】
図３に示すように、最小音圧レベルから最大音圧レベルまでの範囲の内、最小音圧レベルから所定の範囲（例えば−８０ｄＢＦＳまで）の低音圧レベル領域Ｒ１と、最大音圧レベルから所定の範囲（例えば−２５ｄＢＦＳまで）の高音圧レベル領域Ｒ２とにおいては、入力信号を増幅させない非増幅領域とすることが好ましい。低音圧レベル領域Ｒ１と高音圧レベル領域Ｒ２とを非増幅領域とすることにより、楽曲の音楽性をほとんど損ねることがない。これは、低音圧レベル領域Ｒ１を増幅するとノイズが目立ちやすくなり、高音圧レベル領域Ｒ２を増幅すると歪みが発生しやすく、しかも大きな音圧レベルであるので聴感的に目立ちやすいからである。但し、楽曲の音楽性を損ねない程度に、低音圧レベル領域Ｒ１と高音圧レベル領域Ｒ２で入力信号を増幅させてもよい。
【００１６】
低音圧レベル領域Ｒ１と高音圧レベル領域Ｒ２との間の中間音圧レベル領域Ｒ３においては、破線で示す非増幅の状態を実線で示す特性で増幅させた状態とする増幅領域としている。動作範囲設定部３２は、どの範囲を非増幅領域とし、どの範囲を増幅領域とするかを設定している。後述するように、音圧レベル増幅部３ａ〜３ｅそれぞれの動作範囲設定部３２で設定している非増幅領域・増幅領域は同一ではなく、それぞれの動作範囲設定部３２で最適な非増幅領域・増幅領域を設定している。
【００１７】
図２に戻り、増幅特性設定部３４は、変曲点設定部３４１と増幅度設定部３４２と増幅特性保持部３４３とを備えている。図３に示すように、増幅領域である中間音圧レベル領域Ｒ３においては、低音圧レベル領域Ｒ１の高音圧レベル側の端部である点Ｐ１から中間音圧レベル領域Ｒ３内の中間点である変曲点Ｐｉまでは入力信号の音圧レベルが大きくなるに従って増幅度を順次大きくし、変曲点Ｐｉから高音圧レベル領域Ｒ２の低音圧レベル側の端部である点Ｐ２までは入力信号の音圧レベルが大きくなるに従って増幅度を順次小さくする特性となっている。図３では、点Ｐ１から変曲点Ｐｉまで線形に増幅度を大きくし、変曲点Ｐｉから点Ｐ２まで線形に増幅度を小さくする例を示している。変曲点設定部３４１は、入力信号の音圧レベルのどの位置を変曲点Ｐｉとするのかを設定するものである。増幅度設定部３４２は、変曲点Ｐｉの位置における増幅度Ｇａを設定するものである。
【００１８】
増幅特性保持部３４３には、変曲点設定部３４１からの変曲点設定データと増幅度設定部３４２からの増幅度設定データとが入力される。変曲点設定データは変曲点Ｐｉの位置（入力音圧レベル）を示す位置情報であり、増幅度設定データは増幅度Ｇａを決める情報である。本実施形態においては、増幅度設定データは、変曲点Ｐｉの位置において、入力信号の音圧レベルを何倍にするのかという倍率を表すデータである。増幅特性保持部３４３は、変曲点Ｐｉよりも低音圧レベル側と高音圧レベル側の増幅特性の傾きデータを有している。増幅特性保持部３４３は、傾きデータと変曲点設定データと増幅度設定データとを用いて中間音圧レベル領域Ｒ３における増幅特性を得るための倍率データを計算により求めて保持している。
【００１９】
倍率発生部３３は、増幅特性保持部３４３に保持された倍率データを参照して、レベル検出部３１より供給された入力信号の音圧レベルに応じた倍率値を発生する。この倍率値はスイッチ３５の端子ａに供給される。固定倍率発生部３６は１．０の固定倍率値を発生してスイッチ３５の端子ｂに供給する。スイッチ３５には動作範囲設定部３２から、どの範囲を非増幅領域とし、どの範囲を増幅領域とするかを示す動作範囲設定データが入力される。スイッチ３５は動作範囲設定データが非増幅領域を示す場合は端子ｂを選択し、増幅領域を示す場合は端子ａを選択する。これによって、スイッチ３５からは最小音圧レベルから最大音圧レベルまでの範囲で入力信号をどのように増幅するかを決める増幅度を示すデータが発生されることとなる。
【００２０】
本実施形態においては、好ましい構成例として、スムージングフィルタ３７とアタックタイム・リリースタイム設定部３８とを設けている。スムージングフィルタ３７及びアタックタイム・リリースタイム設定部３８を設けることは必須ではないが、設けることが好ましい。アタックタイム・リリースタイム設定部３８は後述するアタックタイムとリリースタイムを設定するための設定データを保持している。スムージングフィルタ３７はスイッチ３５から入力される増幅度に対してアタックタイム及びリリースタイムの設定データに基づいたスムージング処理を施して出力する。このスムージング処理の具体的な動作については後に詳述する。
【００２１】
アンプ４０には、遅延部３９によって遅延された音声信号とスムージングフィルタ３７より出力されたスムージング処理が施された増幅度が入力される。アンプ４０は、入力された音声信号をスムージングフィルタ３７からの増幅度に基づいて増幅して出力する。遅延部３９は入力された音声信号を、レベル検出部３１からスムージングフィルタ３７までの処理に要する時間だけ遅延させてアンプ４０に供給する。なお、遅延部３９を設けることが望ましいが、遅延部３９は必ずしも必要ではない。遅延部３９を設けない構成でも、加算部５より出力される音声信号の聴感的な劣化は少ない。
【００２２】
以上のようにして、音圧レベル増幅部３ａ〜３ｅはそれぞれの周波数帯域の音声信号を音圧レベル増幅部３ａ〜３ｅそれぞれの増幅特性に基づいて増幅する。
【００２３】
ここで、帯域分割フィルタ２ａ〜２ｅにおける低域，中低域，中域，中高域，高域について説明する。図４は人間の標準的な聴力特性（音圧レベルの可聴範囲）を示しており、最小可聴限界と最大可聴限界との間の音圧レベルが音として聞こえる範囲である。図４より分かるように、最小可聴限界の音圧レベルは音声信号の周波数によって異なる。最小可聴限界の音圧レベルが最も小さい部分は、１．８ｋＨｚ〜５．４ｋＨｚの中高域の範囲に含まれている。本実施形態は、周波数帯域によって最小可聴限界を示す音圧レベルが異なることを考慮して、音圧レベル増幅部３ａ〜３ｅにおける増幅特性をそれぞれ設定している。
【００２４】
図５は、音圧レベル増幅部３ａ〜３ｅにおける増幅特性の好適な例を示している。図５（Ａ）は、音声信号における２０Ｈｚ〜２００Ｈｚの低域部分の増幅特性を制御する音圧レベル増幅部３ａに設定している増幅特性を示している。図５（Ａ）において、点Ｐ１は−８０ｄＢＦＳ、点Ｐ２は−２５ｄＢＦＳ、変曲点Ｐｉは−６６ｄＢＦＳに位置している。図５（Ｂ）は、音声信号における２００Ｈｚ〜６００Ｈｚの中低域部分の増幅特性を制御する音圧レベル増幅部３ｂに設定している増幅特性を示している。図５（Ｂ）において、点Ｐ１は−８０ｄＢＦＳ、点Ｐ２は−２５ｄＢＦＳ、変曲点Ｐｉは−６３ｄＢＦＳに位置している。
【００２５】
図５（Ｃ）は、音声信号における６００Ｈｚ〜１．８ｋＨｚの中域部分の増幅特性を制御する音圧レベル増幅部３ｃに設定している増幅特性を示している。図５（Ｃ）において、点Ｐ１は−８０ｄＢＦＳ、点Ｐ２は−２０ｄＢＦＳ、変曲点Ｐｉは−６０ｄＢＦＳに位置している。図５（Ｄ）は、音声信号における１．８ｋＨｚ〜５．４ｋＨｚの中高域部分の増幅特性を制御する音圧レベル増幅部３ｄに設定している増幅特性を示している。図５（Ｄ）において、点Ｐ１は−８０ｄＢＦＳ、点Ｐ２は−１８ｄＢＦＳ、変曲点Ｐｉは−５７ｄＢＦＳに位置している。図５（Ｅ）は、音声信号における５．４ｋＨｚ〜２０ｋＨｚの高域部分の増幅特性を制御する音圧レベル増幅部３ｅに設定している増幅特性を示している。図５（Ｅ）において、点Ｐ１は−８０ｄＢＦＳ、点Ｐ２は−２５ｄＢＦＳ、変曲点Ｐｉは−６３ｄＢＦＳに位置している。ここでは、点Ｐ１を全て−８０ｄＢＦＳとしたが、周波数帯域毎に異ならせてもよい。
【００２６】
図５（Ａ）〜（Ｅ）に示すように、変曲点Ｐｉの位置は音圧レベル増幅部３ａ〜３ｅに対して共通ではなく、それぞれで最適な位置に設定している。音圧レベル増幅部３ａにおける変曲点Ｐｉが最も低音圧レベル側に位置し、音圧レベル増幅部３ｂ，３ｅにおける変曲点Ｐｉが次に低音圧レベル側に位置している。なお、ここでは音圧レベル増幅部３ｂ，３ｅにおける変曲点Ｐｉを共通としているが、若干異ならせてもよい。音圧レベル増幅部３ｃにおける変曲点Ｐｉは音圧レベル増幅部３ａ，３ｂ，３ｅにおける変曲点Ｐｉと比較して高音圧レベル側に位置している。音圧レベル増幅部３ｄにおける変曲点Ｐｉは最も高音圧レベル側に位置している。
【００２７】
このように、周波数帯域を５分割した本実施形態においては、最小可聴限界の音圧レベルが最も小さい部分が含まれる中高域では、変曲点Ｐｉを最も高音圧レベル側に位置させることが好ましい。また、低域では変曲点Ｐｉを最も低音圧レベル側に位置させることが好ましい。中低域では変曲点Ｐｉを低域における変曲点Ｐｉよりも高音圧レベル側に位置させることが好ましい。中域では変曲点Ｐｉを中低域おける変曲点Ｐｉよりも高音圧レベル側で、中高域における変曲点Ｐｉよりも低音圧レベル側に位置させることが好ましい。高域では変曲点Ｐｉを中域及び中高域における変曲点Ｐｉよりも低音圧レベル側に位置させ、低域における変曲点Ｐｉよりも高音圧レベル側に位置させることが好ましい。低域，中低域，中域，中高域，高域における変曲点Ｐｉの相対的な位置関係は、最も低音圧レベル側，低音圧レベル側，高音圧レベル側，最も高音圧レベル側，低音圧レベル側とすることが好ましい。
【００２８】
さらに、変曲点Ｐｉの位置における増幅度Ｇａは音圧レベル増幅部３ａ〜３ｅに対して共通ではなく、それぞれで最適な増幅度を設定している。音圧レベル増幅部３ａにおける増幅度Ｇａを最も大きくし、音圧レベル増幅部３ｄにおける増幅度Ｇａを最も小さくしている。音圧レベル増幅部３ｂ，３ｅにおける増幅度Ｇａを音圧レベル増幅部３ａにおける増幅度Ｇａの次に大きくし、音圧レベル増幅部３ｃにおける増幅度Ｇａを音圧レベル増幅部３ｂ，３ｅにおける増幅度Ｇａよりも小さく、音圧レベル増幅部３ｄにおける増幅度Ｇａよりも大きくしている。低域，中低域，中域，中高域，高域における増幅度Ｇａの相対的な大小関係は、最大，大，中程度，最小，大とすることが好ましい。
【００２９】
次に、図２のスムージングフィルタ３７及びアタックタイム・リリースタイム設定部３８において行われる過渡応答特性の処理について説明する。図６（Ａ）は、正弦波状の入力音声信号の音圧レベルが大きく変化した状態を示している。ここでは簡略化のため波形を包絡線にて示している。図６（Ａ）に示す音声信号は一例として、音圧レベルが時刻ｔ１までは−４０ｄＢＦＳであり、時刻ｔ１で−１０ｄＢＦＳまで急上昇して時刻ｔ３まで−１０ｄＢＦＳを維持し、時刻ｔ３にて−４０ｄＢＦＳまで急降下してそれ以降−４０ｄＢＦＳを維持する波形である。図６（Ｂ）は図６（Ａ）の波形の正方向のみを示している。
【００３０】
図２におけるスムージングフィルタ３７は、音声信号に対して、音圧レベルが第１のレベルから第１のレベルより大きい第２のレベルに変化する場合に、一旦第２のレベルを超えるレベルまで音圧レベルを上昇させた後に第２のレベルまで減衰させる第１の過渡応答特性を付与する。また、スムージングフィルタ３７は、音圧レベルが第３のレベルから第３のレベルより小さい第４のレベルに変化する場合に、一旦第４のレベルを超える小さなレベルに下降させて第４のレベルまで増幅させる第２の過渡応答特性を付与する。図６（Ｄ）は図６（Ｂ）の波形に対して第１及び第２の過渡応答特性を与えた波形を示している。
【００３１】
図６（Ｄ）に示すように、第１の過渡応答特性において、音圧レベルが第２のレベル（−１０ｄＢＦＳ）を超えて最大レベルまで上昇した状態を１００％とし、第２のレベルまで減衰した状態を０％としたとき、１００％の時点である時刻ｔ１から所定の割合（例えば５０％）に減衰した時点である時刻ｔ２までの時間をアタックタイムと称している。どの程度減衰した時点をアタックタイムとするのかは任意であり、８０％減衰した時点、１００％減衰した時点（即ち、０％となった時点）等のいずれでもよい。第２の過渡応答特性において、音圧レベルが第４のレベル（−４０ｄＢＦＳ）を超えて最小レベルまで下降した状態を１００％とし、第４のレベルまで増幅した状態を０％としたとき、１００％の時点である時刻ｔ３から所定の割合（例えば５０％）に増幅した時点である時刻ｔ４までの時間をリリースタイムと称している。ここでもどの程度減衰した時点をリリースタイムとするのかは任意であり、８０％増幅した時点、１００％増幅した時点（即ち、０％となった時点）等のいずれでもよい。
【００３２】
図６（Ｄ）より分かるように、第１の過渡応答特性は比較的短い時間で減衰する特性であり、第２の過渡応答特性は比較的長い時間で増幅する特性である。アタックタイムは例えば数ミリ秒から十数ミリ秒程度と短くし、リリースタイムは１００ミリ秒以上と長くする。図６（Ｃ）は増幅度の変化を示している。図６（Ｂ）の入力音声信号の波形に図６（Ｃ）の増幅度を乗じると、図６（Ｄ）に示す出力音声信号の波形となる。図６（Ｅ）は正方向及び負方向の出力音声信号を示している。図２におけるアタックタイム・リリースタイム設定部３８は、アタックタイムとリリースタイムをどの程度とするかを設定している。本実施形態においては、スムージングフィルタ３７及びアタックタイム・リリースタイム設定部３８を設けることによって、音圧レベルが変化した場合に第１及び第２の過渡応答特性を与えるようにしているので、楽曲の音楽性を損ねにくくするという効果をさらに高めることができ、自然な再生音を得ることが可能となる。
【００３３】
本実施形態においてはさらに、音圧レベル増幅部３ａ〜３ｅのアタックタイム・リリースタイム設定部３８で設定するアタックタイム及びリリースタイムを、低い周波数の周波数帯域ほど長くし、高い周波数の周波数帯域ほど短くしている。表１に、音圧レベル増幅部３ａ〜３ｅそれぞれにおけるアタックタイム及びリリースタイムの設定例を示す。アタックタイム及びリリースタイムを低い周波数の周波数帯域ほど長くし、高い周波数の周波数帯域ほど短くすることにより、全ての周波数帯域で共通の値とした場合よりもさらに楽曲の音楽性を損ねにくくすることができ、自然な再生音を得ることが可能となる。
【００３４】
【表１】

【００３５】
＜第２実施形態＞
図７は本発明の音声信号処理装置の第２実施形態を示すブロック図である。第２実施形態の音声信号処理装置２００において、第１実施形態の音声信号処理装置１００と同一部分には同一符号を付し、その説明を適宜省略することとする。第２実施形態の音声信号処理装置２００は、音圧レベル増幅部３ａ〜３ｅによって音声信号を増幅する際の増幅度を制限する点、さらに増幅度の制限値を音声信号のダイナミックレンジに応じて設定することを特徴としている。増幅度とは、上述した増幅度設定部３４で設定する変曲点Ｐｉの位置における増幅度Ｇａである。
【００３６】
図７において、メディア再生部２０１は一例として公知の光ディスク再生部であり、ＣＤやＤＶＤ等の光ディスクを再生する。メディア再生部２０１にて再生された光ディスクの再生信号は信号処理部２０２に入力される。信号処理部２０２は入力された再生信号に基づいてメディアがどの光ディスクであるかを判別する。なお、光ディスクの判別は公知の方法を採用することができる。信号処理部２０２は、再生信号に含まれる音声信号を抽出して入力端子１へと供給し、光ディスクの種別を示す判別信号を制御部２０３に供給する。制御部２０３は、入力された判別信号に基づいて音圧レベル増幅部３ａ〜３ｅを制御する。音圧レベル増幅部３ａ〜３ｅは、入力された音声信号を、光ディスクの種別（即ち、入力された音声信号が有するダイナミックレンジ）に応じて最適な増幅度Ｇａで増幅するよう増幅度Ｇａを切り換える。
【００３７】
メディアがＣＤとＤＶＤの場合を例にすると、ＣＤは約９８ｄＢのダイナミックレンジを有し、ＤＶＤは理論上１４０ｄＢ以上のダイナミックレンジを有するものの、実質的には１２０ｄＢ程度のダイナミックレンジである。音圧レベル増幅部３ａ〜３ｅそれぞれにおける増幅度Ｇａの最小増幅度はダイナミックレンジの約６％とすることが好ましく、最大増幅度はダイナミックレンジの約２０％とすることが好ましい。これは発明者による実験・研究によって得られたものである。従って、表２に示すように、メディアがＣＤであれば最小増幅度を６ｄＢ、最大増幅度を２０ｄＢとし、音圧レベル増幅部３ａ〜３ｅそれぞれにおける増幅度Ｇａを６ｄＢから２０ｄＢの範囲で設定する。また、メディアがＤＶＤであれば最小増幅度を８ｄＢ、最大増幅度を２４ｄＢとし、音圧レベル増幅部３ａ〜３ｅそれぞれにおける増幅度Ｇａを８ｄＢから２４ｄＢの範囲で設定する。
【００３８】
【表２】

【００３９】
メディア再生部２０１が再生するメディアは光ディスクに限定されるものではない。メディア再生部２０１は半導体メモリに記憶されたＭＰ３（MPEG1 Layer 3）やＷＭＡ（Windows Media Audio）のような圧縮音声信号を再生するものであってもよい。Windowsは登録商標である。信号のダイナミックレンジは分解能によって決まる。例えば分解能が８ビットであればダイナミックレンジは４８ｄＢ、分解能が１２ビットであればダイナミックレンジは７２ｄＢとなる。この場合、信号処理部２０２は分解能を示す情報を制御部２０３に入力すればよい。
【００４０】
引き続き、表３を用いて、音圧レベル増幅部３ａ〜３ｅにおける最小増幅度と最大増幅度を上記のように制限した場合の音圧レベル増幅部３ａ〜３ｅそれぞれの増幅度Ｇａの具体的な設定例について説明する。表３はメディアがＣＤの場合についての例を示している。
【００４１】
【表３】

【００４２】
表３における初期値は図４の最小可聴限界に基づいた値である。図４において、黒丸はそれぞれの周波数帯域における代表的な位置を示している。中高域においては最小可聴限界の音圧レベルが最も低い部分を代表位置とし、他の帯域においてはほぼ中央の周波数位置を代表位置としている。図４より分かるように、中高域の代表位置と中域の代表位置との間には、最小可聴限界の音圧レベルに約１０ｄＢの差がある。中高域の代表位置と中低域及び高域の代表位置との間には、最小可聴限界の音圧レベルに約２０ｄＢの差がある。中高域の代表位置と低域の代表位置との間には、最小可聴限界の音圧レベルに約４０ｄＢの差がある。中高域を基準とし、中高域と他の帯域との最小可聴限界の音圧レベルの差を初期値とする。
【００４３】
表３に示す標準値は、音圧レベル増幅部３ａ〜３ｅにおける最小増幅度と最大増幅度を上記のように制限し、かつ、周波数帯域毎の最小可聴限界の音圧レベルの差を考慮して算出した増幅度Ｇａを示している。表３に示すように、音声信号の低域部分を制御する音圧レベル増幅部３ａにおいては初期値が４０ｄＢであるが、最大増幅度の２０ｄＢを超えているので標準値としての増幅度Ｇａを最大増幅度の２０ｄＢとする。音声信号の中低域部分を制御する音圧レベル増幅部３ｂにおいては初期値が２０ｄＢであるが、次の（１）式に基づいて標準値としての増幅度Ｇａを１２ｄＢとする。（１）式において、Ｇａminは最小増幅度、Ｇａmaxは最大増幅度、Ｇinはその帯域における初期値、Ｇinmaxは全ての初期値における最大値である。
Ｇａmin＋（Ｇin／Ｇinmax）×（Ｇａmax−Ｇａmin） …（１）
【００４４】
音声信号の中域部分を制御する音圧レベル増幅部３ｃにおいては初期値が１０ｄＢであるが、（１）式に基づいて標準値としての増幅度Ｇａを９ｄＢとする。音声信号の中高域部分を制御する音圧レベル増幅部３ｄにおいては初期値が０ｄＢであるが、最小増幅度未満であるので標準値としての増幅度Ｇａを最小増幅度の６ｄＢとする。音声信号の高域部分を制御する音圧レベル増幅部３ｅにおいては初期値が２０ｄＢであるが、（１）式に基づいて標準値としての増幅度Ｇａを１２ｄＢとする。
【００４５】
以上説明した第２実施形態においては、音声信号のダイナミックレンジをメディアの種別や分解能に基づいて得るようにしたが、音声信号から直接ダイナミックレンジを検出するようにしてもよい。図８は音声信号の波形の一例を示している。図８に破線で示すように、ある時点で保持した信号レベルを比較的長い時定数で零に向かうよう収束させる。収束させていく段階でより大きい信号レベルが発生した場合にはその信号レベルを保持して同様に収束させることを繰り返す。この処理を所定の時間行うことによって、最大信号レベルと最小信号レベルを得ることができ、両者の差を算出することによりダイナミックレンジを求めることができる。このような処理を行う検出回路を設けることによって音声信号から直接ダイナミックレンジを検出することができる。
【００４６】
また、図７において、聴取者が操作部２０４を操作するによって、複数のダイナミックレンジに対応した複数のモードを選択するようにしてもよい。操作部２０４は、オーディオ機器本体に設けられていてもよく、リモコン送信機であってもよい。
【００４７】
図９は、第２実施形態における音圧レベル増幅部３ａ〜３ｅの構成例を示している。ここでは簡略化のため、音圧レベル増幅部３ａ〜３ｅにおける倍率発生部３３及び増幅特性設定部３４以外の図示を省略している。メディア再生部２０１が再生する光ディスクがＣＤとＤＶＤの場合を例にすると、増幅度設定部３４２はＣＤ用の増幅度ＧａとしてＧａ１、ＤＶＤ用の増幅度ＧａとしてＧａ２を保持している。増幅度設定部３４２には制御部２０３からの制御信号が入力され、増幅度設定部３４２は増幅度ＧａとしてＧａ１とＧａ２のいずれかを出力する。音圧レベル増幅部３ａ〜３ｅに設定する増幅度Ｇａの組はダイナミックレンジの種類に応じた種類だけ設ければよい。あるいは、基準となる増幅度Ｇａの組を保持しておき、ダイナミックレンジの違いに応じて他の増幅度Ｇａの組を計算により求めてもよい。
【００４８】
＜第３実施形態＞
図１０は本発明の音声信号処理装置の第３実施形態を示すブロック図である。第３実施形態の音声信号処理装置３００において、第１実施形態の音声信号処理装置１００と同一部分には同一符号を付し、その説明を適宜省略することとする。第３実施形態の音声信号処理装置３００は、第２実施形態と同様に音圧レベル増幅部３ａ〜３ｅによって音声信号を増幅する際の増幅度を制限し、さらに増幅度Ｇａをコンテンツのジャンルに応じて設定することを特徴としている。
【００４９】
図１０に示す第３実施形態の音声信号処理装置３００においては、デジタル放送信号を受信する受信部３０１を設けた例を示している。受信部３０１で受信したデジタル放送信号の放送波信号は信号処理部３０２に入力される。信号処理部３０２は映像信号及び音声信号を含むコンテンツデータと、コンテンツデータに付加された付加データとを分離する。付加データはコンテンツのジャンルデータを含む。信号処理部３０２は、コンテンツデータの内、音声信号を入力端子１へと供給し、ジャンルデータを制御部３０３に供給する。制御部３０３は、入力されたジャンルデータに基づいて音圧レベル増幅部３ａ〜３ｅを制御する。音圧レベル増幅部３ａ〜３ｅは、入力された音声信号を、ジャンルデータに応じて最適な増幅度Ｇａで増幅するよう増幅度Ｇａを切り換える。なお、図１０では映像信号の処理については図示を省略している。
【００５０】
表４を用いて、コンテンツの複数のジャンルにおける音圧レベル増幅部３ａ〜３ｅそれぞれの増幅度Ｇａの具体的な設定例について説明する。表４は、増幅度Ｇａの標準値を表３の標準値とした場合の例を示している。表４に示すように、それぞれのコンテンツのジャンルで、標準値の増幅度Ｇａに対して増減させた値とすることによって、それぞれのジャンルで聴感的に聞き取りやすい再生音を得ることができる。
【００５１】
【表４】

【００５２】
以上説明した第３実施形態においては、デジタル放送信号を受信する受信部３０１を設けた例を示したが、受信部３０１の代わりに第２実施形態と同様なメディア再生部を設けた構成であってもよい。また、図１０において、操作部３０４にジャンルを選択するための操作釦を設け、聴取者が操作釦によってジャンルを直接選択して、ジャンルに対応した複数のモードを選択するようにしてもよい。さらには、第２実施形態による複数のダイナミックレンジに対応した複数のモードの選択と、ジャンルに対応した複数のモードの選択とを組み合わせてもよい。即ち、表４のような複数のジャンルに対応した複数のモードを、ダイナミックレンジが異なる複数の音声信号毎に用意することが好ましい。
【００５３】
＜第４実施形態＞
図１１は本発明の音声信号処理装置の第４実施形態を示すブロック図である。第４実施形態の音声信号処理装置４００において、第１実施形態の音声信号処理装置１００と同一部分には同一符号を付し、その説明を適宜省略することとする。第４実施形態の音声信号処理装置４００は、第２実施形態と同様に音圧レベル増幅部３ａ〜３ｅによって音声信号を増幅する際の増幅度を制限し、さらに増幅度Ｇａを聴取者が指定する聴取モードに応じて設定することを特徴としている。
【００５４】
図１１において、操作部４０４には、聴取モードの例として、標準，リラックス，ＢＧＭ，聴力補助を選択するための操作釦4041が設けられている。制御部４０３は、操作釦4041で選択した聴取モードに対応した増幅度Ｇａとするよう音圧レベル増幅部３ａ〜３ｅを制御する。
【００５５】
表５を用いて、聴取モード毎の音圧レベル増幅部３ａ〜３ｅそれぞれの増幅度Ｇａの具体的な設定例について説明する。表５は、増幅度Ｇａの標準値を表３の標準値とした場合の例を示している。表５に示すように、“リラックス”及び“ＢＧＭ”の聴取モードでは標準値の増幅度Ｇａを部分的に減少させた値としている。“リラックス”はリラックスした気分で心地よく音楽を楽しむためのモードであり、“ＢＧＭ”は小音量で音楽をＢＧＭとして聴取するためのモードである。“聴力補正”の聴取モードは、個人の聴力特性に基づいて増幅度Ｇａを補正するためのモードである。個人の聴力特性の測定方法については後述する。９ｄＢ＋αａ，９ｄＢ＋αｂ，９ｄＢ＋αｃ，９ｄＢ＋αｄ，９ｄＢ＋αｅにおけるαａ，αｂ，αｃ，αｄ，αｅを個人の聴力特性に応じて設定することにより、聞き取りづらい周波数帯域における聞き取りづらさを改善することができる。聞き取りづらい周波数帯域は人によって異なるので、聴取者それぞれに合わせて聴感的に聞き取りやすい再生音を得ることができる。
【００５６】
【表５】

【００５７】
以上説明した第１〜第４実施形態においては、図４で説明したように、増幅度Ｇａを設定する基準として人間の標準的な聴力特性の最小可聴限界を用いている。音声信号の聴取者の聴力特性に基づいた最小可聴限界を用いれば、それぞれの聴取者にとって最適で聴感的に聞き取りやすい再生音を得ることが可能となる。図１２は、聴取者の聴力特性を測定する場合の一例構成を示している。図１２において、メディア再生部５１は所定のメディアを再生する。信号処理部５２はメディア再生部５１からの音声信号を処理してスイッチ５４の端子ａに供給する。制御部６０の制御によってスイッチ５４が端子ａに接続されている場合、信号処理部５２より出力された音声信号はアンプ５５によって増幅されてスピーカ５６またはヘッドホン５７へと供給される。これによって、メディア再生部５１からの音声信号は発音される。以上は通常のオーディオ機器における楽曲の再生である。
【００５８】
基準信号発生部５３は聴取者の聴力特性を測定するための基準信号を発生する。例えば基準信号をＣＤ等の光ディスクに記録し、メディア再生部５１によって光ディスクに記録された基準信号を再生してもよい。基準信号発生部５３からの基準信号はスイッチ５４の端子ｂに供給される。制御部６０の制御によってスイッチ５４が端子ｂに接続されている場合、基準信号はスピーカ５６またはヘッドホン５７によって発音される。聴力特性を測定する聴取者はスピーカ５６またはヘッドホン５７によって発音された基準信号を聴取する。基準信号は２０Ｈｚ〜２０ｋＨｚの範囲の選択的な複数周波数の音声信号を含む。聴取者は操作部５９によって選択した周波数帯域の音声信号を聞きながら、操作部５９で音圧レベル（ボリューム）を調整し、可聴できる最も小さい音圧レベルを決定する。
【００５９】
聴取者が操作部５９によって周波数帯域を選択すると、制御部６０は基準信号発生部５３に選択された周波数帯域の音声信号を発生させる。聴取者は複数の周波数帯域それぞれで可聴できる最も小さい音圧レベルを決定する。表示部６１には、制御部６０の制御によって一連の聴力特性を測定する際の案内となる画像が表示される。制御部６０は、聴取者が入力した複数の周波数帯域における可聴できる最も小さい音圧レベルを聴取者個人が有する最小可聴限界として、この最小可聴限界のデータを記憶部６２に記憶させる。
【００６０】
信号処理部５２は、第１〜第４実施形態の音声信号処理装置１００〜４００のいずれかを備えている。制御部６０は、記憶部６２から聴取者の最小可聴限界のデータを読み出し、信号処理部５２（音声信号処理装置１００〜４００）を制御する。
【００６１】
本発明は以上説明した各実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変更可能である。
【図面の簡単な説明】
【００６２】
【図１】本発明の第１実施形態を示すブロック図である。
【図２】音圧レベル増幅部３ａ〜３ｅの具体的構成例を示すブロック図である。
【図３】音圧レベル増幅部３ａ〜３ｅにおける増幅特性を説明するための図である。
【図４】人間の標準的な聴力特性を示す図である。
【図５】音圧レベル増幅部３ａ〜３ｅにおける増幅特性の具体例を示す図である。
【図６】音圧レベル増幅部３ａ〜３ｅにおける過渡応答特性の処理を説明するための図である。
【図７】本発明の第２実施形態を示すブロック図である。
【図８】ダイナミックレンジ検出回路の動作例を説明するための図である。
【図９】第２実施形態における音圧レベル増幅部３ａ〜３ｅの構成例を示す部分ブロック図である。
【図１０】本発明の第３実施形態を示すブロック図である。
【図１１】本発明の第４実施形態を示すブロック図である。
【図１２】聴取者の聴力特性に基づいた最小可聴限界を測定するための構成例を示すブロック図である。
【符号の説明】
【００６３】
２ａ〜２ｅ帯域分割フィルタ
３ａ〜３ｅ音圧レベル増幅部
４ａ〜４ｅアンプ
５加算部
１００，２００，３００，４００音声信号処理装置

【特許請求の範囲】
【請求項１】
第１の音声信号を複数の周波数帯域に分割して、前記複数の周波数帯域毎の第２の音声信号を出力する帯域分割フィルタと、
前記複数の周波数帯域それぞれの前記第２の音声信号を、前記第２の音声信号の最小音圧レベルから最大音圧レベルまでの範囲における前記最小音圧レベルから所定の範囲の低音圧レベル領域と前記最大音圧レベルから所定の範囲の高音圧レベル領域とを除く中間音圧レベル領域で、音圧レベルを前記低音圧レベル領域側から前記中間音圧レベル領域内の中間点まで順次大きくし、前記中間点から前記高音圧レベル領域側まで順次小さくする増幅特性で増幅する音圧レベル増幅部と、
前記音圧レベル増幅部によって増幅された前記複数の周波数帯域それぞれの前記第２の音声信号を加算して第３の音声信号として出力する加算部と
を備えることを特徴とする音声信号処理装置。
【請求項２】
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置を少なくとも一部で異ならせていることを特徴とする請求項１記載の音声信号処理装置。
【請求項３】
前記音圧レベル増幅部は、最小可聴限界の音圧レベルが最も小さい部分を含む周波数帯域における前記中間点の位置を、最も前記高音圧レベル領域側に位置させていることを特徴とする請求項２記載の音声信号処理装置。
【請求項４】
前記音圧レベル増幅部は、前記複数の周波数帯域の内の最も低域の周波数帯域における前記中間点の位置を、最も前記低音圧レベル領域側に位置させていることを特徴とする請求項２または３に記載の音声信号処理装置。
【請求項５】
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置での増幅度を、少なくとも一部で異ならせていることを特徴とする請求項１または２に記載の音声信号処理装置。
【請求項６】
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置での増幅度の内、最小可聴限界の音圧レベルが最も小さい部分を含む周波数帯域における前記中間点の位置での増幅度を最も小さくしていることを特徴とする請求項５記載の音声信号処理装置。
【請求項７】
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置での増幅度の内、最も低域の周波数帯域における前記中間点の位置での増幅度を最も大きくしていることを特徴とする請求項５または６に記載の音声信号処理装置。
【請求項８】
前記音圧レベル増幅部は、前記複数の周波数帯域における前記中間点の位置での増幅度を、前記第１の音声信号が有するダイナミックレンジに基づいて算出した最小増幅度から最大増幅度までの範囲で設定していることを特徴とする請求項５記載の音声信号処理装置。
【請求項９】
前記第１の音声信号はダイナミックレンジが異なる複数の音声信号の内のいずれかの音声信号であり、
前記音圧レベル増幅部は、複数のダイナミックレンジそれぞれで前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定しており、
前記第１の音声信号が有するダイナミックレンジに応じて前記増幅度の組を切り換えるよう制御する制御部を備えることを特徴とする請求項８記載の音声信号処理装置。
【請求項１０】
前記第１の音声信号は複数種類のジャンルのコンテンツの音声信号の内のいずれかの音声信号であり、
前記音圧レベル増幅部は、前記複数種類のジャンルそれぞれで前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定しており、
前記第１の音声信号のジャンルに応じて前記増幅度の組を切り換えるよう制御する制御部を備えることを特徴とする請求項５記載の音声信号処理装置。
【請求項１１】
前記音圧レベル増幅部は、前記第３の音声信号を聴取する際の複数の聴取モードに対応して、前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定しており、
前記複数の聴取モードを選択するための操作部と、
前記操作部によって選択した聴取モードに応じて前記増幅度の組を切り換えるよう制御する制御部を備えることを特徴とする請求項５記載の音声信号処理装置。
【請求項１２】
前記音圧レベル増幅部は、前記複数の周波数帯域の前記第２の音声信号に対して、前記第２の音声信号の音圧レベルが第１の音圧レベルから第２の音圧レベルへと上昇した時点で第１の時間のアタックタイムを有する過渡応答特性を付与すると共に、前記第２の音声信号の音圧レベルが第３の音圧レベルから第４の音圧レベルへと低下した時点で前記第１の時間よりも長い第２の時間のリリースタイムを有する過渡応答特性を付与することを特徴とする請求項１ないし１１のいずれか１項に記載の音声信号処理装置。
【請求項１３】
前記音圧レベル増幅部は、前記複数の周波数帯域の前記第２の音声信号に対して、高い周波数帯域ほど前記第１及び第２の時間が短い過渡応答特性を付与することを特徴とする請求項１２記載の音声信号処理装置。
【請求項１４】
前記最小可聴限界は、人間の標準的な聴力特性に基づく最小可聴限界であることを特徴とする請求項３，６ないし１１のいずれか１項に記載の音声信号処理装置。
【請求項１５】
前記最小可聴限界は、予め測定した前記第３の音声信号を聴取する聴取者の聴力特性に基づく最小可聴限界であることを特徴とする請求項３，６ないし１１のいずれか１項に記載の音声信号処理装置。
【請求項１６】
第１の音声信号を複数の周波数帯域に分割して、前記複数の周波数帯域毎の第２の音声信号を出力し、
前記複数の周波数帯域それぞれの前記第２の音声信号を、前記第２の音声信号の最小音圧レベルから最大音圧レベルまでの範囲における前記最小音圧レベルから所定の範囲の低音圧レベル領域と前記最大音圧レベルから所定の範囲の高音圧レベル領域とを除く中間音圧レベル領域で、音圧レベルを前記低音圧レベル領域側から前記中間音圧レベル領域内の中間点まで順次大きくし、前記中間点から前記高音圧レベル領域側まで順次小さくする増幅特性で増幅し、
増幅された前記複数の周波数帯域それぞれの前記第２の音声信号を加算して第３の音声信号として出力する
ことを特徴とする音声信号処理方法。
【請求項１７】
前記複数の周波数帯域における前記中間点の位置を少なくとも一部で異ならせることを特徴とする請求項１６記載の音声信号処理方法。
【請求項１８】
最小可聴限界の音圧レベルが最も小さい部分を含む周波数帯域における前記中間点の位置を、最も前記高音圧レベル領域側に位置させることを特徴とする請求項１７記載の音声信号処理方法。
【請求項１９】
前記複数の周波数帯域の内の最も低域の周波数帯域における前記中間点の位置を、最も前記低音圧レベル領域側に位置させることを特徴とする請求項１７または１８に記載の音声信号処理方法。
【請求項２０】
前記複数の周波数帯域における前記中間点の位置での増幅度を、少なくとも一部で異ならせることを特徴とする請求項１６または１７に記載の音声信号処理方法。
【請求項２１】
前記複数の周波数帯域における前記中間点の位置での増幅度の内、最小可聴限界の音圧レベルが最も小さい部分を含む周波数帯域における前記中間点の位置での増幅度を最も小さくすることを特徴とする請求項２０記載の音声信号処理方法。
【請求項２２】
前記複数の周波数帯域における前記中間点の位置での増幅度の内、最も低域の周波数帯域における前記中間点の位置での増幅度を最も大きくすることを特徴とする請求項２０または２１に記載の音声信号処理方法。
【請求項２３】
前記複数の周波数帯域における前記中間点の位置での増幅度を、前記第１の音声信号が有するダイナミックレンジに基づいて算出した最小増幅度から最大増幅度までの範囲で設定することを特徴とする請求項２０記載の音声信号処理方法。
【請求項２４】
前記第１の音声信号はダイナミックレンジが異なる複数の音声信号の内のいずれかの音声信号であり、
複数のダイナミックレンジそれぞれで前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、
前記第１の音声信号が有するダイナミックレンジに応じて前記増幅度の組を切り換えることを特徴とする請求項２３記載の音声信号処理方法。
【請求項２５】
前記第１の音声信号は複数種類のジャンルのコンテンツの音声信号の内のいずれかの音声信号であり、
前記複数種類のジャンルそれぞれで前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、
前記第１の音声信号のジャンルに応じて前記増幅度の組を切り換えることを特徴とする請求項２０記載の音声信号処理方法。
【請求項２６】
前記第３の音声信号を聴取する際の複数の聴取モードに対応して、前記複数の周波数帯域における前記中間点の位置での増幅度の組を設定し、
前記複数の聴取モードのいずれかを選択し、
選択した聴取モードに応じて前記増幅度の組を切り換えることを特徴とする請求項２０記載の音声信号処理方法。
【請求項２７】
前記複数の周波数帯域の前記第２の音声信号に対して、前記第２の音声信号の音圧レベルが第１の音圧レベルから第２の音圧レベルへと上昇した時点で第１の時間のアタックタイムを有する過渡応答特性を付与すると共に、前記第２の音声信号の音圧レベルが第３の音圧レベルから第４の音圧レベルへと低下した時点で前記第１の時間よりも長い第２の時間のリリースタイムを有する過渡応答特性を付与することを特徴とする請求項１６ないし２６のいずれか１項に記載の音声信号処理方法。
【請求項２８】
前記複数の周波数帯域の前記第２の音声信号に対して、高い周波数帯域ほど前記第１及び第２の時間が短い過渡応答特性を付与することを特徴とする請求項２７記載の音声信号処理方法。
【請求項２９】
前記最小可聴限界は、人間の標準的な聴力特性に基づく最小可聴限界であることを特徴とする請求項１８，２１ないし２６のいずれか１項に記載の音声信号処理方法。
【請求項３０】
前記最小可聴限界は、予め測定した前記第３の音声信号を聴取する聴取者の聴力特性に基づく最小可聴限界であることを特徴とする請求項１８，２１ないし２６のいずれか１項に記載の音声信号処理方法。

【図１】