音声処理装置、音声処理方法および音声処理プログラム

【課題】デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることを目的とする。
【解決手段】音声処理装置１００は、入力されたデジタル音声信号の周波数分析を行い、デジタル音声信号を１または複数の基本波信号と１または複数の基本波信号を除いた残差信号とに分離する信号分離部１２２と、１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号加算部１２４と、補正信号がそれぞれ加算された１または複数の基本波信号に残差信号を加算する残差信号加算部１２６と、を備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理装置、音声処理方法および音声処理プログラムに関する。
【背景技術】
【０００２】
近年、音声符号化技術の進歩により、ＣＤ（Compact Disc）等に収録されている楽曲の音質を極力維持したままファイルサイズを小さくすることが可能となり、その結果として、メモリタイプのポータブルオーディオプレーヤに例えば大量の楽曲を収録して携帯することが可能となった。
【０００３】
しかし、上述した音声符号化技術は、人間の聴覚特性を利用して通常聞き取れない高周波数領域の音声信号をカットしたり、マスキング効果により聞き取れない音のデータを間引いたりしているため、原音と比較すると、音の伸び、広がり、ダイナミックレンジ、艶っぽさに乏しくなる。そのため、音声符号化技術により圧縮されたデジタル音声信号の音質を改善する技術が開発されている。
【０００４】
例えば、デジタル音声信号の極大値と極小値とを特定し、極小値から極大値まで、または、極大値から極小値までのサンプル数を計数し、極大値および極小値を除くサンプル毎に、前のサンプルの値との差分を算出してこれにサンプル数に応じた係数を乗算し、この乗算結果を、極大値や極小値に近いサンプル位置に対して加減算する技術が開示されている（例えば、特許文献１）。
【０００５】
また、同様に、極値間のサンプル数を計数し、極大値や極小値と各々１サンプル前の値との差分を算出してこれにサンプル数に応じた係数を乗算し、この乗算結果を、極大値や極小値に直接、または、極大値や極小値に近いサンプル位置に加減算する技術も知られている（例えば、特許文献２）。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特許第３４０１１７１号公報
【特許文献２】特許第３６５９４８９号公報
【発明の概要】
【発明が解決しようとする課題】
【０００７】
上述した特許文献１や２の技術では、極小値から極大値までの区間と極大値から極小値までの区間とが独立して制御され、それぞれの区間のサンプル数に応じて、乗算する係数や加減算対象となるサンプル位置が決定される。したがって、デジタル音声信号の不規則な変化に対しても半周期に相当する区間毎に適切な音質改善処理を行うことができる。
【０００８】
一方、デジタル音声信号に含まれる各信号の周波数とサンプリング周波数とが等しくなる保証はないので、デジタル音声信号が仮に規則的な正弦波であったとしても、その周波数がサンプリング周波数と異なれば、半周期毎のサンプル数、すなわち極小値から極大値までのサンプル数と極大値から極小値までのサンプル数とが異なる場合が生じ得る。
【０００９】
このように極値間のサンプル数が異なると、乗算する係数や加減算対象となるサンプル位置が変わり、半周期毎に音質の改善量が異なることとなるので、規則的な正弦波に対しても音質改善処理が偏る結果を招き、十分に音質改善効果が発揮されない場合があった。
【００１０】
本発明は、このような課題に鑑み、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能な、音声処理装置、音声処理方法および音声処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【００１１】
上記課題を解決するために、本発明の音声処理装置は、入力されたデジタル音声信号の周波数分析を行い、デジタル音声信号を１または複数の基本波信号と１または複数の基本波信号を除いた残差信号とに分離する信号分離部と、１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号加算部と、補正信号がそれぞれ加算された１または複数の基本波信号に残差信号を加算する残差信号加算部と、を備えることを特徴とする。
【００１２】
音声処理装置は、デジタル音声信号を所定のフレーム単位で切り出し、その所定のフレームごとのデジタル音声信号を生成するフレーム化部と、入力されたフレーム単位のデジタル音声信号を、隣り合うフレームのデジタル音声信号の一部がオーバラップするように合成するオーバラップ合成部と、をさらに備え、信号分離部に入力されるデジタル音声信号はフレーム化部で生成された所定のフレームに区切られたデジタル音声信号であり、オーバラップ加算部に入力されるフレーム単位のデジタル音声信号は残差信号加算部から入力されてもよい。
【００１３】
１または複数の基本波信号は、相異なる周波数の複数の基本波信号であり、信号分離部は、１または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独でデジタル音声信号から減算した場合の差分信号を求め、差分信号のエネルギーが小さい順にデジタル音声信号から１または複数の基本波信号を順次減算してデジタル音声信号を１または複数の基本波信号と残差信号とに分離してもよい。
【００１４】
上述した１または複数の基本波信号は、所定の周波数と、所定の周波数を有する正弦波および余弦波のそれぞれの振幅とで表される信号であってもよい。
【００１５】
補正信号加算部は、１または複数の基本波信号それぞれの周波数と正弦波の振幅と余弦波の振幅とに応じて補正信号を生成してもよい。具体的に、補正信号加算部は、基本波信号の周波数と、振幅が１である正弦波および余弦波の各サンプル位置における補正信号の値とが予め対応付けられた補正テーブルを参照し、１または複数の基本波信号それぞれの周波数に応じて振幅が１である正弦波および余弦波の各サンプル位置における補正信号の値を抽出し、１または複数の基本波信号それぞれの正弦波の振幅と余弦波の振幅とを乗じて補正信号を生成してもよい。
【００１６】
上記課題を解決するために、本発明の音声処理方法は、入力されたデジタル音声信号の周波数分析を行い、デジタル音声信号を１または複数の基本波信号と１または複数の基本波信号を除いた残差信号とに分離し、１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算し、補正信号がそれぞれ加算された１または複数の基本波信号に残差信号を加算することを特徴とする。
【００１７】
上記課題を解決するために、本発明の音声処理プログラムは、コンピュータに、入力されたデジタル音声信号の周波数分析を行い、デジタル音声信号を１または複数の基本波信号と１または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号生成ステップと、補正信号がそれぞれ加算された１または複数の基本波信号に残差信号を加算する残差信号加算ステップと、を実行させることを特徴とする。
【発明の効果】
【００１８】
以上説明したように、本発明によれば、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。
【図面の簡単な説明】
【００１９】
【図１】音声処理装置の利用状態を説明するための説明図である。
【図２】音声処理装置の概略的な構成を説明するための機能ブロック図である。
【図３】フレーム化部におけるフレーム信号の生成過程を説明するための説明図である。
【図４】周波数分析候補となる所定数の周波数の一例を示した説明図である。
【図５】補正信号加算部のさらに具体的な構成を説明するための機能ブロック図である。
【図６】サンプル数と係数との関係を示した係数テーブルである。
【図７】補正信号加算部による音質改善処理の動作を説明するための説明図である。
【図８】補正信号加算部による音質改善処理の動作を説明するための説明図である。
【図９】補正信号加算部における音質改善処理を説明するための説明図である。
【図１０】オーバラップ合成部の動作を説明するための説明図である。
【図１１】コンピュータの典型例を示した機能ブロック図である。
【図１２】音声分析合成方法の全体的な流れを示したフローチャートである。
【発明を実施するための形態】
【００２０】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書および図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【００２１】
（音声処理装置１００）
図１は、音声処理装置１００の利用状態を説明するための説明図である。音声処理装置１００は、放送局１０２から放送波を通じて、コンテンツサーバ１０４から通信網１０６を通じて、または、記憶媒体１０８から直接、デジタル音声信号を取得し、そのデジタル音声信号に高周波数成分を付加することで、デジタル音声信号の音質を改善する。ユーザは、改善されたデジタル音声信号を、音声処理装置１００から直接、または、ポータブルオーディオプレーヤや携帯電話といった再生装置１１０に転送して聴くことができる。
【００２２】
また、コンテンツサーバ１０４が、音声処理装置１００を有しても良く、その場合、コンテンツサーバ１０４の音声処理装置１００によって、高周波数成分が付加された音声信号はパーソナルコンピュータやポータブルオーディオプレーヤ、携帯電話といった再生装置１１０へ、通信網１０６を通じて、配信される。
【００２３】
また、ポータブルオーディオプレーヤ、携帯電話といった再生装置１１０が音声処理装置１００を有しても良い。その場合、コンテンツサーバ１０４から通信網１０６を通じて配信されるデジタル音声信号は、ポータブルオーディオプレーヤ、携帯電話といった再生装置１１０の音声処理装置１００によって、高周波数成分が付加されて再生される。
【００２４】
音声処理装置１００が取得可能なデジタル音声信号としては、ＣＤやＤＶＤ（Digital Versatile Disk）規格に基づいた音声信号の他、ＭＰＥＧ（Moving Picture Expert Group）−２、ＡＡＣ（Advanced Audio Coding）、ＨＥ−ＡＡＣ（High efficiency-AAC）、ＡＴＲＡＣ（Adaptive TRansform Acoustic Coding）、ＭＰ３（MPEG Audio Layer-3）、ＷＭＡ（Windows（登録商標） Media Audio）等の音声符号化処理によって周波数帯域が狭められた音声信号も含む。ここでは、入力されるデジタル音声信号の一例として、サンプリング周波数ｆｓ＝４４．１ｋＨｚ、量子化ビット数１６ビットのデジタル音声信号（ＣＤ規格）を挙げて音声処理装置１００の各機能を説明する。
【００２５】
図２は、音声処理装置１００の概略的な構成を説明するための機能ブロック図である。音声処理装置１００は、フレーム化部１２０と、信号分離部１２２と、補正信号加算部１２４と、残差信号加算部１２６と、オーバラップ合成部１２８とを含んで構成される。
【００２６】
フレーム化部１２０は、音声処理装置１００が取得したデジタル音声信号を、処理単位である所定のフレーム単位（所定サンプル数長）で順次切り出し、フレーム単位のデジタル音声信号（以下、単にフレーム信号という）を生成する。
【００２７】
図３は、フレーム化部１２０におけるフレーム信号の生成過程を説明するための説明図である。図３に示したように、連続する１のデジタル音声信号が入力された場合、フレーム化部１２０は、まず、入力されたデジタル音声信号から所定の長さで区切られる一部のデジタル音声信号Ａのみを切り出してフレーム信号０を生成する。このとき、デジタル音声信号Ａの前段にはデジタル音声信号が存在しないので、デジタル音声信号Ａを含む所定サンプル数長のフレーム信号０は、図３のようにヌル値とデジタル音声信号Ａとから形成される。また、フレーム化部１２０は、次のフレーム信号のため、デジタル音声信号Ａの所定の位置から後尾までの所定長のデータである後部信号Ａ’をバッファ（図示せず）に一時的に保持する。
【００２８】
続いて、フレーム化部１２０は、引き続き入力されるデジタル音声信号に応じて、デジタル音声信号Ｂを切り出し、保持していたデジタル音声信号Ａの後部信号Ａ’とデジタル音声信号Ｂとをその順に接続し、所定サンプル数長のフレーム信号１を生成する。以後、フレーム化部１２０は、デジタル音声信号Ｂの後部信号Ｂ’と次に切り出したデジタル音声信号Ｃとでフレーム信号２を生成するといった具合にフレーム信号の生成を繰り返す。
【００２９】
したがって、フレーム化部１２０によって生成されたフレーム信号は、前後のフレーム信号と一部がオーバラップすることとなる。例えば、フレーム信号０とフレーム信号１とは後部信号Ａ’に相当するデータがオーバラップする。以後の信号分離部１２２、補正信号加算部１２４、残差信号加算部１２６、オーバラップ合成部１２８では、かかるフレーム信号（フレーム単位のデジタル音声信号）に対して処理が遂行される。また、ここでは、オーバラップされる後部信号Ａ’、Ｂ’、…の長さを、所定サンプル数長のフレーム信号に対して1／３の長さとして図示しているが、かかる場合に限らず、１／２以下の任意の数値とすることができる。
【００３０】
本実施形態においては、このように生成された各フレーム信号を、後述するオーバラップ合成部１２８においてオーバラップさせつつ再度合成する。かかるオーバラップ部分によってデジタル音声信号の連続性を確保することが可能となり、当該実施形態に基づいて新たに生成される高周波数成分を形成する補正信号の連続性も確保される。こうして、フレーム信号を切り出すことによる端部（エッジ）の影響を回避することができ、安定した音質改善効果を得ることが可能となる。
【００３１】
そして、フレーム化部１２０は、生成したフレーム信号を順次、信号分離部１２２に送信する。
【００３２】
信号分離部１２２は、フレーム化部１２０から受信した所定のフレームに区切られたフレーム信号の周波数分析を行い、フレーム信号を１または複数の基本波信号と、１または複数の基本波信号を除いた残差信号とに分離する。本実施形態において、信号分離部１２２は、一般調和解析（ＧＨＡ：Generalized Harmonic Analysis）を用いて基本波信号と残差信号とを分離する。
【００３３】
かかる一般調和解析は、周波数分析法として広く用いられている高速フーリエ変換（ＦＦＴ：Fast Fourier Transform）と比較して、演算負荷は重くなるものの、（１）高速フーリエ変換よりも周波数分析精度が高い、（２）雑音を抑圧することができる、（３）分析対象となるフレーム信号以外の波形を予測することができるといった点で有利である。
【００３４】
また、高速フーリエ変換を用いてフレーム信号の周波数分析を実行すると、そのフレーム信号は、フレーム単位の周期関数として扱われるので、端部において不連続な周波数成分が生じ、原信号となるデジタル音声信号に含まれていない新たな周波数成分を検出してしまう。さらに、フレーム信号の端部の連続性を確保すべく窓関数を施すと、高速フーリエ変換の周波数分析結果が常に窓関数の影響を受けてしまう。
【００３５】
一方、本実施形態の一般調和解析では、フレーム信号から、残差エネルギーが最小となる適切な正弦波や余弦波の組合せを導出しているので、時間分解能に依存しない高い周波数分解能で周波数分析を遂行することができる。このように信号分離部１２２は、一般調和解析を用いて基本波信号と残差信号とを分離することが最も望ましいが、これに限定されるわけではなく、種々の周波数分析法を用いることができる。
【００３６】
信号分離部１２２は、このような一般調和解析に従い、まず、サンプリング周波数ｆｓに基づいて周波数分析候補となる所定数の相異なる周波数ｆ_ｋ（ｋは整数）を決定する。そして、決定された所定数の周波数ｆ_ｋの基本波信号ｂ_ｋ［ｉ］（ｉは０〜Ｌ−１の整数、Ｌはフレーム信号のサンプル数）を、それぞれ単独でフレーム信号から減算して差分信号ｅ_ｋ［ｉ］を求め、さらにその二乗和により差分信号のエネルギーＥ_ｋを導出する。
【００３７】
なお、信号分離部１２２は、図示しないデコーダがデジタル音声信号をデコードするときに抽出したデジタル音声信号のサンプリング周波数の情報を取得して、そのサンプリング周波数に応じて周波数分析候補となる所定数の相異なる周波数ｆ_ｋ（ｋは整数）を決定するようにしてもよい。ただし、ＣＤプレーヤのように入力されるデジタル音声信号のサンプリング周波数が常に一定である再生装置に、本実施形態に係わる音声処理装置１００を用いる場合、信号分離部１２２は、必ずしもサンプリング周波数の情報を取得する必要はない。
【００３８】
図４は、周波数分析候補となる所定数の周波数の一例を示した説明図である。ここでは所定数の周波数として、その周波数の波形における極値の前後の半周期でサンプル数が同一となる周波数が選択される。本実施形態においてサンプリング周波数ｆｓは４４．１ｋＨｚであるから、極値の前後の半周期でサンプル数が同一となる周波数ｆ_ｋは、サンプリング周波数ｆｓの１／２の周波数をさらに半周期のサンプル数ＦＳ（ＦＳは整数）で分周した値ｆｓ／２／ＦＳとなる。
【００３９】
ただし、ＦＳ＝１の周波数ｆ_１（２２．０５ｋＨｚ）の周波数成分は、サンプリング定理に従って処理対象となるフレーム信号ｘ_０［ｉ］（ｉは０〜Ｌ−１の整数）に含まれないので、周波数ｆ_ｋは、図４に示すように、サンプル数ＦＳ＝２、３、４、…となる周波数に限られる。本実施形態では、サンプル数ＦＳ＝２、３、４、…、１０の相異なる９つの周波数ｆ_２〜ｆ_１０を周波数分析候補とする。周波数ｆ_ｋを極値の前後の半周期でサンプル数が同一となる周波数とした理由は後ほど述べる。
【００４０】
また、周波数ｆ_ｋの基本波信号ｂ_ｋ［ｉ］は、数式１で表すことができる。ただし、ｉは０〜Ｌ−１、ｋは２、３、４、…、１０である。
【数１】

…（数式１）
【００４１】
信号分離部１２２は、図４に示した周波数をＦＳの小さい順に選択し、処理対象となるフレーム信号ｘ_０［ｉ］に対する基本波信号ｂ_ｋ［ｉ］の正弦波の振幅Ｓ（ｆ_ｋ）を数式２を用いて導出し、余弦波の振幅Ｃ（ｆ_ｋ）を数式３を用いて導出する。ただし、ｋは２、３、４、…、１０である。
【数２】

…（数式２）
【数３】

…（数式３）
【００４２】
このようにして導出された振幅Ｓ（ｆ_ｋ）と振幅Ｃ（ｆ_ｋ）とを数式１に代入して基本波信号ｂ_ｋ［ｉ］を求め、処理対象となるフレーム信号ｘ_０［ｉ］から、その基本波信号ｂ_ｋ［ｉ］を、数式４のようにそれぞれ個別に減算して差分信号ｅ_ｋ［ｉ］を求める。
【数４】

…（数式４）
【００４３】
そして、差分信号ｅ_ｋ［ｉ］のエネルギーＥ_ｋを、数式５のように二乗和により導出し、その周波数ｆ_ｋに関連付けて一時的に保持する。
【数５】

…（数式５）
【００４４】
ここでは、導出された所定数の差分信号ｅ_ｋ［ｉ］のエネルギーＥ_ｋが小さいほど、その周波数ｆ_ｋの基本波信号ｂ_ｋ［ｉ］が、処理対象となるフレーム信号ｘ_０［ｉ］に含まれる占有率（度合い）が高いことを表す。信号分離部１２２は、このような差分信号ｅ_ｋ［ｉ］のエネルギーＥ_ｋを図４に示すｆｓ／２／ＦＳ（ＦＳ＝２、３、４、…１０）の９つの周波数ｆ_ｋすべてに関して計算する。
【００４５】
このような差分信号ｅ_ｋ［ｉ］のエネルギーＥ_ｋを個々に求めたのは、１または複数の基本波信号ｂ_ｋ［ｉ］すべてを除いた最終的な残差信号を最小にするためには、一般調和解析の下、フレーム信号ｘ_０［ｉ］から占有率が高い基本波信号ｂ_ｋ［ｉ］を優先して分離する必要があるからである。したがって、信号分離部１２２は、差分エネルギーＥ_ｋが小さい順、すなわち基本波信号ｂ_ｋ［ｉ］における占有率が高い順に９つの周波数ｆ_ｋを並び替える。
【００４６】
続いて、信号分離部１２２は、その９つの周波数ｆ_ｋに対応する９つの基本波信号ｂ_ｋ［ｉ］を、並び替えられた周波数ｆ_ｋの順に、原信号であるフレーム信号ｘ_０［ｉ］から順次減算する。ただし、上述した差分信号ｅ_ｋ［ｉ］を導出する工程では、毎回、原信号であるフレーム信号ｘ_０［ｉ］から改めて基本波信号ｂ_ｋ［ｉ］を減算したのに対し、ここでは、フレーム信号ｘ_０［ｉ］から１の基本波信号ｂ_ｋ［ｉ］を減算すると、その減算した後の残差信号ｄ［ｉ］に対して、次の基本波信号ｂ_ｋ［ｉ］の振幅Ｓ（ｆ_ｋ）および振幅Ｃ（ｆ_ｋ）を数式２、３を用いて改めて導出し、その基本波信号ｂ_ｋ［ｉ］を減算していく。したがって、減算する順番によっては基本波信号ｂ_ｋ［ｉ］の振幅Ｓ（ｆ_ｋ）および振幅Ｃ（ｆ_ｋ）が変化する。並び替えに用いた基本波信号ｂ_ｋ［ｉ］と当該フレーム信号ｘ_０［ｉ］から順次減算する基本波信号ｂ_ｋ［ｉ］とは所定の周波数ｆ_ｋを有する正弦波と余弦波で表されることで共通し、その正弦波と余弦波の振幅のみが異なる。並び替えに用いた基本波信号ｂ_ｋ［ｉ］は並び替えが完了すると用いられることはなくなり、振幅Ｓ（ｆ_ｋ）および振幅Ｃ（ｆ_ｋ）が変化した基本波信号ｂ_ｋ［ｉ］が最終的な基本波信号ｂ_ｋ［ｉ］として以後の処理でも用いられる。このような基本波信号ｂ_ｋ［ｉ］の減算を経て残差信号ｄ［ｉ］が導出される。したがって、残差信号ｄ［ｉ］は、数式６のように表すことができる。ただし、ｉは０〜Ｌ−１、ｋは２、３、４、…、１０である。
【数６】

…（数式６）
【００４７】
こうしてフレーム信号ｘ_０［ｉ］から占有率が高い基本波信号ｂ_ｋ［ｉ］が順次分離され、残差信号ｄ［ｉ］のエネルギーは漸減する。
【００４８】
このように、フレーム信号ｘ_０［ｉ］における占有率が高い基本波信号ｂ_ｋ［ｉ］から優先して分離する構成により、フレーム信号ｘ_０［ｉ］を１または複数の基本波信号ｂ_ｋ［ｉ］の組合せで適切に表すことができ、かつ、残差信号ｄ［ｉ］を最小限に抑えることが可能となる。
【００４９】
ここで、周波数分析候補となる所定数（ここでは９つ）の周波数ｆ_ｋは、サンプリング周波数ｆｓ（例えば４４．１ｋＨｚ）に対して図４の如く一義的に求まるので、サンプリング周波数ｆｓに応じて、所定数の周波数ｆ_ｋと基本波信号ｂ_ｋ［ｉ］とを一意に対応付けた基本波テーブルを予め作成しておくこともできる。ただし、基本波テーブルでは、振幅Ｓ（ｆ_ｋ）や振幅Ｃ（ｆ_ｋ）を所定値（例えば１）とした場合の各サンプルｉにおける正弦波および余弦波の値までが示されるに留まり、信号分離部１２２は、振幅Ｓ（ｆ_ｋ）や振幅Ｃ（ｆ_ｋ）を乗じて基本波信号ｂ_ｋ［ｉ］を導出することとなる。かかる基本波テーブルによって、演算負荷の軽減を図ることが可能となる。かかる基本波テーブルは図示しないメモリに保持されてもよく、通信網１０６から取得するとしてもよい。
【００５０】
信号分離部１２２は、引き続き並び替えられた順に基本波信号ｂ_ｋ［ｉ］を減算していき、周波数分析候補として準備されたすべての周波数ｆ_ｋに関する基本波信号ｂ_ｋ［ｉ］を減算し終わると、その残差信号ｄ［ｉ］を最終的な残差信号として残差信号加算部１２６に送信する。
【００５１】
ここで、周波数分析候補として準備されたすべての周波数ｆ_ｋに関する基本波信号ｂ_ｋ［ｉ］を減算していなくとも、その残差信号ｄ［ｉ］のエネルギーが十分に小さくなっていれば、例えば、残差信号ｄ［ｉ］が所定のエネルギー以下となれば、フレーム信号ｘ_０［ｉ］を十分に分離できたとして、その時点で基本波信号ｂ_ｋ［ｉ］の分離を停止し、残差信号ｄ［ｉ］を残差信号加算部１２６に送信する。
【００５２】
このとき、基本波信号ｂ_ｋ［ｉ］は、それぞれ、所定の周波数と、所定の周波数を有する正弦波の振幅と、余弦波の振幅とで表される信号なので、信号分離部１２２は、基本波信号ｂ_ｋ［ｉ］そのものではなく、基本波信号ｂ_ｋ［ｉ］の周波数を示す周波数情報と、正弦波成分の振幅情報と、余弦波成分の振幅情報といったパラメータと、基本波信号ｂ_ｋ［ｉ］の個数情報とを補正信号加算部１２４に送信する。かかる構成により、信号分離部１２２と補正信号加算部１２４とのアクセス負荷を著しく軽減することができる。
【００５３】
また、信号分離部１２２は、数式６に示すように、フレーム信号ｘ_０［ｉ］から対象となる基本波信号ｂ_ｋ［ｉ］をすべて除いた残差信号ｄ［ｉ］を残差信号加算部１２６に送信する。
【００５４】
本実施形態においては、後述するように基本波信号ｂ_ｋ［ｉ］のみに音質改善処理が施され、残差信号ｄ［ｉ］には施されない。しかし、残差信号ｄ［ｉ］はエネルギー量としても無視可能な信号なので、残差信号ｄ［ｉ］に音質改善処理を施さなくとも、原信号であるフレーム信号ｘ_０［ｉ］の音質改善レベルに影響はなく、むしろ残差信号ｄ［ｉ］に音質改善処理を施す処理負荷を他の処理に有効活用できる。
【００５５】
また、図４で示したように、基本波信号ｂ_ｋ［ｉ］の周波数ｆ_ｋを、極値の前後の半周期でサンプル数が同一となる周波数ｆ_ｋ＝ｆｓ／２／ＦＳとすることで、残差信号ｄ［ｉ］を除いたフレーム信号ｘ_０［ｉ］（１または複数の基本波信号ｂ_ｋ［ｉ］）を極値の前後の半周期でサンプル数が同一となる正弦波および余弦波で表すことができ、同一の正弦波や余弦波において、乗算する係数や加減算対象となるサンプル位置が異なるといった問題がなくなる。さらに、基本波信号ｂ_ｋ［ｉ］は、初期位相０の正弦波および余弦波のみで形成されるため、フレーム信号ｘ_０［ｉ］に対して補正信号を画一的に付加することができるので、音質改善の均一化を図ることが可能となる。
【００５６】
補正信号加算部１２４は、信号分離部１２２が分離した１または複数の基本波信号それぞれに対し、音圧０を中心とした振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する。
【００５７】
図５は、補正信号加算部１２４のさらに具体的な構成を説明するための機能ブロック図であり、図６は、サンプル数と係数との関係を示した係数テーブルであり、図７および図８は、補正信号加算部１２４による音質改善処理の動作を説明するための説明図である。補正信号加算部１２４は、極値特定部１５０と、サンプル数計数部１５２と、補正信号生成部１５４と、遅延部１５６と、加算部１５８とを含んで構成される。また、係数テーブルは図示しないメモリに保持されてもよく、通信網１０６から取得するとしてもよい。ここで、まず、補正信号加算部１２４で実行される音質改善処理の基本的動作を説明する。
【００５８】
極値特定部１５０は、補正信号加算部１２４が受信したフレーム信号ｘ_０［ｉ］（１または複数の基本波信号ｂ_ｋ［ｉ］）の極大値と極小値とを特定する。具体的に、極値特定部１５０は、フレーム信号ｘ_０［ｉ］の各サンプルにおける値を順次比較し、値が増加している状態または増減無しの状態から減少に転じたとき、その減少に転じる直前のサンプルにおける値を極大値とし、値が減少している状態または増減無しの状態から増加に転じたとき、その増加に転じる直前のサンプルにおける値を極小値とする。
【００５９】
サンプル数計数部１５２は、任意の極値（極大値または極小値）から次の極値までのサンプル数、すなわち、極大値から極小値まで、または極小値から極大値までのサンプル数を計数する。
【００６０】
補正信号生成部１５４は、フレーム信号ｘ_０［ｉ］における所定のサンプル間の変化量と１の係数とを乗じてデジタル音声信号の振幅の絶対値が拡大されるような補正値を生成し、所定のサンプル位置に配して補正信号を生成する。
【００６１】
例えば、図７の例では、補正信号生成部１５４は、図６の係数テーブルを参照し、図７（ａ）に示すフレーム信号ｘ_０［ｉ］に基づきサンプル数計数部１５２が計数した極大値から極小値まで、または極小値から極大値までの極値間のサンプル数、例えば「４」に対応した、係数「０．５」を抽出する。
【００６２】
ここで、図６の係数テーブルにおいて、サンプル数が多いほど係数の値が小さいのは以下の理由からである。すなわち、任意の極値から次の極値までのサンプル数が多い場合、そのフレーム信号ｘ_０［ｉ］の周波数は低く、例えば２２．１ｋＨｚの低域通過フィルタ（ＬＰＦ：Low Pass Filter）でフィルタリングが施されている場合であっても、その低周波数のフレーム信号ｘ_０［ｉ］の高調波は抑制されずに残る。したがって、大きな高周波数成分を付加しなくとも十分に高音質を維持できるので、係数は小さくて済む。
【００６３】
一方、任意の極値から次の極値までのサンプル数が少ない場合、そのフレーム信号ｘ_０［ｉ］の周波数は高く、例えば２２．１ｋＨｚの低域通過フィルタでフィルタリングが施されている場合に、その高周波数のフレーム信号ｘ_０［ｉ］の高調波はほとんど削減されている。したがって、高周波数成分を十分に付加しないと音質の改善を図ることができないので、係数は大きい必要がある。
【００６４】
続いて、補正信号生成部１５４は、図７（ａ）に示すフレーム信号ｘ_０［ｉ］の極大値と１サンプリング前のサンプル値との差分値ｄｌに、係数テーブルから抽出した０．５を乗算した乗算結果Δｄｌを極大値のサンプル位置に配し、フレーム信号の極小値と１サンプリング前のサンプル値との差分値ｄｓに０．５を乗算した乗算結果Δｄｓを極小値のサンプル位置に配して図７（ｂ）に示す補正信号ｃｏ［ｉ］を生成する。
【００６５】
また、ここでは、乗算結果Δｄｌ、Δｄｓを極大値や極小値のサンプル位置に加減算するような補正信号が生成されているが、加減算対象となるサンプル位置は、かかる場合に限らず、例えば、極大値や極小値の前後所定数のサンプル位置に加減算することもできる。
【００６６】
例えば、補正信号生成部１５４は、図８（ａ）に示すフレーム信号ｘ_０［ｉ］の極大値と１サンプリング前のサンプル値との差分値ｄｌに、係数テーブルから抽出した０．５を乗算した乗算結果Δｄｌを極大値の前後１のサンプル位置に配し、フレーム信号の極小値と１サンプリング前のサンプル値との差分値ｄｓに０．５を乗算した乗算結果Δｄｓを極小値の前後１のサンプル位置に配して図８（ｂ）に示す補正信号ｃｏ［ｉ］を生成する。また、極大値や極小値のサンプル位置と極大値や極小値の前後所定数のサンプル位置にそれぞれ乗算結果Δｄｌ、Δｄｓを配して、図７（ｂ）と図８（ｂ）とを合成した補正信号を生成することも可能である。
【００６７】
このように、特定の高周波数成分を付加するための複雑な計算を伴うことなく、任意のサンプル位置における振幅の絶対値を大きくするといった単純な処理で高周波数成分を付加する構成により、処理負荷を軽減しつつ音質の改善を図ることが可能となる。
【００６８】
遅延部１５６は、原信号となるフレーム信号ｘ_０［ｉ］を、極値特定部１５０、サンプル数計数部１５２、補正信号生成部１５４での処理時間分だけ遅延させ、図７（ａ）と図７（ｂ）や図８（ａ）と図８（ｂ）のようにフレーム信号ｘ_０［ｉ］と補正信号ｃｏ［ｉ］とを同期させる。
【００６９】
加算部１５８は、例えば図７（ａ）および図８（ａ）に示されるフレーム信号ｘ_０［ｉ］に、図７（ｂ）および図８（ｂ）に示される補正信号ｃｏ［ｉ］を加算して、図７（ｃ）および図８（ｃ）に示すような音質改善処理が施されたフレーム信号ｘ_０’［ｉ］を生成する。本実施形態においては、このような矩形波に近くなるように補正信号を付加することで高周波数成分を拡張し、音質の改善を図ることができる。
【００７０】
しかし、このような音質改善処理を無作為に実行すると、フレーム信号ｘ_０［ｉ］に含まれる各信号の周波数とサンプリング周波数ｆｓとが所定の関係を有さないので、仮に、フレーム信号ｘ_０［ｉ］が規則的な正弦波のみから形成されていたとしても、その周波数がサンプリング周波数ｆｓと異なれば、極小値から極大値までのサンプル数と極大値から極小値までのサンプル数とが異なり、乗算する係数や加減算対象となるサンプル位置が半周期毎に異なり音質改善処理が偏ることとなる。例えば、フレーム信号ｘ_０［ｉ］の全周期のサンプル数が「７」である場合、半周期のいずれか一方のサンプル数が「４」となり、他方が「３」となってしまい、その補正量もサンプル数に応じて偏る。
【００７１】
本実施形態においては、上述したように、音質改善処理の対象を、フレーム信号ｘ_０［ｉ］ではなく、そのフレーム信号ｘ_０［ｉ］に含まれる、極値の前後の半周期でサンプル数が同一となる周波数に基づく基本波信号ｂ_ｋ［ｉ］としているので、画一的かつ均一に音声改善処理を施すことができる。
【００７２】
例えば、本実施形態における補正信号加算部１２４に入力される１または複数の基本波信号ｂ_ｋ［ｉ］の１の基本波信号ｂ_ｋ［ｉ］を例に挙げると、上述した極値特定部１５０が特定すべき極大値と極小値の値は、基本波信号ｂ_ｋ［ｉ］の正弦波成分および余弦波成分それぞれの振幅情報から特定でき、極大値と極小値のサンプル位置は、基本波信号ｂ_ｋ［ｉ］の周波数を示す周波数情報から特定できる。
【００７３】
また、サンプル数計数部１５２が特定すべきサンプル数も、周波数情報から図４を参照して一意に決定することができる。したがって、補正信号生成部１５４が生成すべき補正信号も、基本波信号ｂ_ｋ［ｉ］の各情報から一意に導き出すことが可能となる。
【００７４】
上述したように、基本波信号ｂ_ｋ［ｉ］は、サンプリング周波数ｆｓの１／２を整数で分周した所定数の周波数ｆ_ｋのみで形成される。したがって、極値の前後の半周期でサンプル数が同一となるばかりでなく、正弦波や余弦波の開始点および終了点がサンプル点に位置することとなる。そうすると、補正信号加算部１２４は、画一的な補正値を付加するだけといった単純処理によって補正信号を生成できる。
【００７５】
図９は、本実施形態の補正信号加算部１２４における音質改善処理を説明するための説明図である。例えば、図９（ａ）に示す正弦波ｓｉｎ［ｉ］の音質改善処理では、極大値と極小値が、その周波数ｆ_ｋから求まるサンプル数ＦＳ（ここでは４）毎に出現し、同様に、図９（ｂ）に示す余弦波ｃｏｓ［ｉ］の補正でも、極大値と極小値がサンプル数ＦＳ毎に出現する。また、サンプル数ＦＳに応じて、加減算対象となるサンプル位置および係数も定まる。さらに、その振幅に応じて、加減算される値も一意に求まる。そうすると、当該正弦波ｓｉｎ［ｉ］や余弦波ｃｏｓ［ｉ］に対する補正信号が基本波信号ｂ_ｋ［ｉ］の各情報から一意に導き出される。したがって、補正信号加算部１２４は、基本波信号それぞれの周波数ｆ_ｋと正弦波ｓｉｎ［ｉ］の振幅と余弦波ｃｏｓ［ｉ］の振幅とに応じて、図９（ａ）や図９（ｂ）のように、音質改善処理を画一的に施すことが可能となる。
【００７６】
ここでは、サンプル数ＦＳが偶数の場合を説明したが、サンプル数ＦＳが奇数の場合も同様に画一的な補正信号を生成することができる。
【００７７】
また、正弦波および余弦波の各サンプル位置における補正信号ｃｏ［ｉ］の値は、基本波信号ｂ_ｋ［ｉ］の周波数ｆ_ｋに対して一義的に求まるので、補正信号加算部１２４は、基本波信号ｂ_ｋ［ｉ］の周波数ｆ_ｋと、振幅が１である正弦波および余弦波の各サンプル位置における補正信号ｃｏ［ｉ］の値とが対応付けられた補正テーブルを予め作成しておくこともできる。かかる補正テーブルは図示しないメモリに保持されてもよく、通信網１０６から取得するとしてもよい。そして、補正信号加算部１２４は、補正テーブルを参照し、１または複数の基本波信号ｂ_ｋ［ｉ］それぞれの周波数ｆ_ｋに応じて振幅が１である正弦波および余弦波の各サンプル位置における補正信号ｃｏ［ｉ］の値を抽出し、１または複数の基本波信号ｂ_ｋ［ｉ］それぞれの正弦波の振幅と余弦波の振幅とを乗じて補正信号ｃｏ［ｉ］を生成する。
【００７８】
さらに、基本波信号に含まれる正弦波や余弦波と補正信号とが比例関係にあるので、正弦波や余弦波と補正信号とを予め加算した信号とを対応付けてテーブルを作成することも可能である。
【００７９】
かかる残差信号ｄ［ｉ］を除く基本波信号ｂ_ｋ［ｉ］のみに対して補正信号ｃｏ［ｉ］を生成する構成により、補正信号ｃｏ［ｉ］を生成する際の処理負荷を著しく軽減することが可能となり、プログラムの簡素化を図ったり、処理能力の低い安価な処理装置を採用してコストの削減を図ることができる。
【００８０】
また、すべての基本波信号ｂ_ｋ［ｉ］に対して、適切なサンプル位置に適切な係数を乗じた乗算結果を均等に加減算することが可能となり、また、フレーム信号の変化に拘わらず、基本波信号ｂ_ｋ［ｉ］の同じサンプル位置に振幅に比例する同じ補正値を加えることができるので、偏りのない高周波数信号を付加することが可能となる。このように、デジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。
【００８１】
残差信号加算部１２６は、補正信号加算部１２４によって補正信号ｃｏ［ｉ］が加減算された１または複数の基本波信号ｂ_ｋ［ｉ］（フレーム信号ｘ_０’［ｉ］）と、信号分離部１２２で分離された残差信号ｄ［ｉ］とを加算して、フレーム信号を再構成する。したがって、再構成されたフレーム信号ｘ_０”［ｉ］は、数式７のようになる。ただし、数式７中のδs［ｉ］および、δc［ｉ］はそれぞれ振幅１の正弦波と余弦波に対する変位量を表し、ｉは０〜Ｌ−１、ｋは２、３、４、…、１０である。
【数７】

…（数式７）
【００８２】
オーバラップ合成部１２８は、残差信号加算部１２６において再構成されたフレーム信号と、１つ前のフレーム信号とを（隣り合うフレーム同士を）、デジタル音声信号の一部がオーバラップするように合成し、最終の出力信号を生成する。
【００８３】
図１０は、オーバラップ合成部１２８の動作を説明するための説明図である。図１０中フレーム信号は、フレーム化部１２０によって生成された後、信号分離部１２２、補正信号加算部１２４および残差信号加算部１２６を経由した信号であり、Ａ、Ｂ、Ｃの英数字は、図３のデジタル音声信号Ａ、Ｂ、Ｃに対応している。
【００８４】
具体的に、オーバラップ合成部１２８は、まず、再構成されたフレーム信号ｘ_０”［ｉ］（フレーム信号０、フレーム信号１、フレーム信号２、…）に対して図１０に示す窓関数Ｗを乗じる。フレーム化部１２０において既に正弦波窓による窓関数が施されている場合、オーバラップ合成部１２８においも正弦波窓による窓関数を採用する。また、フレーム化部１２０において窓関数が採用されていない場合、ハニング窓やブラックマン窓を採用する。窓関数はかかる場合に限られず、２つのフレーム信号がオーバラップしたとき、そのオーバラップ部分が合成してオーバラップしない部分と等しくなれば、既存の様々な窓関数を採用することができる。
【００８５】
図１０におけるフレーム信号１が入力されたときには、既にフレーム信号０のデジタル音声信号Ａが保持されており、オーバラップ合成部１２８は、フレーム信号０のデジタル音声信号Ａと、フレーム信号１の後部信号Ａ’とがオーバラップするように、デジタル音声信号Ａと後部信号Ａ’を加算して合成信号Ａ”を生成する。同時にオーバラップ合成部１２８は、フレーム信号１のデジタル音声信号Ｂを次回の加算処理のため一次的に保持する。そして、周波数時間変換部１４６からフレーム信号２が入力されると、オーバラップ合成部１２８は、フレーム信号１のとき同様、フレーム信号１のデジタル音声信号Ｂと、フレーム信号２の後部信号Ｂ’とをオーバラップするように加算して合成信号Ｂ”を生成する。オーバラップ合成部１２８は、このようにして生成された合成信号Ａ”、Ｂ”、Ｃ”、…を接続して随時出力する。
【００８６】
（音声処理プログラム）
また、上述した音声処理装置１００は、コンピュータを用いて実現することができる。
【００８７】
図１１は、音声処理装置１００として、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理することが可能なコンピュータ（情報処理装置）２００の典型例を示した機能ブロック図である。コンピュータ２００は、中央処理装置２１０と、一時記憶装置２１２と、外部記憶装置２１４と、入力部２１６と、出力部２１８とを含んで構成される。
【００８８】
中央処理装置（ＣＰＵ）２１０は、一時記憶装置２１２や外部記憶装置２１４のプログラムやアプリケーションによりコンピュータ２００全体を制御する。一時記憶装置２１２は、ＲＡＭ、ＥＥＰＲＯＭ、不揮発性ＲＡＭ等から構成され、中央処理装置２１０で処理されるデジタル音声信号等を一時的に記憶する。外部記憶装置２１４は、フラッシュメモリ、ＨＤＤ等で構成され、中央処理装置２１０で処理されるプログラムを記憶する。入力部２１６は、放送局１０２から放送波を通じて、コンテンツサーバ１０４から通信網１０６を通じて、または、記憶媒体１０８から直接、デジタル音声信号を入力し、一時記憶装置２１２に送信する。出力部２１８は、当該コンピュータ２００によって生成された出力信号を再生装置１１０に転送する。
【００８９】
上述した音質改善処理は、中央処理装置２１０がプログラムを実行することによって為される。したがって、音声処理装置１００が提供されると同時に、コンピュータ２００に、デジタル音声信号の周波数分析を行い、デジタル音声信号を１または複数の基本波信号と１または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算する補正信号生成ステップと、補正信号がそれぞれ加算された１または複数の基本波信号に残差信号を加算する残差信号加算ステップと、を実行させる音声処理プログラムも提供される。また、このプログラムは、記憶媒体から読みとられてコンピュータに取り込まれてもよいし、通信網１０６を介してコンピュータ２００に取り込まれてもよい。
【００９０】
（音声処理方法）
次に、上述した音声処理装置１００を用いてデジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理方法を説明する。
【００９１】
図１２は、音声分析合成方法の全体的な流れを示したフローチャートである。音声処理装置１００のフレーム化部１２０は、音声処理装置１００が取得したデジタル音声信号を、所定のフレーム単位（所定サンプル数長）で順次切り出し、フレーム信号を生成する（Ｓ３００）。
【００９２】
続いて、信号分離部１２２は、一般調和解析に基づき、フレーム信号の周波数分析を行い、所定数の相異なる周波数ｆ_ｋの所定数の基本波信号ｂ_ｋ［ｉ］を、それぞれ単独でフレーム信号から減算して差分信号ｅ_ｋ［ｉ］を求める（Ｓ３０２）。信号分離部１２２は、所定数の周波数ｆ_ｋすべてに関して処理が遂行されたか否か判断し（Ｓ３０４）、すべてに関して遂行されていない場合（Ｓ３０４のＮＯ）、差分信号導出ステップＳ３０２を繰り返す。
【００９３】
所定数の周波数ｆ_ｋすべてに関して遂行されると（Ｓ３０４のＹＥＳ）、差分信号のエネルギーＥ_ｋが小さい順に９つの周波数ｆ_ｋを並び替える（Ｓ３０６）。そして、信号分離部１２２は、すべての周波数ｆ_ｋに関する基本波信号ｂ_ｋ［ｉ］が減算されるか、または、残差信号ｄ［ｉ］が所定のエネルギー以下となるまで（Ｓ３０８のＮＯ）、その９つの周波数ｆ_ｋに対応する９つの基本波信号ｂ_ｋ［ｉ］を、並び替えられた周波数ｆ_ｋの順に、フレーム信号ｘ_０［ｉ］から順次減算し、残差信号ｄ［ｉ］を導出する（Ｓ３１０）。こうして、信号分離部１２２は、デジタル音声信号を１または複数の基本波信号ｂ_ｋ［ｉ］と残差信号ｄ［ｉ］とに分離することができる。
【００９４】
そして、補正信号加算部１２４は、１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して基本波信号に加算し（Ｓ３１２）、残差信号加算部１２６は、補正信号がそれぞれ加算された１または複数の基本波信号に残差信号を加算する（Ｓ３１４）。
【００９５】
最後に、オーバラップ合成部１２８は、残差信号加算部１２６において再構成されたフレーム信号と、１つ前のフレーム信号とを、一部がオーバラップするように合成し、最終の出力信号を生成する（Ｓ３１６）。
【００９６】
以上説明した音声処理方法によってもデジタル音声信号に含まれる各信号に対して画一的に音声改善処理を施すことで、音質改善の均一化を図ることが可能となる。
【００９７】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【００９８】
なお、本明細書の音声処理方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
【産業上の利用可能性】
【００９９】
本発明は、デジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を加工処理する音声処理装置、音声処理方法および音声処理プログラムに利用することができる。
【符号の説明】
【０１００】
１００ …音声処理装置
１２０ …フレーム化部
１２２ …信号分離部
１２４ …補正信号加算部
１２６ …残差信号加算部
１２８ …オーバラップ合成部
２００ …コンピュータ

【特許請求の範囲】
【請求項１】
入力されたデジタル音声信号の周波数分析を行い、前記デジタル音声信号を１または複数の基本波信号と前記１または複数の基本波信号を除いた残差信号とに分離する信号分離部と、
前記１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算する補正信号加算部と、
前記補正信号がそれぞれ加算された前記１または複数の基本波信号に前記残差信号を加算する残差信号加算部と、
を備えることを特徴とする音声処理装置。
【請求項２】
デジタル音声信号を所定のフレーム単位で切り出し、その所定のフレームごとのデジタル音声信号を生成するフレーム化部と、
入力されたフレーム単位のデジタル音声信号を、隣り合うフレームのデジタル音声信号の一部がオーバラップするように合成するオーバラップ合成部と、
をさらに備え、
前記信号分離部に入力されるデジタル音声信号は前記フレーム化部で生成された所定のフレームに区切られたデジタル音声信号であり、
前記オーバラップ加算部に入力されるフレーム単位のデジタル音声信号は前記残差信号加算部から入力されることを特徴とする請求項１に記載の音声処理装置。
【請求項３】
前記１または複数の基本波信号は、相異なる周波数の複数の基本波信号であり、
前記信号分離部は、前記１または複数の基本波信号と同じ周波数の複数の基本波信号をそれぞれ単独で前記デジタル音声信号から減算した場合の差分信号を求め、前記差分信号のエネルギーが小さい順に前記デジタル音声信号から前記１または複数の基本波信号を順次減算して前記デジタル音声信号を１または複数の前記基本波信号と前記残差信号とに分離することを特徴とする請求項１または２に記載の音声処理装置。
【請求項４】
前記１または複数の基本波信号は、所定の周波数と、前記所定の周波数を有する正弦波および余弦波のそれぞれの振幅とで表される信号であることを特徴とする請求項１から３のいずれか１項に記載の音声処理装置。
【請求項５】
前記補正信号加算部は、前記１または複数の基本波信号それぞれの周波数と正弦波の振幅と余弦波の振幅とに応じて前記補正信号を生成することを特徴とする請求項４に記載の音声処理装置。
【請求項６】
前記補正信号加算部は、
前記基本波信号の周波数と、振幅が１である正弦波および余弦波の各サンプル位置における補正信号の値とが予め対応付けられた補正テーブルを参照し、
前記１または複数の基本波信号それぞれの周波数に応じて前記振幅が１である正弦波および余弦波の各サンプル位置における補正信号の値を抽出し、前記１または複数の基本波信号それぞれの正弦波の振幅と余弦波の振幅とを乗じて前記補正信号を生成することを特徴とする請求項５に記載の音声処理装置。
【請求項７】
入力されたデジタル音声信号の周波数分析を行い、前記デジタル音声信号を１または複数の基本波信号と前記１または複数の基本波信号を除いた残差信号とに分離し、
前記１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算し、
前記補正信号がそれぞれ加算された前記１または複数の基本波信号に前記残差信号を加算することを特徴とする音声処理方法。
【請求項８】
コンピュータに、
入力されたデジタル音声信号の周波数分析を行い、前記デジタル音声信号を１または複数の基本波信号と前記１または複数の基本波信号を除いた残差信号とに分離する信号分離ステップと、
前記１または複数の基本波信号それぞれに対し、振幅の絶対値が拡大されるような補正信号を生成して前記基本波信号に加算する補正信号生成ステップと、
前記補正信号がそれぞれ加算された前記１または複数の基本波信号に前記残差信号を加算する残差信号加算ステップと、
を実行させることを特徴とする音声処理プログラム。

【図１】