説明

音声信号伝送装置、音声信号受信装置及び音声信号伝送システム

【課題】 マルチチャネルの音声信号を予測符号化し、圧縮率を改善した音声データを伝
送する。
【解決手段】 加算回路1aはステレオ2チャネル信号L、Rの和信号(L+R)を算出
し、減算回路1bは差信号(L−R)を算出する。差分演算回路11D1、11D2によ
り今回と前回の差分Δ(L+R)、Δ(L−R)を算出し、予測符号化回路(15D1、
15D2、16D1、16D2)により差分Δ(L+R)、Δ(L−R)の複数の予測値
を算し、複数の予測値と差分Δ(L+R)、Δ(L−R)の各予測残差を算出し、最小の
予測残差を選択する等して予測符号化データをパケットし、その後、所定の通信回線を通
じて伝送する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号を予測符号化して圧縮するための音声符号化方法により符号化された音声信号の伝送装置、音声信号受信装置及び音声信号伝送システムに関する。
【背景技術】
【0002】
音声信号を予測符号化する方法として、本発明者は先の出願(特願平9−289159
号)において1チャネル(チャンネル)の原デジタル音声信号に対して、特性が異なる複
数の予測器により時間領域における過去の信号から現在の信号の複数の線形予測値を算出
し、原デジタル音声信号と、この複数の線形予測値から予測器毎の予測残差を算出し、こ
の複数の予測残差の最小値を選択する方法を提案している。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、上記方法では原デジタル音声信号がサンプリング周波数=96kHz、
量子化ビット数=20ビット程度の場合に、ある程度の圧縮効果を得ることができるが、
近年のDVDオーディオディスクではこの2倍のサンプリング周波数(=192kHz)
が使用され、また、量子化ビット数も24ビットが使用される傾向があるので、圧縮率を
改善する必要がある。また、近年のDVDオーディオディスクでは、マルチチャネルが利
用され、チャネル数が最大6となるので圧縮率を改善する必要がある。
【0004】
そこで本発明は、音声信号を予測符号化する場合に圧縮率を改善することができる音声符号化方法により符号化された音声信号の伝送装置、音声信号受信装置及び音声信号伝送システムを提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明は上記目的を達成するために、以下の1)〜3)の手段よりなる。
すなわち、
【0006】
1)ステレオ2チャネルの音声信号を、互いに相関をとって得た複数チャネルのチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、予測係数が異なる複数の予測部により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測値を得る予測部を選択して予測符号化し、
SCR情報を含むパックヘッダと、圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮PCMアクセスユニットは前記フレーム中に複数設けられ、前記選択された各チャネルの予測部を示す予測部選択情報と予測残差とを含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケットに前記音声信号のサンプリング周波数に応じたサンプル数により格納し、前記圧縮PCMアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記先頭サンプル値を収納し、また、さらに、再生側において元のアナログ音声信号に復元される際に用いられるサンプリング周波数及び量子化ビット数を含む同期情報部を設けるようにした音声符号化方法により符号化されたデータを伝送する音声信号伝送装置であって、
前記先頭サンプル値と前記選択された予測部を示す予測部選択情報と予測残差とを含む予測符号化データと前記SCR情報とをパケット化して通信回線を介して伝送することを特徴とする音声信号伝送装置。
2)ステレオ2チャネルの音声信号を、互いに相関をとって得た複数チャネルのチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、予測係数が異なる複数の予測部により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測値を得る予測部を選択して予測符号化し、
SCR情報を含むパックヘッダと、圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮PCMアクセスユニットは前記フレーム中に複数設けられ、前記選択された各チャネルの予測部を示す予測部選択情報と予測残差とを含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケットに前記音声信号のサンプリング周波数に応じたサンプル数により格納し、前記圧縮PCMアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記先頭サンプル値を収納し、また、さらに、再生側において元のアナログ音声信号に復元される際に用いられるサンプリング周波数及び量子化ビット数を含む同期情報部を設けるようにした音声符号化方法により符号化されたデータがパケット化され通信回線を介して伝送されたパケットを受信する受信手段と、
前記受信したパケットに基づき元のデータを復元する復元手段と、
前記復元したデータの圧縮PCMアクセスユニットをSCR情報により時間管理する時間管理手段と、
前記サブパケットから先頭サンプル値を取り出すと共に各サブパケットからサンプリング周波数に応じたサンプル数の予測残差と予測部を示す予測部選択情報とを含む予測符号化データを取り出し、前記先頭サンプル値と前記予測残差および前記予測部選択情報により選択される予測部とに基づいて予測値を算出する手段と、
この算出された予測値から前記サンプリング周波数及び量子化ビット数に基づいて元の音声信号を復元する手段とを、
有する音声信号受信装置。
3)ステレオ2チャネルの音声信号を、互いに相関をとって得た複数チャネルのチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、予測係数が異なる複数の予測部により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測値を得る予測部を選択して予測符号化し、
SCR情報を含むパックヘッダと、圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮PCMアクセスユニットは前記フレーム中に複数設けられ、前記選択された各チャネルの予測部を示す予測部選択情報と予測残差とを含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケットに前記音声信号のサンプリング周波数に応じたサンプル数により格納し、前記圧縮PCMアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記先頭サンプル値を収納し、また、さらに、再生側において元のアナログ音声信号に復元される際に用いられるサンプリング周波数及び量子化ビット数を含む同期情報部を設けるようにした音声符号化方法により符号化されたデータをパケット化して通信回線を介して伝送する音声信号伝送装置と、
音声信号伝送装置でパケット化され通信回線を介して伝送されたパケットを受信する受信手段と、
前記受信したパケットに基づき元のデータを復元する復元手段と、
前記復元したデータの圧縮PCMアクセスユニットをSCR情報により時間管理する時間管理手段と、
前記同期情報部から抽出された識別子に基づいて前記サブパケットから先頭サンプル値を取り出すと共に各サブパケットからサンプリング周波数に応じたサンプル数の予測残差と予測部を示す予測部選択情報とを取り出し、前記先頭サンプル値と前記予測残差および前記予測部選択情報により選択される予測部に基づいて予測値を算出する手段と、
この算出された予測値から前記サンプリング周波数及び量子化ビット数に基づいて元の音声信号を復元する手段とを、
有する音声信号受信装置と、
からなる音声信号伝送システム。
【発明の効果】
【0007】
以上説明したように本発明によれば、従来以上に圧縮率を改善した音声信号を伝送することができると共に、不都合なく音声信号を復号できる。
【図面の簡単な説明】
【0008】
【図1】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第1の実施形態を示すブロック図である。
【図2】図1のエンコーダを詳しく示すブロック図である。
【図3】図2のマルチプレクサにより多重化される1フレームのフォーマットを示す説明図である。
【図4】DVDのパックのフォーマットを示す説明図である。
【図5】DVDのオーディオパックのフォーマットを示す説明図である。
【図6】図1のデコーダを詳しく示すブロック図である。
【図7】第2の実施形態のエンコーダを示すブロック図である。
【図8】第2の実施形態のデコーダを示すブロック図である。
【図9】第3の実施形態のエンコーダを示すブロック図である。
【図10】第3の実施形態のデコーダを示すブロック図である。
【図11】音声伝送方法を示すフローチャートである。
【図12】音声伝送方法を示すフローチャートである。
【図13】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第2の実施形態を示すブロック図である。
【図14】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第3の実施形態を示すブロック図である。
【図15】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第4の実施形態を示すブロック図である。
【図16】本発明における信号処理において記録あるいは伝送されるマルチチャネル信号のフォーマットの例を示す図である。
【図17】マルチチャネルの信号を図4のAパックのユーザデータのパケットとするときのフォーマットを示す図である。
【図18】図5に示す圧縮PCM(PPCM)のオーディオ(A)パケットの図3と異なる態様を示すフォーマット説明図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して本発明の実施の形態を説明する。図1は本発明が適用される音声
符号化装置とそれに対応した音声復号装置の第1の実施形態を示すブロック図、図2は図
1のエンコーダを詳しく示すブロック図、図3は図2のマルチプレクサにより多重化され
る1フレームのフォーマットを示す説明図、図4はDVDのパックのフォーマットを示す
説明図、図5はDVDのオーディオパックのフォーマットを示す説明図、図6は図1のデ
コーダを詳しく示すブロック図である。
【0010】
図1に示すチャネル相関回路Aは加算回路1aと減算回路1bを有する。加算回路1a
は各チャネル(以下、ch)が例えばサンプリング周波数=192kHz、量子化ビット数
=24ビットのステレオ2ch信号L、Rの和信号(L+R)を算出して和ch用1chロスレ
ス・エンコーダ2D1に出力し、減算回路1bは差信号(L−R)を算出して差ch用1ch
ロスレス・エンコーダ2D2に出力する。エンコーダ2D1、2D2は図2に詳しく示す
ように、それぞれ和信号(L+R)、差信号(L−R)の差分Δ(L+R)、Δ(L−R
)を予測符号化して記録媒体や通信媒体を介して伝送する。
【0011】
そして、復号側では、図6に詳しく示すようにデコーダ3D1、3D2がそれぞれ各ch
の予測符号化データを和信号(L+R)、差信号(L−R)に復号し、次いでチャネル相
関回路Bがこの和信号(L+R)、差信号(L−R)をステレオ2ch信号L、Rに復元す
る。
【0012】
図2を参照してエンコーダ2D1、2D2について詳しく説明する。和信号(L+R)
と差信号(L−R)は1フレーム毎に1フレームバッファ10に格納される。そして、1
フレームの各サンプル値(L+R)、(L−R)がそれぞれ差分演算回路11D1、11
D2に印加され、今回と前回の差分Δ(L+R)、Δ(L−R)、すなわち差分PCM(
DPCM)データが算出される。また、各フレームの先頭サンプル値(L+R)、(L−
R)がマルチプレクサ19に印加される。
【0013】
差分演算回路11D1により算出された差分Δ(L+R)は、予測係数が異なる複数の
予測器12a−1〜12a−nと減算器13a−1〜13a−nに印加される。そして、
予測器12a−1〜12a−nではそれぞれ各予測係数に基づいて差分Δ(L+R)の各
予測値が算出され、減算器13a−1〜13b−nではそれぞれこの各予測値と差分Δ(
L+R)の各予測残差が算出される。バッファ・選択器16D1はこの複数の予測残差を
一時記憶して、選択信号生成器17により指定されたサブフレーム毎に最小の予測残差を
選択し、パッキング回路18に出力する。なお、このサブフレームはフレームの数十分の
1程度のサンプル長であり、一例として1フレームを80サブフレームとする。ここで、
予測器12a−1〜12a−nと減算器13a−1〜13a−nは和信号chの予測回路1
5D1を構成し、また、この予測回路15D1とバッファ・選択器16D1は和信号chの
予測符号化回路を構成している。
【0014】
同様に、差分演算回路11D2により算出された差分Δ(L−R)は、予測係数が異な
る複数の予測器12b−1〜12b−nと減算器13b−1〜13b−nに印加される。
そして、予測器12b−1〜12b−nではそれぞれ各予測係数に基づいて差分Δ(L−
R)の各予測値が算出され、減算器13b−1〜13b−nではそれぞれこの各予測値と
差分Δ(L−R)の各予測残差が算出される。バッファ・選択器16D2はこの複数の予
測残差を一時記憶して、選択信号生成器17により指定されたサブフレーム毎に最小の予
測残差を選択し、パッキング回路18に出力する。予測器12b−1〜12b−nと減算
器13b−1〜13b−nは差信号chの予測回路15D2を構成し、また、この予測回路
15D2とバッファ・選択器16D2は差信号chの予測符号化回路を構成している。
【0015】
選択信号生成器17は予測残差のビット数フラグ(5ビット)をパッキング回路18と
マルチプレクサ19に対して印加し、また、予測残差が最小の予測器を示す予測器選択フ
ラグ(その数nが2〜9個として3ビット)をマルチプレクサ19に対して印加する。パ
ッキング回路18はバッファ・選択器16D1、16D2により選択された2ch分の予測
残差を、選択信号生成器17により指定されたビット数フラグに基づいて指定ビット数で
パッキングする。
【0016】
続くマルチプレクサ19は図3に示すように1フレーム分に対して
・フレームヘッダ(40ビット)と、
・和信号ch(L+R)の1フレームの先頭サンプル値(25ビット)と、
・差信号ch(L−R)の1フレームの先頭サンプル値(25ビット)と、
・和信号ch(L+R)のサブフレーム毎の予測器選択フラグ(3ビット×80)と、
・差信号ch(L−R)のサブフレーム毎の予測器選択フラグ(3ビット×80)と、
・和信号ch(L+R)のサブフレーム毎のビット数フラグ(5ビット×80)と、
・差信号ch(L−R)のサブフレーム毎のビット数フラグ(5ビット×80)と、
・和信号ch(L+R)の予測残差データ列(可変ビット数)と、
・差信号ch(L−R)の予測残差データ列(可変ビット数)とを
アクセスユニットとして多重化し、可変レートビットストリームとして出力する。上記
予測残差データ列はサブパケットを構成する。このような予測符号化によれば、原信号が
例えばサンプリング周波数=192kHz、量子化ビット数=24ビット、2チャネルの
場合、59%の圧縮率を実現することができる。
【0017】
また、この可変レートビットストリームデータをDVDオーディオディスクに記録する
場合には、図4に示す圧縮PCMのオーディオ(A)パックにパッキングされる。このパ
ックは2034バイトのユーザデータ(Aパケット、Vパケット)に対して4バイトのパ
ックスタート情報と、6バイトのSCR(System Clock Reference:システム時刻基準参
照値)情報と、3バイトのMux レート(rate)情報と1バイトのスタッフィングの合計1
4バイトのパックヘッダが付加されて構成されている(1パック=合計2048バイト)
。この場合、タイムスタンプであるSCR情報を、ACBユニット内の先頭パックでは「
1」として同一タイトル内で連続とすることにより同一タイトル内のAパックの時間を管
理することができる。
【0018】
圧縮PCMのAパケットは図5に詳しく示すように、17、9又は14バイトのパケッ
トヘッダと、プライベートヘッダと、図3に示すフォーマットの1ないし2015バイト
のオーディオ圧縮PCMデータにより構成されている。圧縮PCMのプライベートヘッダ
は、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Product Code/European Article Nu
mber-International Standard Recording Code)番号、及びUPC/EAN−ISRCデ
ータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・4バイトのオーディオデータ情報(ADI)と、
・0〜7バイトのスタッフィングバイトとに、
より構成されている。
このように圧縮PCMのAパケットのADIは、4バイトに選定され、通常の非圧縮の
PCMのAパケットのADIよりも4バイトだけ短くされている。したがってオーディオ
データは4バイト分増加させることができる。
【0019】
次に図6を参照してデコーダ3D1、3D2について説明する。図3に示したフォーマ
ットの可変レートビットストリームデータは、デマルチプレクサ21によりフレームヘッ
ダに基づいて分離される。そして、和信号ch(L+R)及び差信号ch(L−R)の1
フレームの先頭サンプル値はそれぞれ累積演算回路25a、25bに印加され、和信号c
h(L+R)及び差信号ch(L−R)の予測器選択フラグはそれぞれ予測器(24a−
1〜24a−n)、(24b−1〜24b−n)の各選択信号として印加され、和信号c
h(L+R)及び差信号ch(L−R)のビット数フラグと予測残差データ列はアンパッ
キング回路22に印加される。ここで、予測器(24a−1〜24a−n)、(24b−
1〜24b−n)はそれぞれ、符号化側の予測器(12a−1〜12a−n)、(12b
−1〜12b−n)と同一の特性であり、予測器選択フラグにより同一特性のも
のが選択される。
【0020】
アンパッキング回路22は和信号ch(L+R)及び差信号ch(L−R)の予測残差
データ列をビット数フラグ毎に基づいて分離してそれぞれ加算回路23a、23bに出力
する。加算回路23a、23bではそれぞれ、アンパッキング回路22からの和信号ch
(L+R)及び差信号ch(L−R)の今回の予測残差データと、予測器(24a−1〜
24a−n)、(24b−1〜24b−n)の内、予測器選択フラグにより選択された各
1つにより予測された前回の予測値が加算されて今回の予測値が算出される。この今回の
予測値は、図2に示す差分回路11a、11bによりそれぞれ算出された差分Δ(L+R
)、Δ(L−R)すなわちDPCMデータであり、予測器(24a−1〜24a−n)、
(24b−1〜24b−n)と累積演算回路25a、25bに印加される。
【0021】
累積演算回路25a、25bはそれぞれ、1フレームの先頭サンプル値に対して差分Δ
(L+R)、Δ(L−R)をサンプル毎に累積加算して和信号ch(L+R)、差信号c
h(L−R)の各PCMデータを出力する。この和信号(L+R)、差信号(L−R)は
図1に示すように加算回路4aにより2L信号が算出されるとともに、減算回路4bによ
り2R信号が算出される。そして、2L信号と2R信号がそれぞれ割り算器5a、5bに
より1/2に割り算され、元のステレオ2チャネル信号L、Rが復元される。
【0022】
次に図7、図8を参照して第2の実施形態について説明する。上記の実施形態では、和
信号(L+R)、差信号(L−R)の各差分Δ(L+R)、Δ(L−R)、すなわちDP
CMデータのみを予測符号化するように構成されているが、この第2の実施形態では和信
号(L+R)、差信号(L−R)すなわちPCMデータ、又はその各差分Δ(L+R)、
Δ(L−R)すなわちDPCMデータを選択的に予測符号化するように構成されている。
【0023】
このため図7に示す符号化装置では、図2に示す構成に対して和信号(L+R)、差信
号(L−R)をそれぞれ予測符号化するための予測回路15A、15Sとバッファ・選択
器16A、16Sが追加されている。また、選択信号生成器17はバッファ・選択器16
A、16Sによりそれぞれ選択された和信号(L+R)、差信号(L−R)と、バッファ
・選択器16D1、16D2によりそれぞれ選択された差分Δ(L+R)、Δ(L−R)
の各予測残差の最小値に基づいて、PCMデータとDPCMデータのどちらが圧縮率が高いか否かを判断し、高い方のデータを選択する。このとき、そのPCM/DPCMの選択フラグ(予測回路選択フラグ)を追加して多重化する。
【0024】
ここで、図7に示す和信号(L+R)の予測回路15Aと差分Δ(L+R)の予測回路
15D1が同一の構成であり、また、差信号(L−R)の予測回路15Sと差分Δ(L−
R)の予測回路15D2が同一の構成である場合、復号装置では図8に示すようにPCM
データとDPCMデータの両方の予測回路を設ける必要はなく、1つのデータ分の予測回
路でよい。そして、符号化装置から伝送された予測回路選択フラグに基づいてセレクタ2
6a、26bにより、DPCMデータの場合には累積演算回路25a、25bの出力を選
択し、PCMデータの場合には加算回路23a、23bの出力を選択する。
【0025】
第3の実施形態では図9に示すように、原信号L、R(PCMデータ)と、和信号(L
+R)、差信号(L−R)(PCMデータ)と、その各差分Δ(L+R)、Δ(L−R)
(DPCMデータ)の3グループの1つを選択的に予測符号化するように構成されている

【0026】
このため図9に示す符号化装置では、図7に示す構成に対して原信号L、Rをそれぞれ
予測符号化するための予測回路15L、15Rとバッファ・選択器16L、16Rが追加
されている。また、選択信号生成器17はバッファ・選択器16L、16Rにより選択さ
れた原信号L、Rと、バッファ・選択器16A、16Sにより選択された和信号(L+R
)、差信号(L−R)と、バッファ・選択器16D1、16D2により選択された各差分
Δ(L+R)、Δ(L−R)の各予測残差の最小値に基づいて圧縮率が高いグループのデ
ータを選択する。このとき、その選択フラグ(予測回路選択フラグ)を追加して多重化す
る。
【0027】
また、図9に示す3グループの予測回路が同一の構成である場合、復号装置では図10
に示すように3グループ分の予測回路を設ける必要はなく、1つのグループ分の予測回路
でよい。そして、符号化装置から伝送された予測回路選択フラグに基づいて、DPCMデ
ータの場合には累積演算回路25a、25bの出力を選択し、PCMデータの場合には加
算回路23a、23bの出力を選択してチャネル相関回路Bにより原信号L、Rを復元す
る。そして、更にセレクタ27a、27bにより原信号L、Rのグループの場合には加算
回路23a、23bの出力を選択し、他の場合にはチャネル相関回路Bの出力を選択する
【0028】
また、符号化側により予測符号化された可変レートビットストリームデータをネットワ
ークを介して伝送する場合には、符号化側では図11に示すように伝送用にパケット化し
(ステップS41)、次いでパケットヘッダを付与し(ステップS42)、次いでこのパ
ケットをネットワーク上に送り出す(ステップS43)。復号側では図12に示すように
ヘッダを除去し(ステップS51)、次いでデータを復元し(ステップS52)、次いで
このデータをメモリに格納して復号を待つ(ステップS53)。
【0029】
上記第1の実施の形態は2チャネルの場合について説明したが、2以上のマルチチャネ
ルの場合の第2の実施の形態について以下説明する。図13は、本発明の第2の実施の形
態を示すブロック図である。図13は、図1の2チャネル用の構成に対して後方の2チャ
ネルSL、SRを加えた4チャネル用として構成され、よって入力側にはチャネル相関回路
Aに加えて、同様な構成のチャネル相関回路A2が設けられている。また、出力側にもチ
ャネル相関回路Bに加えて、同様な構成のチャネル相関回路B2が設けられている。また
、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dはマルチチャネル対応型として構
成されている。なお、チャネル相関回路A、A2、B、B2は、それぞれLとR、SLと
SRを組み合わせの対象としている。なお、ロスレス・エンコーダ2Dとロスレス・デコ
ーダ3Dにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の選択、
最小予測残差を用いた予測値の算出などは、第1の実施の形態と同様に行われる。
【0030】
次に、第2の実施の形態の変形例としての第3の実施の形態について、そのブロック図
を示す図14に沿って説明する。図14は、図13の4チャネル用の構成に対して更にセ
ンタチャネルC及び低音効果チャネルLFEを加えた合計6チャネル用として構成されてい
る。ただし、センタチャネルC、後方の2チャネルSL、SR、及び低周波音効果チャネル
LFEはLとRのように相関をとることなく、直接ロスレス・エンコーダ2Dに入力され、
また直接ロスレス・デコーダ3Dから出力される。
【0031】
次に、第2の実施の形態及び第3の実施の形態の変形例としての第4の実施の形態につ
いて、そのブロック図を示す図15に沿って説明する。図15に示すチャネル相関回路A
−1は加算回路1aと減算回路1bを有する。加算回路1aはステレオ2ch信号L、Rの
和信号(L+R)を算出し、この和信号(L+R)を割り算器5aにより1/2に割り算
してから、ロスレス・エンコーダ2Dに出力し、減算回路1bは差信号(L−R)を算出
し、この差信号(L−R)を割り算器5bにより1/2に割り算してから、ロスレス・エ
ンコーダ2Dに出力する。ロスレス・エンコーダ2Dは、1/2(L+R)と1/2(L−R)を用いてこれらを多重化して多重化信号250を作る。多重化信号250はロスレス・デコーダ3Dによりデコードされて、元の1/2(L+R)と1/2(L−R)が得られ、これらが、チャネル相関回路B−1を構成する加算回路4aと減算回路4bにそれぞれ与えられ、出力信号としてステレオ2chのL信号とR信号が得られる。なお、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の選択、最小予測残差を用いた予測値の算出などは、第1の実施の形態と同様に行われる。第4の実施の形態からわかるように、第2、第3の実施の形態におけるチャネル相関回路A、A2はL+R及びL−Rを演算するものに限らず、1/2(L+R)、1/2(L−R)を演算するものに置き換えることができる。この場合、ロスレス・デコーダ3D側のチャネル相関回路B−1では1/2の演算は不要である。
【0032】
なお、先に図3で説明したフォーマットは1例であって、本発明における信号処理にお
いて記録あるいは伝送される信号のフォーマットは、これに限られるものでない。マルチ
チャネルの場合は、図13に対応してL、R信号に加えて、後方2チャネルSL、SRも和
信号(SL+SR)と差信号(SL−SR)の形で収納される(図16のa)。また、同様に
図14に対応してL、R信号は和信号と差信号の形で収納され、これに加えて、センター
チャネルC、後方2チャネルSL、SR、低周波効果チャネルLFEは、そのまま、すなわち
和信号や差信号の形をとることなく収納される(図16のb)。
【0033】
図17は、図16に示すようなマルチチャネルの信号を図4のAパックのユーザデータ
のパケットとするときのフォーマットを示す図である。ビットストリームBS0には、和
信号(L+R)と差信号(L−R)が収納され、また他のビットストリームBS1には、
図16のaに対応する場合は、和信号(SL+SR)と差信号の(SL−SR)が、一方図1
6のbに対応する場合は、センターチャネルC、後方2チャネルSL、SR、低周波効果チ
ャネルLFEが、そのまま収納される。
【0034】
図5に示す圧縮PCM(PPCM)のオーディオ(A)パケットの図3と異なる態様を
図18に示す。この異なる態様では、圧縮PCM(PPCM)のオーディオ(A)パケッ
トにおけるオーディオデータエリアは、図18に示すように複数のPPCMアクセスユニ
ットにより構成され、PPCMアクセスユニットはPPCMシンク情報とサブパケットに
より構成されている。最初のPPCMアクセスユニット内のサブパケットは、ディレクト
リと、ビットストリームBS0と、CRCと、ビットストリームBS1と、CRCとエク
ストラ情報により構成され、ビットストリームBS0,BS1はPPCMブロックのみに
より構成されている。2番目以降のPPCMアクセスユニット内のサブパケットは、ディ
レクトリを除いてビットストリームBS0と、CRCと、ビットストリームBS1、CR
Cとエクストラ情報により構成され、フレーム先頭のビットストリームBS0及びBS1
はリスタートヘッダとPPCMブロックにより構成されている。フレーム先頭のPPCM
ブロックにフレーム先頭サンプル値を配する。
【0035】
PPCMシンク情報(以下、同期情報ともいう)は次の情報を含む。
・1パケット当たりのサンプル数:サンプリング周波数fsに応じて40、80又は60
が選択される。
・データレート:VBRの場合には「0」(サブパケット内のデータが圧縮データである
ことを示す識別子)
・サンプリング周波数fs及び量子化ビット数Qb
・チャネル割り当て情報
ここで、リスタートヘッダはフレーム毎にチャネル相関回路Aが加算回路と減算回路で
構成されることを明記した情報を有している。これらのオーディオデータは図13と図1
4においてデマルチプレクサ21以下の構成からなるロスレス・デコーダ3D(図8)に
より元のマルチチャネルオーディオ信号に復号される。図18に示したフォーマットの可
変レートビットストリームデータは、図1のチャネル相関回路を用いたか、図15のチャ
ネル相関回路を用いたかを、例えばPPCMアクセスユニットのリスタートヘッダに格納
した識別子(図示せず)で識別するようにしているので、いずれであってもデコーダは確
実にデコードできる。なお、フレーム毎のロスレス圧縮を例に説明したが、固定の長さに
限らず区間は可変の長さであってもよい。
【符号の説明】
【0036】
1a、4a 加算回路(加算手段)
1b、4b 減算回路(減算手段)
5a、5b 割り算器
11D1 差分演算回路(第1の差分演算手段)
11D2 差分演算回路(第2の差分演算手段)
12a−1〜12a−n 予測器(減算器13a−1〜13a−n、バッファ
・選択器16D1と共に第1の予測符号化手段を構成する。)
12b−1〜12b−n 予測器(減算器13b−1〜13b−n、バッファ
・選択器16D2と共に第2の予測符号化手段を構成する。)
13a−1〜13a−n,13b−1〜13b−n 減算器
16D1,16D2,16A,16S,16L,16R バッファ・選択器
15A 予測回路(バッファ・選択器16Aと共に第3の予測符号化手段を構
成する。)
15S 予測回路(バッファ・選択器16Sと共に第4の予測符号化手段を構
成する。)
15L 予測回路(バッファ・選択器16Lと共に第5の予測符号化手段を構
成する。)
15R 予測回路
路(バッファ・選択器16Rと共に第6の予測符号化手段を構成する。)

【特許請求の範囲】
【請求項1】
ステレオ2チャネルの音声信号を、互いに相関をとって得た複数チャネルのチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、予測係数が異なる複数の予測部により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測値を得る予測部を選択して予測符号化し、
SCR情報を含むパックヘッダと、圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮PCMアクセスユニットは前記フレーム中に複数設けられ、前記選択された各チャネルの予測部を示す予測部選択情報と予測残差とを含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケットに前記音声信号のサンプリング周波数に応じたサンプル数により格納し、前記圧縮PCMアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記先頭サンプル値を収納し、また、さらに、再生側において元のアナログ音声信号に復元される際に用いられるサンプリング周波数及び量子化ビット数を含む同期情報部を設けるようにした音声符号化方法により符号化されたデータを伝送する音声信号伝送装置であって、 前記先頭サンプル値と前記選択された予測部を示す予測部選択情報と予測残差とを含む予測符号化データと前記SCR情報とをパケット化して通信回線を介して伝送することを特徴とする音声信号伝送装置。
【請求項2】
ステレオ2チャネルの音声信号を、互いに相関をとって得た複数チャネルのチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、予測係数が異なる複数の予測部により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測値を得る予測部を選択して予測符号化し、
SCR情報を含むパックヘッダと、圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮PCMアクセスユニットは前記フレーム中に複数設けられ、前記選択された各チャネルの予測部を示す予測部選択情報と予測残差とを含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケットに前記音声信号のサンプリング周波数に応じたサンプル数により格納し、前記圧縮PCMアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記先頭サンプル値を収納し、また、さらに、再生側において元のアナログ音声信号に復元される際に用いられるサンプリング周波数及び量子化ビット数を含む同期情報部を設けるようにした音声符号化方法により符号化されたデータがパケット化され通信回線を介して伝送されたパケットを受信する受信手段と、
前記受信したパケットに基づき元のデータを復元する復元手段と、
前記復元したデータの圧縮PCMアクセスユニットをSCR情報により時間管理する時間管理手段と、
前記サブパケットから先頭サンプル値を取り出すと共に各サブパケットからサンプリング周波数に応じたサンプル数の予測残差と予測部を示す予測部選択情報とを含む予測符号化データを取り出し、前記先頭サンプル値と前記予測残差および前記予測部選択情報により選択される予測部とに基づいて予測値を算出する手段と、
この算出された予測値から前記サンプリング周波数及び量子化ビット数に基づいて元の音声信号を復元する手段とを、
有する音声信号受信装置。
【請求項3】
ステレオ2チャネルの音声信号を、互いに相関をとって得た複数チャネルのチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、予測係数が異なる複数の予測部により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測値を得る予測部を選択して予測符号化し、
SCR情報を含むパックヘッダと、圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮PCMアクセスユニットは前記フレーム中に複数設けられ、前記選択された各チャネルの予測部を示す予測部選択情報と予測残差とを含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケットに前記音声信号のサンプリング周波数に応じたサンプル数により格納し、前記圧縮PCMアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記先頭サンプル値を収納し、また、さらに、再生側において元のアナログ音声信号に復元される際に用いられるサンプリング周波数及び量子化ビット数を含む同期情報部を設けるようにした音声符号化方法により符号化されたデータをパケット化して通信回線を介して伝送する音声信号伝送装置と、
音声信号伝送装置でパケット化され通信回線を介して伝送されたパケットを受信する受信手段と、
前記受信したパケットに基づき元のデータを復元する復元手段と、
前記復元したデータの圧縮PCMアクセスユニットをSCR情報により時間管理する時間管理手段と、
前記同期情報部から抽出された識別子に基づいて前記サブパケットから先頭サンプル値を取り出すと共に各サブパケットからサンプリング周波数に応じたサンプル数の予測残差と予測部を示す予測部選択情報とを取り出し、前記先頭サンプル値と前記予測残差および前記予測部選択情報により選択される予測部に基づいて予測値を算出する手段と、
この算出された予測値から前記サンプリング周波数及び量子化ビット数に基づいて元の音声信号を復元する手段とを、
有する音声信号受信装置と、
からなる音声信号伝送システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate


【公開番号】特開2012−3271(P2012−3271A)
【公開日】平成24年1月5日(2012.1.5)
【国際特許分類】
【出願番号】特願2011−164642(P2011−164642)
【出願日】平成23年7月27日(2011.7.27)
【分割の表示】特願2008−129270(P2008−129270)の分割
【原出願日】平成11年10月13日(1999.10.13)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】