説明

動画像符号化装置及びプログラム、並びに、動画像配信システム

【課題】 動画像の符号化について、符号化効率を向上させることができる。
【解決手段】 受信装置と、配信用動画像データを受信装置に配信する動画像配信装置とを有する動画像配信システムに関する。そして、動画像配信装置に搭載された動画像符号化装置は、入力シーケンスのうち非キーフレームの予測画像をキーフレームを利用して生成する手段と、非キーフレームの原画像に対する予測画像の誤りやすさに応じた誤り訂正符号の量を求め、求めた誤り訂正符号の量に応じた誤り訂正符号を符号化データとして生成する手段と、所定の方法により第1の誤り訂正符号の量を算出する手段と、第1の誤り訂正符号の量に対する補正量を算出する手段と、第1の誤り訂正符号の量とは異なる方法で誤り訂正符号の量を算出し、その算出結果に応じて第1の誤り訂正符号の量を補正するか否か判定して補正する手段とを有することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、動画像符号化装置及びプログラム、並びに、動画像配信システムに関し、例えば、動画像についてDVC(Distributed Video Coding)方式で動画像データを符号化して配信する動画像配信システムに適用し得る。
【背景技術】
【0002】
近年、非特許文献1に説明されるようなDVCという符号化方式に注目が集まっている。
【0003】
この方式は、符号化部で符号化するべき原画像に対してSlepian−Wolf符号化処理を行い、その符号化データと復号側で行った符号化部の原画像の予測画像とともにSlepian−Wolf復号を行うことで画像の復号処理を行う新しい符号化方式である。
【0004】
符号化部で符号化するべき原画像(以下、「Wyner−Zivフレーム」という)を、符号化部のWyner−Zivフレーム符号化部で、変換係数領域(DCT)に変換した後、各帯域毎に量子化(2Mk level Quantizer)し、その値(q)を2値で表し、各ビットの情報を、例えば1frame分集めた情報(Extract bit−planes)毎にSlepian−Wolf符号化(Turbo Encoder)を行い、その結果のうちパリティビットのみを一時保存(Buffer)し、情報ビットは捨てられる。
【0005】
その後、復号部のSlepian−Wolf復号(Turbo Decoder)の復号値とSide Informationから変換係数を再構築し、逆変換(IDCT)することで復号画像を得る。
【0006】
一方、復号化部に搭載されたSlepian−Wolf復号部(Turbo Decoder)は符号化部に対して、一時保存しているパリティビットのうち一部に対して送信要求(Request bits)を行う。受信したパリティビットと上述したSide InformationからSlepian−Wolf復号(Turbo Decoder)を行う。十分な復号が行えなかった場合は、再度符号化部にパリティビットの一部の追加送信要求(Request bits)を行い、受信したパリティビットと上述したSide InformationからSlepian−Wolf復号(Turbo Decoder)を行う。この処理を、十分な復号が行えるまで続ける。
【0007】
その後、復号化部のSlepian−Wolf復号(Turbo Decoder)の復号値とSide Informationから変換係数を再構築し、逆変換(IDCT)することで復号画像を得る。
【0008】
このような、非特許文献1に代表されるDVCの方式は、誤り訂正符号の再送要求というフィードバックを行うため、遅延が生じることや、符号化部と復号部が単独で動作できないという問題がある。
【0009】
そこで、非特許文献2では、この再送要求を避けるために、誤り訂正に必要な誤り訂正符号の量をWyner−Zivフレーム符号化部で計算を行う。これは、Wyner−Zivフレーム復号部の作る予測画像を想定した予測画像をWyner−Zivフレーム符号器側で生成し、それをもとに予測画像の誤りを推定し訂正するための必要な誤り訂正符号の量を計算することにより、フィードバックを必要としない手法を実現している。
【0010】
非特許文献2における送信符号量の推定手法は、「予測画像と原画像の係数の差分の分布はラプラス分布で近似できる」というモデルを利用し、この分布モデルを用いて予測画像と原画像の間の予測誤りの起こる確率を推定する。分布モデルを用いて誤り確率を推定し、推定した確率を用いて条件付きエントロピーを計算することによって、推定した誤りを訂正するのに必要な符号量を推定する。
【0011】
しかし、符号化側と復号側で生成する予測画像が異なることや、誤りの推定に用いる分布モデルは原画像と予測画像の関係を近似したものであるため、分布モデルから推定した符号量は、実際にSlepian−Wolf復号に必要な符号量は異なることがある。
【0012】
この推定した符号量が復号に必要な符号量より少ない場合は、誤り訂正が正しく行われないことがあり、その結果、復号した画像に歪みとして現れることがある、という問題がある。そこで、この間題に対して、非特許文献2では、relative error probabilityと呼ばれる補助情報を分布モデルから得られる符号量に加算することで補正を行い、送信符号量を決定している。
【先行技術文献】
【非特許文献】
【0013】
【非特許文献1】AnneAaron,ShantanuRane,Eric Setton,and Bernd Girod,“Transform−domain Wyner−Ziv Codec for Video”.In:Proc,SPIE Visual Communications and Image Processing,SanJose,CA(2004)
【非特許文献2】C.Brites,F.Pereira,”Encoder Rate Control for Transform Domain Wyner−Ziv Video Coding”,ICIP2007,USA(September 2007)
【発明の概要】
【発明が解決しようとする課題】
【0014】
しかしながら、非特許文献2では、分布モデルから得られる符号量に常に補助情報を加算しているため、分布モデルから推定した符号量で復号に必要な符号量が得られている場合、分布モデルで推定した符号量で予測誤りが訂正できる。このような場合、補助情報分の符号量が増加したとしても、誤り訂正の結果は変わらず、復号画質も変わらない。そのために補正を行った補助情報分の符号量が冗長となることがあるため、符号化効率が悪くなるという問題があった。
【0015】
そのため、動画像の符号化について、符号化効率を向上させることができる動画像符号化装置及びプログラム、並びに、動画像配信システムが望まれている。
【課題を解決するための手段】
【0016】
第1の本発明は、フレーム列を有する動画像信号を符号化する動画像符号化装置において、(1)上記フレーム列のそれぞれのフレームをキーフレーム又は非キーフレームに分類するフレーム分類手段と、(2)上記フレーム列のうちキーフレームを符号化するキーフレーム符号化手段と、(3)符号化されたキーフレームを利用して、非キーフレームの予測画像を生成する予測画像生成手段と、(4)非キーフレームの原画像に対する予測画像の誤りやすさに応じて、その誤りを訂正する誤り訂正符号の量を求める送信符号量算出手段と、(5)上記送信符号量算出手段が求めた誤り訂正符号の量に応じた誤り訂正符号を、非キーフレームの符号化データとして生成する非キーフレーム符号化手段とを備え、(6)上記送信符号量算出手段は、(6−1)所定の方法により上記原画像に対する上記予測画像の誤りを訂正する第1の誤り訂正符号の量を算出する誤り訂正符号量算出手段と、(6−2)上記誤り訂正符号量算出手段が算出する誤り訂正符号の量に対する補正量を算出する補正量算出手段と、(6−3)上記誤り訂正符号量算出手段とは異なる方法を用いて、上記原画像に対する上記予測画像の誤りを訂正する誤り訂正符号の量を算出する1又は複数の判定用誤り訂正符号量算出手段と、(6−4)上記判定用誤り訂正符号量算出手段の算出結果に応じて、上記第1の誤り訂正符号の量を補正するか否か判定する補正判定手段と、(6−5)上記補正判定手段により、上記第1の誤り訂正符号の量を補正すると判定された場合には、上記第1の誤り訂正符号の量について、上記補正量算出手段が算出した補正量を用いて補正した値を、当該送信符号量算出手段の算出結果として出力し、上記補正判定手段により(6−6)、上記第1の誤り訂正符号の量を補正しないと判定された場合には、上記第1の誤り訂正符号の量を、そのまま当該送信符号量算出手段の算出結果として出力する補正手段とを有することを特徴とする。
【0017】
第2の本発明の動画像符号化プログラムは、コンピュータを、(1)動画像を構成するフレーム列のそれぞれのフレームを、キーフレーム又は非キーフレームに分類するフレーム分類手段と、(2)上記フレーム列のうちキーフレームを符号化するキーフレーム符号化手段と、(3)符号化されたキーフレームを利用して、非キーフレームの予測画像を生成する予測画像生成手段と、(4)非キーフレームの原画像に対する予測画像の誤りやすさに応じて、その誤りを訂正する誤り訂正符号の量を求める送信符号量算出手段と、(5)上記送信符号量算出手段が求めた誤り訂正符号の量に応じた誤り訂正符号を、非キーフレームの符号化データとして生成する非キーフレーム符号化手段として機能させ、(6)上記送信符号量算出手段を、(6−1)所定の方法により上記原画像に対する上記予測画像の誤りを訂正する第1の誤り訂正符号の量を算出する誤り訂正符号量算出手段と、(6−2)上記誤り訂正符号量算出手段が算出する誤り訂正符号の量に対する補正量を算出する補正量算出手段と、(6−3)上記誤り訂正符号量算出手段とは異なる方法を用いて、上記原画像に対する上記予測画像の誤りを訂正する誤り訂正符号の量を算出する1又は複数の判定用誤り訂正符号量算出手段と、(6−4)上記判定用誤り訂正符号量算出手段の算出結果に応じて、上記第1の誤り訂正符号の量を補正するか否か判定する補正判定手段と、(6−5)上記補正判定手段により、上記第1の誤り訂正符号の量を補正すると判定された場合には、上記第1の誤り訂正符号の量について、上記補正量算出手段が算出した補正量を用いて補正した値を、当該送信符号量算出手段の算出結果として出力し、上記補正判定手段により、上記第1の誤り訂正符号の量を補正しないと判定された場合には、上記第1の誤り訂正符号の量を、そのまま当該送信符号量算出手段の算出結果として出力する補正手段として機能させることを特徴とする。
【0018】
第3の本発明は、受信装置と、配信用動画像データを上記受信装置に配信する動画像配信装置とを有する動画像配信システムにおいて、上記動画像配信装置は、フレーム列を有する動画像信号を符号化して配信用動画像データを生成する動画像符号化装置を有し、上記動画像符号化装置として、第1の本発明の動画像符号化装置を適用したことを特徴とする。
【発明の効果】
【0019】
本発明によれば、動画像の符号化について、符号化効率を向上させることができる。
【図面の簡単な説明】
【0020】
【図1】第1の実施形態に係る動画像符号化装置の機能的構成について示したブロック図である。
【図2】第1の実施形態に係る動画像配信システムの全体構成について示したブロック図である。
【図3】第1の実施形態に係る動画像符号化装置の動作について示したフローチャート(1)である。
【図4】第1の実施形態に係る動画像符号化装置の動作について示したフローチャート(2)である。
【図5】第1の実施形態に係る動画像符号化装置の動作について示したフローチャート(3)である。
【図6】第2の実施形態に係る動画像符号化装置の機能的構成について示したブロック図である。
【図7】第2の実施形態に係る動画像符号化装置の動作について示したフローチャート(1)である。
【図8】第2の実施形態に係る動画像符号化装置の動作について示したフローチャート(2)である。
【図9】第2の実施形態に係る動画像符号化装置の動作について示したフローチャート(3)である。
【図10】第2の実施形態に係る動画像符号化装置の動作について示したフローチャート(4)である。
【発明を実施するための形態】
【0021】
(A)第1の実施形態
以下、本発明による動画像符号化装置及びプログラム、並びに、動画像配信システムの第1の実施形態を、図面を参照しながら詳述する。
【0022】
(A−1)第1の実施形態の構成
図2は、この実施形態の動画像配信システム10の全体構成を示すブロック図である。
【0023】
なお、図2において括弧内の符号は、後述する第2の実施形態の説明において用いられるものである。
【0024】
動画像配信システム10は、動画像配信装置10及び動画像受信装置20を有している。動画像配信装置10は、動画像符号化装置100を有しており、動画像符号化装置100により入力された映像信号を符号化して動画像データを生成し、図示しない通信部により動画像受信装置20に向けて送出する。
【0025】
動画像符号化装置100に対して入力される映像信号は、この実施形態においては、フレーム単位の映像信号(例えば、CCDカメラから入力される映像信号等)の列(以下、「入力シーケンス」という)を適用するものとして説明する。その他にも、動画像符号化装置100に、ビデオカメラ等によるアナログ形式の映像信号を入力して、動画像符号化装置100がフレーム単位の画像データに変換するキャプチャを別途備えるようにしても良い。このように、動画像符号化装置100に対して入力される映像信号の形式は限定されないものである。
【0026】
図1は、動画像符号化装置100内部の機能的構成について示したブロック図である。
【0027】
動画像符号化装置100は、例えば、CPU、ROM、RAM、EEPROM、ハードディスクなどのプログラムの実行構成に、実施形態の動画像符号化プログラムをインストールすることにより構築するようにしても良いが、その場合でも、機能的には、図1のように表すことができる。また、動画像配信装置10は、例えば、ハードウェア的な通信部の他は、通信処理やデータ処理等を実行するためのCPU、ROM、RAM等を有しており、CPUが実行するプログラム(実施形態の動画像符号化プログラムを含む)をインストールすることにより構築しても良く、上述したプログラムを含め、動画像配信装置10の機能的構成を示すと図1に示すようになる。
【0028】
動画像受信装置20は、動画像復号装置200を有しており、動画像配信装置10から送信された動画像データを受信し、動画像復号装置200により、受信した符号化された動画像データを復号化して、動画像の信号を生成して所定の出力(例えば、ディスプレイへの出力や、復号化した動画像データの記憶媒体への書き込み等、出力方法限定されないものである)を行う。
【0029】
動画像受信装置20(動画像復号装置200)については、既存の動画像配信システムにおける受信装置(例えば、非特許文献2における復号化方式を適用したもの)と同様のものを適用することができるので、ここでは詳しい説明は省略する。
【0030】
次に、動画像符号化装置100の構成の詳細について説明する。
【0031】
動画像符号化装置100は、Wyner−Zivフレーム符号化部110及びキーフレーム符号化部160を有している。動画像符号化装置100では、映像信号として入力されるフレームを、Wyner−Zivフレーム(非キーフレーム)、キーフレームのいずれかに分類して符号化し、Wyner−ZivフレームはWyner−Zivフレーム符号化部110により符号化され、キーフレームはキーフレーム符号化部160に符号化されて、それぞれ動画像受信装置20に符号化した動画像データを送信する。
【0032】
Wyner−Zivフレームとキーフレームを分類する方法としては、例えば、フレームの順序に応じて決定するようにしても良い。動画像符号化装置100では、入力シーケンスの1番目のフレームをキーフレームとして分類し、2番目のフレームをWyner−Zivフレームに分類するといった動作を繰り返して、入力シーケンスのフレームを交互にキーフレーム又はWyner−Zivフレームのいずれかに分類するものとする。なお、動画像符号化装置100において、入力シーケンスのフレームを分類する順序は限定されるものではなく、例えば、連続して同一種類のフレーム(Wyner−Zivフレーム又はキーフレーム)として分類するようにしても良い。また、Wyner−Zivフレームとキーフレームを分類する方法は、既存のDVC方式を利用した動画像符号化装置と同様の方法を適用することができる。
【0033】
キーフレーム符号化部160は、入力シーケンスからキーフレームを得て、既存の符号化方式(例えば、非特許文献1などと同じくJPEGやMPEGのIフレームのようなフレーム内符号化)で符号化を行い、動画像受信装置20側へ符号化データを送信する。
【0034】
DVCのフレームワークにおいては、入力されたWyner−Zivフレームを符号化する際に画素領域で処理を行う方法や、DCTなどの変換を行い、変換係数領域で処理を行う方法がある。ここでは、動画像符号化装置100は、非特許文献1と同じく、変換を行い変換計数領域で処理を行う方法で説明を行う例について説明するが、他の方式を用いるようにしても良い。
【0035】
Wyner−Zivフレーム符号化部110は、量子化部120、Slepian−Wolf符号化部130、送信符号量推定部140及びSide Information生成部150を有している。
【0036】
量子化部120は、入力シーケンスからWyner−Zivフレームを得て、変換・量子化しビットプレーン単位へ分割して、Slepian−Wolf符号化部130及び送信符号量推定部140に与える。
【0037】
Side Information生成部150は、Wyner−Zivフレームの前、もしくは後ろ、もしくは前後のキーフレーム画像に基づいて、Wyner−Zivフレーム画像の予測画像を生成し、変換・量子化し、ビットプレーンへ分割する。
【0038】
送信符号量推定部140は、入力されたビットプレーンに対して、入力フレームである原画像とSide Information生成部150で生成される予測画像を利用して、予測誤りが訂正できる符号量の推定を行う。なお、送信符号量推定部140の詳細については後述する。
【0039】
Slepian−Wolf符号化部130は、量子化部120から入力された各ビットプレーンに対し、例えば、Turbo符号やLDPC符号等を用いて、Slepian−Wolf符号化を行い、送信符号量推定部140で計算された符号量に応じた誤り訂正符号を受信側に与える。
【0040】
次に、送信符号量推定部140の構成について説明する。
【0041】
送信符号量推定部140は、分布モデルエントロピー計算部141、補助情報計算部142、補正判定部143、補正部144を有している。なお、送信符号量推定部140の各部の処理については、後述する動作説明において詳述する。
【0042】
分布モデルエントロピー計算部141は、量子化部120で得られたWyner−Zivフレームの原画像のビットプレーンと、これに対応する予測画像の変換係数をSide Information生成部150から得て、分布モデルを利用してビットプレーン中の各ビットの誤り確率を推定したのちエントロピーを計算する。
【0043】
補助情報計算部142は、量子化部120で得られたWyner−Zivフレームの原画像のビットプレーンと、これに対応する予測画像のビットプレーンをSide Information生成部150から得て、補助情報を計算する。
【0044】
補正判定部143は、分布モデルエントロピー計算部141から得られるエントロピーと、原画像のビットプレーンと予測画像の対応するビットプレーンのビットを比較し、異なり(誤り)を計測することにより得られるエントロピーとを比較することで、補助情報が必要かどうかを判定する。
【0045】
補正部144は、補正判定部143の判定結果によって、分布モデルエントロピー計算部141の計算結果に補正を行い、補正後のものをSlepian−Wolf符号化部130に供給する。
【0046】
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の動画像配信システム1の動作、特に動画像符号化装置100の動作を中心に説明する。
【0047】
入力シーケンスはキーフレームとWyner−Zivフレームに分けられ、それぞれの符号化・復号が行われる。ここでは、入力シーケンスをキーフレームとWyner−Zivフレームを交互に符号化する例について説明を行う。
【0048】
動画像符号化装置100では、入力シーケンスの1フレーム目はキーフレームとして符号化が行われる。1フレーム目は、キーフレーム符号化部160において、非特許文献1などと同じくJPEGやMPEGのIフレームのようなフレーム内符号化がおこなわれ、受信側に与えられる。次に、2フレーム目はWyner−Zivフレームとして、Wyner−Zivフレーム符号化部110により符号化が行われる。ここでは、この2フレーム目のデータが、Wyner−Zivフレーム符号化部110により符号化される場合を例として、Wyner−Zivフレーム符号化部110の動作について説明する。
【0049】
図3〜5は、Wyner−Zivフレーム符号化部110の動作について示したフローチャートである。
【0050】
まず、入力シーケンスから2フレーム目の原画像データが量子化部120に取り込まれたものとする(S301)。
【0051】
次に、量子化部120により、ステップS301で取り込まれた2フレーム目の原画像が変換係数領域に変換(DCT)され、帯域ごとに量子化される(S302)。なお、ステップS302では、各帯域の量子化された変換係数を2値化し、ビットプレーンヘ分割する。帯域毎にビットプレーン化する際に、1フレーム全体の長さでビットプレーンヘ分割してもよいし、画面内の領域ごと、といった形でグループ化した長さで区切り、ビットプレーンヘ分割してもよい。
【0052】
そして、キーフレーム符号化部160から前または後、または両方のキーフレーム画像がSide Information生成部150に入力される(S303)。
【0053】
次に、Side Information生成部150において2フレーム目(Wyner−Zivフレーム)の予測画像が生成される(S304)。ステップS304における予測画像の生成には、前のキーフレームを利用する方法や、前後のキーフレーム画像の平均を取るなどの方法や、範囲の絞った動き探索などの方法を適用することができる。
【0054】
次に、Side Information生成部150において生成した予測画像に対して、変換・量子化が行われ、ビットプレーンに分割される(S305)。ステップS305では、このときのビットプレーンの長さは量子化部120と同様の分割方法で行われる。
【0055】
そして、量子化部120から1フレーム分の原画像の変換係数が分布モデルエントロピー計算郡105へ入力される(S306)。なお、以降のステップの処理により、分布モデルエントロピー計算部141では、原画像と予測画像の変換係数の差分の分布はラプラス分布で近似できるという性質を用いて、原画像と予測画像の間の予測誤りの推定が行われ、エントロピーが計算される。
【0056】
次に、Side Information生成部150から1フレーム分の予測画像の変換係数が分布モデルエントロピー計算部141へ入力される(S307)。
【0057】
次に、分布モデルエントロピー計算部141にて、帯域ごとにラプラス分布の分布パラメータαが計算される(S308)。ラプラス分布の分布パラメータαと分散σには以下の(1)式の関係がある。ここでは、平均(差分)が0である分布を仮定し、原画像の係数値をX、予測画像の係数値を、ビットプレーンの長さをNとすると、分散σは以下の(2)式のように計算できる。
【数1】

【0058】
次に、量子化部120から原画像のビットプレーンが分布モデルエントロピー計算部141へ入力される(S309)。
【0059】
次に、Side Information生成部150から予測画像のビットプレーンが分布モデルエントロピー計算部141へ入力される(S310)。
【0060】
次に、分布モデルエントロピー計算部141にて、分布モデルを用いた誤り確率の計算が行われる(S311)。
【0061】
ステップS311では、原画像のある係数値の確率変数をX、予測画像の係数の確率変数をYとすると、予測画像の係数値の分布は、分布モデルエントロピー計算部141において、以下の(3)式のように表すことができる。ここで、入力されたビットプレーンのうちのある1ビット(nビット日)に注目し、予測画像と原画像とで異なり(誤り)が生じる確率が計算される。この確率をもとに、エントロピーが計算される。
【0062】
入力されたビットプレーンが上位からjビットプレーン目であるとする。ここで、原画像の係数値の存在する範囲は、原画像のビットの上位j−1ビットプレーンを参照することによって決まり、この範囲において、jビットプレーンの予測画像のビットに対し、原画像のビットが1である確率Pが以下の(4)式により求められる。
【0063】
次のステップでPのエントロピーの計算が行われると、P、1−Pに対して対称な計算となるため、得られたエントロピーは誤りを訂正するのに必要な情報量を計算したことになると考えられる。そのため、このPを求める計算は誤り確率を計算することと捉えることができる。
【数2】

【0064】
次に、分布モデルエントロピー計算部141により、エントロピーが計算される(S312)。ここでは、分布モデルエントロピー計算部141により、以下の(5)式によりPのエントロピーH(P)が求められる。
【0065】
H(P)=−Plog(P)−(1−P)log(1−P)…(5)
分布モデルエントロピー計算部141では、上記の(5)式により、エントロピーを求めることで、このビット(jビットプレーンのnビット目)が誤っていた場合、訂正に必要な情報量が得られる。これをjビットプレーン内の全てのビットに対して計算し、その結果を平均することで、jビットプレーン全体に対して、誤りを訂正するのに必要な条件付きエントロピーHX|Yが、以下の(6)式により求められる。そして、ステップS312で求められたエントロピーを、以下では「分布モデルエントロピー」と呼ぶものとする。
【0066】
次に、分布モデルエントロピー計算部141により、計算した分布モデルエントロピーが補正部144へ入力される(S313)。
【数3】

【0067】
分布モデルエントロピー計算部141で計算した分布モデルエントロピーでは、復号に必要な符号量が得られなかった場合があるため、補正を行うことが必要となる。そこで補正に必要な補助情報の計算が、以降のステップにより行われる。ここでは、補助情報の一例として非特許文献2に示されるrelative error entropyを例として用いる。
【0068】
まず、量子化部120から原画像のビットプレーンが補助情報計算部142へ入力される(S314)。
【0069】
そして、Side Information生成部150から予測画像のビットプレーンが補助情報計算部142へ入力される(S315)。
【0070】
次に、補助情報計算部142で原画像と予測画像のビットプレーンが比較され、relative error probabilityが計算される(S316)。relative error probabilityは、原画像と予測画像のビットプレーンを比較し、異なり(誤り)のあるビットのうち、上位ビットプレーンでは誤りが起こらなかったビット数をビットプレーン長で割ることによって計算できる。
【0071】
次に、補助情報計算部142により得られた補助情報が、補正部144へ入力される(S317)。
【0072】
分布モデルエントロピー計算部で得られた分布モデルエントロピーから得られた符号量で復号可能な場合は、補助情報を加算したとしても、訂正できる予測誤りは変わらない。つまり、加算した補助情報の分の符号量が冗長となるため、分布モデルから得られたエントロピーで復号可能かどうかが、以降のステップにおいて、補正判定部143により判定される。ここでは、判定方法の例として、分布モデルエントロピーとビット誤りによるエントロピーとの比較を行う方法を挙げる。
【0073】
まず、分布モデルエントロピー計算部141から分布モデルエントロピーHX|Yが補正判定部143へ入力される(S318)。
【0074】
次に、量子化部120から補正判定部143へ原画像のビットプレーンが入力される(S319)。
【0075】
次に、SideInformation生成部150から補正判定部143へ予測画像のビットプレーンが入力される(S320)。
【0076】
次に、補正判定部143において、原画像と予測画像が比較され、誤り数eを得て、これを元にエントロピーが計算される。得られたeをビットプレーン長Nで割ることで、ビット誤り率errが得られる(err=e/N)(S321)。ここで得られたビット誤り率からエントロピーH(err)が、以下の(7)式により計算される。ここでは、このエントロピーを「ビット誤りエントロピー」と呼ぶものとする。
【0077】
H(err)=−errlog(err)−(1−err)log(1−err)…(7)
次に、補正判定部143において、ピット誤りエントロピーH(err)と分布モデルエントロピーを比較することにより、分布モデルエントロピーで得られた符号量で復号可能かが判定される(S322)。
【0078】
分布モデルエントロピーは、分布による近似から得られた誤りを訂正するのに必要な量、つまり、モデルから得られる平均的な誤りを訂正するのに必要な情報量と考えられる。一方で、ビット誤りエントロピーは実際の原画像とエンコーダで生成した予測画像から得られた誤り量を復号するのに必要な情報量であると考えられる。ビット誤りエントロピーのほうが分布モデルエントロピーよりも大きい値を示す場合は、分布の想定する平均的な誤り量よりも、実際に生じた誤りが大きいと考えることができる。この場合、分布モデルエントロピーから得られる符号量では誤りが訂正できないと考えられる。
【0079】
次に、補正判定部143の判定結果が補正部144へ入力される(S323)。
【0080】
次に、補正部144において、補正判定部143から入力された判定結果が確認され(S324)、判定結果が、分布モデルエントロピーで得られた符号量で復号可能という結果であった場合には、後述するステップS325の処理が行われ、そうでない場合には、後述するステップS326の処理が行われる。
【0081】
補正部144において、上述のステップS324での補正判定部143の判定結果が、分布モデルエントロピー計算部141の計算結果で復号できるだけの符号量が得られていると判定された場合は、分布モデルエントロピー計算部141で計算した符号量が送信符号量の計算結果となる(S325)。
【0082】
一方、上述のステップS324での補助情報計算部142の判定結果が、分布モデルエントロピー計算部141の計算結果では復号できるだけの符号量が得られなかったと判定された場合は、補正部144において分布モデルエントロピーと補助情報が加算され、補正を行ったものを送信符号量の計算結果となる(S326)。
【0083】
次に、補正部144により、計算した送信符号量がSlepian−Wolf符号化部110へ入力される(S327)。
【0084】
次に、量子化部120から符号化を行うビットプレーンがSlepian−Wolf符号化部110へ入力される(S328)。
【0085】
次に、Slepian−Wolf符号化部110において、入力されたビットプレーンがSlepian−Wolf符号化される(S329)。
【0086】
次に、Slepian−Wolf符号化部110により、Slepian−Wolf符号化されたビットプレーンが送信符号量推定部140で得られた符号量に応じた符号が、受信側へ送信される(S330)。
【0087】
次に、Wyner−Zivフレーム符号化部110では、1フレームの全てのビットプレーンを処理したか否かが判定され(S331)、全てのビットプレーンの処理が完了した場合には当該フレームに係る処理を終了し、そうでない場合には、上述のステップS309の処理に戻って動作する。
【0088】
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
【0089】
送信符号量推定部140では、分布モデルエントロピー計算部141の計算結果について、常に補正を行うわけではなく、補正判定部143において他の計算方法による計算結果(上述の例では、ビット誤りエントロピー)と比較することにより、補正を行うか否かを判定した上で、補正を行っている。すなわち、分布モデルから推定されるエントロピーをもとにした符号量に、補助情報が必要な場合のみ加算するような補正を行うため、効率的な符号量を推定することができる。
【0090】
(B)第2の実施形態
以下、本発明による動画像符号化装置及びプログラム、並びに、動画像配信システムの第2の実施形態を、図面を参照しながら詳述する。
【0091】
(B−1)第2の実施形態の構成
第2の実施形態の動画像配信システム1Aの全体構成も図1を用いて説明することができる。
【0092】
第2の実施形態の動画像配信システム1Aは、動画像配信装置10A及び動画像受信装置20を有している。動画像受信装置20は、第1の実施形態と同様のものであるので詳しい説明を省略する。また、動画像配信装置10Aは、動画像符号化装置100Aを有している。
【0093】
図6は、動画像符号化装置100A内部の機能的構成について示した説明図である。
【0094】
動画像符号化装置100Aでは、第1の実施形態のWyner−Zivフレーム符号化部110がWyner−Zivフレーム符号化部110Aに置き換わっただけであるので、その他の構成については、第1の実施形態と同様であり、詳しい説明を省略する。そして、Wyner−Zivフレーム符号化部110Aでは、第1の実施形態の送信符号量推定部140が、送信符号量推定部140Aに置き換わっただけであるので、その他の構成については、第1の実施形態と同様であり、詳しい説明は省略する。
【0095】
送信符号量推定部140Aでは、第1の実施形態の補助情報計算部142が、補助情報計算部142Aに置き換わっただけであるので、その他の構成については、第1の実施形態と同様であり、詳しい説明は省略する。
【0096】
補助情報計算部142Aは、補正判定部143において、補助情報が必要と判定された場合にのみ、補助情報の計算を行う点で、第1の実施形態と異なっている。補助情報計算部142Aが行う処理の詳細については、後述する動作説明において詳述する。
【0097】
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の動画像配信システム1Aの動作、特に動画像符号化装置100Aの動作を中心に説明する。
【0098】
第1の実施形態と同様に、入力シーケンスはキーフレームとWyner−Zivフレームに分けられ、それぞれの符号化・復号が行われ、入力シーケンスをキーフレームとWyner−Zivフレームを交互に符号化する例について説明を行う。そして、動画像符号化装置100Aでは、第1の実施形態と同様に、入力シーケンスの1フレーム目はキーフレームとして符号化が行われ、2フレーム目はWyner−Zivフレームとして、Wyner−Zivフレーム符号化部110Aにより符号化が行われる。ここでは、この2フレーム目のデータが、Wyner−Zivフレーム符号化部110Aにより符号化される場合を例として、Wyner−Zivフレーム符号化部110Aの動作について説明する。
【0099】
図7〜10は、Wyner−Zivフレーム符号化部110Aの動作について示したフローチャートである。
【0100】
まず、量子化部120で入力シーケンスが変換・量子化されたのちビットプレーンへ分割され、Side Information生成部150で予測画像が生成され、分布モデルエントロピー計算部141で分布モデルエントロピーが計算される(S501〜S513)が、ステップS501〜S513の動作は、第1の実施例の動作におけるステップS301〜ステップS313と同様であるため、詳しい説明を省略する。
【0101】
そして、以降のステップの処理により、分布モデルから得られたエントロピーで復号可能かどうかが補正判定部143で判定される。判定方法の例として、第1の実施形態と同様に、分布モデルエントロピーとビット誤りによるエントロピーとの比較が行われるものとして説明する。
【0102】
まず、分布モデルエントロピー計算部141から分布モデルエントロピーが、補正判定部143へ入力される(S514)。
【0103】
そして、量子化部120から補正判定部143へ原画像のビットプレーンが入力される(S515)。
【0104】
次に、Side Information生成部150から補正判定部143へ予測画像のビットプレーンが入力される(S516)。
【0105】
次に、補正判定部143で、原画像と予測画像のビットプレーンが比較され、ビットの異なり数が計測され、これを元にビット誤りエントロピーが計算される(S517)。
【0106】
次に、補正判定部143で、ビット誤りエントロピーと分布モデルエントロピーを比較することにより、分布モデルエントロピーで得られた符号量で復号可能かが判定される(S518)。
【0107】
次に、補正判定部143の判定結果が補正部144へ入力される(S519)。
【0108】
次に、補正部144において、補正判定部143から入力された判定結果が確認され(S520)、判定結果が、分布モデルエントロピーで得られた符号量で復号できないという結果であった場合には、後述するステップS521の処理から動作し、そうでない場合には、後述するステップS527の処理から動作する。
【0109】
なお、以降のステップにおいて、補助情報計算部142Aによる、補助情報の計算としては、第1の実施形態と同じく、非特許文献2で示されるrelative error entropyの計算が行われるものとして説明する。
【0110】
上述のステップS520において、補正部144に入力された判定結果が、補助情報が必要である、という判定結果であった場合には、その判定結果が、補助情報計算部142Aへ入力される(S521)。
【0111】
次に、原画像のビットプレーンが補助情報計算部142Aへ入力される(S522)。
【0112】
次に、予測画像のビットプレーンが補助情報計算部142Aへ入力される(S523)。
【0113】
次に、補助情報計算部142Aで原画像と予測画像のビットプレーンが比較され、relative error probabilityが計算される(S524)。
【0114】
次に、補助情報計算部142Aにより、得られた補助情報が補正部144へ入力される(S525)。
【0115】
次に、補正部144において分布モデルエントロピーと補助情報を用いて補正が行われる(S526)。ここでは、補正方法の例として、分布モデルエントロピーに補助情報を加算するものとして説明する。また、補正結果を、送信符号量推定部140Aによる送信符号量の計算結果となる。
【0116】
一方、上述のステップS520において、補正部144に入力された判定結果が、分布モデルエントロピー計算部141の計算結果では復号できるだけの符号量が得られたという結果であった場合は、補正部144において分布モデルエントロピーが、送信符号量推定部140Aによる送信符号量の推定結果となる(S527)。
【0117】
次に、送信符号量推定部140Aによる送信符号量の計算結果がSlepian−Wolf符号化部130へ入力される(S528)。
【0118】
次に、量子化部120から符号化を行うビットプレーンがSlepian−Wolf符号化部130へ入力される(S529)。
【0119】
次に、Slepian−Wolf符号化部130において、入力されたビットプレーンがSlepian−Wolf符号化される(S530)。
【0120】
次に、Slepian−Wolf符号化部130により、Slepian−Wolf符号化されたビットプレーンを、送信符号量推定部140Aで得られた符号量に応じた符号量が受信側へ送信される(S531)。
【0121】
次に、Wyner−Zivフレーム符号化部110Aでは、1フレームの全てのビットプレーンを処理したか否かが判定され(S532)、全てのビットプレーンの処理が完了した場合には当該フレームに係る処理を終了し、そうでない場合には、上述のステップS509の処理に戻って動作する。
【0122】
(B−3)第2の実施形態の効果
第2の実施形態によれば、以下のような効果を奏することができる。
【0123】
補助情報計算部142Aでは、補正判定部143において補助情報が必要と判定された場合にのみ補助情報の計算を行うため、符号化に係る処理量を低減させることができる。
【0124】
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
【0125】
(C−1)なお、図2においては、動画像符号化装置は、動画像配信装置の一部を構成するものとして図示しているが、動画像符号化装置を、単体の装置として構築し、単に入力シーケンスから符号化データを生成して出力(ディスク装置や記憶媒体等に記憶させたり、他の装置に出力したり等、方法は限定されないものである)する装置として構築するようにしても良い。
【0126】
(C−2)上記の実施形態において、送信符号量推定部では、分布モデルエントロピーを用いて計算した送信符号量と、他の方法(ビット誤りエントロピー)を用いて計算した送信符号量との比較結果に基づいて、分布モデルエントロピーを用いて計算した送信符号量を補正するか否か判定し、補正必要な場合は補正を行っている。ここで、送信符号量推定部において、分布モデルエントロピーと比較する他の方法を用いて計算した送信符号量は、ビット誤りエントロピーを用いて計算したものに限定されず、他の計算方法により計算した送信符号量に置き換えるようにしても良い。また、送信符号量推定部において、それぞれ異なる複数の計算方法により計算された送信符号量を求め、それらの送信符号量と、分布モデルエントロピーを用いて計算した送信符号量とを比較して、分布モデルエントロピーを用いて計算した送信符号量を補正するか否か判定するようにしても良い。例えば、他の方法を用いて計算した送信符号量のうち、一つでも、分布モデルエントロピーを用いて計算した送信符号量よりも大きい場合に補正を行うと判定するようにしても良い。
【0127】
また、送信符号量推定部において、分布モデルエントロピーとビット誤りエントロピーの適用を置き換えて、ビット誤りエントロピーを用いて計算した送信符号量について、他の方法(分布モデルエントロピー)を用いて計算した送信符号量との比較結果に基づいて補正するか否かを判定し、補正必要な場合は補正を行うようにしても良い。
【符号の説明】
【0128】
1…動画像配信システム、10…動画像配信装置100…動画像符号化装置、20…動画像受信装置、200…動画像復号化装置、100…動画像符号化装置、110…Wyner−Zivフレーム符号化部、120…量子化部、130…Slepian−Wolf符号化部、140…送信符号量推定部、141…分布モデルエントロピー計算部、142…補助情報計算部、143…補正判定部、144…補正部。

【特許請求の範囲】
【請求項1】
フレーム列を有する動画像信号を符号化する動画像符号化装置において、
上記フレーム列のそれぞれのフレームをキーフレーム又は非キーフレームに分類するフレーム分類手段と、
上記フレーム列のうちキーフレームを符号化するキーフレーム符号化手段と、
符号化されたキーフレームを利用して、非キーフレームの予測画像を生成する予測画像生成手段と、
非キーフレームの原画像に対する予測画像の誤りやすさに応じて、その誤りを訂正する誤り訂正符号の量を求める送信符号量算出手段と、
上記送信符号量算出手段が求めた誤り訂正符号の量に応じた誤り訂正符号を、非キーフレームの符号化データとして生成する非キーフレーム符号化手段とを備え、
上記送信符号量算出手段は、
所定の方法により上記原画像に対する上記予測画像の誤りを訂正する第1の誤り訂正符号の量を算出する誤り訂正符号量算出手段と、
上記誤り訂正符号量算出手段が算出する誤り訂正符号の量に対する補正量を算出する補正量算出手段と、
上記誤り訂正符号量算出手段とは異なる方法を用いて、上記原画像に対する上記予測画像の誤りを訂正する誤り訂正符号の量を算出する1又は複数の判定用誤り訂正符号量算出手段と、
上記判定用誤り訂正符号量算出手段の算出結果に応じて、上記第1の誤り訂正符号の量を補正するか否か判定する補正判定手段と、
上記補正判定手段により、上記第1の誤り訂正符号の量を補正すると判定された場合には、上記第1の誤り訂正符号の量について、上記補正量算出手段が算出した補正量を用いて補正した値を、当該送信符号量算出手段の算出結果として出力し、上記補正判定手段により、上記第1の誤り訂正符号の量を補正しないと判定された場合には、上記第1の誤り訂正符号の量を、そのまま当該送信符号量算出手段の算出結果として出力する補正手段とを有する
ことを特徴とする動画像符号化装置。
【請求項2】
上記補正量算出手段は、上記補正判定手段により、上記第1の誤り訂正符号の量を補正すると判定された場合にのみ、補正量を算出することを特徴とする請求項1に記載の動画像符号化装置。
【請求項3】
上記誤り訂正符号量算出手段は、分布モデルエントロピー、又は、ビット誤りエントロピーを用いて、上記第1の誤り訂正符号の量を算出することを特徴とする請求項1又は2に記載の動画像符号化装置。
【請求項4】
上記判定用誤り訂正符号量算出手段のうち、一つは、上記原画像と上記予測画像の関係を近似したモデルを用いて、上記原画像に対する上記予測画像の誤り率に係るエントロピーを計算し、計算したエントロピーを用いて、上記原画像に対する上記予測画像の誤りを訂正する誤り訂正符号の量を算出することを特徴とする請求項1〜3のいずれかに記載の動画像符号化装置。
【請求項5】
上記判定用誤り訂正符号量算出手段のうち、一つは、原画像と予測画像とを比較し、その差異から、記原画像に対する上記予測画像の誤り率に係るエントロピーを計算し、計算したエントロピーを用いて、上記原画像に対する上記予測画像の誤りを訂正する誤り訂正符号の量を算出することを特徴とする請求項1〜4のいずれかに記載の動画像符号化装置。
【請求項6】
コンピュータを、
動画像を構成するフレーム列のそれぞれのフレームを、キーフレーム又は非キーフレームに分類するフレーム分類手段と、
上記フレーム列のうちキーフレームを符号化するキーフレーム符号化手段と、
符号化されたキーフレームを利用して、非キーフレームの予測画像を生成する予測画像生成手段と、
非キーフレームの原画像に対する予測画像の誤りやすさに応じて、その誤りを訂正する誤り訂正符号の量を求める送信符号量算出手段と、
上記送信符号量算出手段が求めた誤り訂正符号の量に応じた誤り訂正符号を、非キーフレームの符号化データとして生成する非キーフレーム符号化手段として機能させ、
上記送信符号量算出手段を、
所定の方法により上記原画像に対する上記予測画像の誤りを訂正する第1の誤り訂正符号の量を算出する誤り訂正符号量算出手段と、
上記誤り訂正符号量算出手段が算出する誤り訂正符号の量に対する補正量を算出する補正量算出手段と、
上記誤り訂正符号量算出手段とは異なる方法を用いて、上記原画像に対する上記予測画像の誤りを訂正する誤り訂正符号の量を算出する1又は複数の判定用誤り訂正符号量算出手段と、
上記判定用誤り訂正符号量算出手段の算出結果に応じて、上記第1の誤り訂正符号の量を補正するか否か判定する補正判定手段と、
上記補正判定手段により、上記第1の誤り訂正符号の量を補正すると判定された場合には、上記第1の誤り訂正符号の量について、上記補正量算出手段が算出した補正量を用いて補正した値を、当該送信符号量算出手段の算出結果として出力し、上記補正判定手段により、上記第1の誤り訂正符号の量を補正しないと判定された場合には、上記第1の誤り訂正符号の量を、そのまま当該送信符号量算出手段の算出結果として出力する補正手段として機能させる
ことを特徴とする動画像符号化プログラム。
【請求項7】
受信装置と、配信用動画像データを上記受信装置に配信する動画像配信装置とを有する動画像配信システムにおいて、
上記動画像配信装置は、フレーム列を有する動画像信号を符号化して配信用動画像データを生成する動画像符号化装置を有し、
上記動画像符号化装置として、請求項1〜5のいずれかに記載の動画像符号化装置を適用したことを特徴とする動画像配信システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2011−77881(P2011−77881A)
【公開日】平成23年4月14日(2011.4.14)
【国際特許分類】
【出願番号】特願2009−227919(P2009−227919)
【出願日】平成21年9月30日(2009.9.30)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】