説明

画像処理装置及びプログラム

【課題】ケプストラム解析結果のみを用いて、画像符号化に関する特徴を解析することができる。
【解決手段】画像処理装置は、復号画像に対し、所定サイズの領域毎にケプストラム解析を行う解析部と、解析部により解析された解析結果のピーク値の大きさに基づいて、ブロック歪の強度を決定するブロック歪強度決定部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、復号画像にケプストラム解析を行う画像処理装置及びプログラムに関する。
【背景技術】
【0002】
従来、復号画像に対してケプストラム解析を行い、ブロック歪を有する画像の評価を行う技術があった。
【0003】
例えば、先頭輝度値を変更し、ケプストラムピークを強調することで、高ビットレートでのブロック歪を検出することができる方法がある(非特許文献1)。また、ケプストラム解析結果を用いる技術として、画像ブロック境界を検出し、再符号化に用いる技術がある(特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平10−32829号公報
【非特許文献】
【0005】
【非特許文献1】小松俊介他,「ブロック歪を有する画像信号のケプストラム分析」,電子情報通信学会技術報告,IT94,p.21−24,1994年
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来技術では、ブロック歪位相を測定するためにケプストラム解析を行っている。ただし、従来技術は、画像内を詳細に解析するものではないため、ブロック歪の強度を測定することはできない。また、ピクチャタイプの判定やGOP構造の判定には、別途符号化器が必要になり、処理が煩雑になってしまうという問題点があった。
【0007】
そこで、本発明は、上記課題に鑑みてなされたものであり、ケプストラム解析結果のみを用いて、画像符号化に関する特徴を解析することができる画像処理装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の一態様における画像処理装置は、復号画像に対し、所定サイズの領域毎にケプストラム解析を行う解析部と、前記解析部により解析された解析結果のピーク値の大きさに基づいて、ブロック歪の強度を決定するブロック歪強度決定部と、を備える。
【0009】
また、画像処理装置は、前記解析結果のピーク幅の頻度に基づいて、前記領域がイントラタイプかインタータイプかを判定するタイプ判定部をさらに備えてもよい。
【0010】
また、画像処理装置は、前記タイプ判定部によりイントラタイプと判定された領域を含む第1フレームを検出し、前記第1フレームの間隔のうち、最も多い頻度の間隔をGOPのフレーム数と決定するGOP構造決定部をさらに備えてもよい。
【0011】
また、前記GOP構造決定部は、前記ピーク値の大きさの平均値をフレーム毎に求め、前記平均値の時間方向の変化と前記GOPのフレーム数とに基づいて、イントラフレームを決定してもよい。
【0012】
また、画像処理装置は、前記GOP構造決定部により決定されたGOPの構造と、前記ブロック歪強度決定部により決定された各フレームのブロック歪の強度の平均値又は中央値とを用いて、前記各フレームに含まれる領域毎のブロック歪の強度を修正するブロック歪強度修正部とをさらに備えてもよい。
【0013】
また、前記ブロック歪強度修正部は、1つのGOP内において、各フレーム内に含まれる領域毎のブロック歪の強度の平均値又は中央値を算出する第1算出部と、前記第1算出部により算出された平均値又は中央値の最大値と最小値との差分を算出する第2算出部と、前記第2算出部により算出された差分を、GOP内のフレームの位置に応じて重み付けし、重み付けされた差分を、該フレームの領域毎のブロック歪の強度に加算する加算部とを備えてもよい。
【0014】
また前記解析部は、前記所定サイズを、前記解析結果のピーク値の幅が均一になるまで前記復号画像のサイズから徐々に小さくしてもよい。
【0015】
また、画像処理装置は、前記ブロック歪の強度に応じて修正したフィルタオフセット値を用いてデブロッキングフィルタ処理を行うデブロッキングフィルタ部をさらに備えてもよい。
【0016】
また、本発明の他の態様におけるプログラムは、復号画像に対し、所定サイズの領域毎にケプストラム解析を行う解析ステップと、前記解析ステップで解析された解析結果のピーク値の大きさに基づいて、ブロック歪の強度を決定するブロック歪強度決定ステップとをコンピュータに実行させる。
【発明の効果】
【0017】
本発明によれば、ケプストラム解析結果のみを用いて、画像符号化に関する特徴を解析することができる。
【図面の簡単な説明】
【0018】
【図1】実施例1における画像符号化装置の概略構成の一例を示すブロック図。
【図2】情報解析部の構成の一例を示すブロック図。
【図3】ケプストラム解析結果(その1)の一例を示す図。
【図4】ケプストラム解析結果(その2)の一例を示す図。
【図5】所定サイズの変化の一例を示す図。
【図6】タイプ判定部の構成の一例を示すブロック図。
【図7】画像内のタイプの一例を示す図。
【図8】GOP構造決定部の構成の一例を示すブロック図。
【図9】GOP構造の決定を説明するための図。
【図10】ブロック歪強度修正部の構成の一例を示すブロック図。
【図11】実施例1における情報解析処理の一例を示すフローチャート。
【図12】実施例2における画像符号化装置の構成の一例を示すブロック図。
【発明を実施するための形態】
【0019】
以下、添付図面を参照しながら各実施例について詳細に説明する。なお、各実施例で説明するケプストラム解析結果から求められた各情報は、様々な用途で用いることができるが、以下では、デブロッキングフィルタに用いる例について説明する。
【0020】
[実施例1]
<構成>
図1は、実施例1における画像符号化装置100の概略構成の一例を示すブロック図である。図2に示す例では、画像符号化装置100は、予測誤差信号生成部101、直交変換部102、量子化部103、エントロピー符号化部104、逆量子化部105、逆直交変換部106、復号画像生成部107、デブロッキングフィルタ部108、復号画像記憶部109、イントラ予測部110、インター予測部111、動きベクトル計算部112、符号化制御及びヘッダ生成部113、予測画像選択部114、及び情報解析部115を有する。各部についての概略を以下に説明する。
【0021】
予測誤差信号生成部101は、入力された動画像データの符号化対象画像が、例えば16×16画素のブロックに分割されたブロックデータを取得する。
【0022】
予測誤差信号生成部101は、そのブロックデータと、予測画像選択部114から出力される予測画像のブロックデータとにより、予測誤差信号を生成する。予測誤差信号生成部101は、生成された予測誤差信号を直交変換部102に出力する。
【0023】
直交変換部102は、入力された予測誤差信号を直交変換処理する。直交変換部102は、直交変換処理によって水平及び垂直方向の周波数成分に分離された信号を量子化部103に出力する。
【0024】
量子化部103は、直交変換部102からの出力信号を量子化する。量子化部103は、量子化することによって出力信号の符号量を低減し、この出力信号をエントロピー符号化部104及び逆量子化部105に出力する。
【0025】
エントロピー符号化部104は、量子化部103からの出力信号や動きベクトル計算部112から取得する動きベクトル情報をエントロピー符号化して出力する。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
【0026】
逆量子化部105は、量子化部103からの出力信号を逆量子化してから逆直交変換部106に出力する。逆直交変換部106は、逆量子化部105からの出力信号を逆直交変換処理してから復号画像生成部107に出力する。これら逆量子化部105及び逆直交変換部106によって復号処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
【0027】
復号画像生成部107は、インター予測部111で動き補償された画像のブロックデータと、逆量子化部105及び逆直交変換部106により復号処理された予測誤差信号とを加算する。復号画像生成部107は、加算して生成した復号画像のブロックデータを、情報解析部115及びデブロッキングフィルタ部108に出力する。
【0028】
情報解析部115は、復号画像に対して、所定サイズの領域毎にケプストラム解析を行い、ケプストラム解析結果から各種の情報を検出する。各種の情報は、例えばブロック歪の強度を含む。情報解析部115は、例えば、ブロック歪の強度をデブロッキングフィルタ部108に出力する。情報解析部115の詳細は、図2を用いて後述する。
【0029】
デブロッキングフィルタ部108は、復号画像生成部107から出力された復号画像に対し、ブロック歪を低減するためのフィルタをかけ、復号画像記憶部109に出力する。このとき、デブロッキングフィルタ部108は、情報解析部115から取得したブロック歪の強度を用いてフィルタ強度を変更する。
【0030】
復号画像記憶部109は、入力した復号画像のブロックデータを新たな参照画像のデータとして記憶し、イントラ予測部110、インター予測部111及び動きベクトル計算部112に出力する。
【0031】
イントラ予測部110は、符号化対象画像の処理対象ブロックに対して、すでに符号化された参照画素から予測画像を生成する。
【0032】
インター予測部111は、復号画像記憶部109から取得した参照画像のデータを動きベクトル計算部112から提供される動きベクトルで動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。
【0033】
動きベクトル計算部112は、符号化対象画像におけるブロックデータと、復号画像記憶部109から取得する参照画像とを用いて、動きベクトルを求める。動きベクトルとは、ブロック単位で参照画像内から処理対象ブロックに最も類似している位置を探索するブロックマッチング技術を用いて求められるブロック単位の空間的なずれを示す値である。動きベクトル計算部112は、求めた動きベクトルをインター予測部111に出力し、動きベクトルや参照画像の位置の情報を含む動きベクトル情報をエントロピー符号化部104に出力する。
【0034】
イントラ予測部110とインター予測部111から出力されたブロックデータは、予測画像選択部114に入力される。
【0035】
予測画像選択部114は、イントラ予測部110とインター予測部111から取得したブロックデータのうち、どちらか一方のブロックデータを予測画像として選択する。選択された予測画像は、予測誤差信号生成部101に出力される。
【0036】
また、符号化制御及びヘッダ生成部113について、符号化の全体制御とヘッダ生成を行う。符号化制御及びヘッダ生成部113は、イントラ予測部110に対して、スライス分割有無の通知、デブロッキングフィルタ部108に対して、デブロッキングフィルタ有無の通知、動きベクトル計算部112に対して参照画像の制限通知などを行う。
【0037】
符号化制御及びヘッダ生成部113は、その制御結果を用いて、例えばH.264/AVCのヘッダ情報を生成する。生成されたヘッダ情報は、エントロピー符号化部104に出力され、画像データ、動きベクトルデータとともにストリームとして出力される。
【0038】
<情報解析部の構成>
次に、情報解析部115の構成について説明する。図2は、情報解析部115の構成の一例を示すブロック図である。図2に示す情報解析部115は、解析部201、ブロック歪強度決定部202、タイプ判定部203、GOP構造決定部204、及びブロック歪強度修正部205を有する。
【0039】
解析部201は、復号画像生成部107から復号画像を順に取得し、復号画像の所定サイズの領域毎にケプストラム解析を行う。所定サイズは例えば、マクロブロックを含むサイズの64×64などである。また、解析部201は、所定の条件を満たすまで、所定サイズを画像サイズから順に小さくするようにしてもよい。これは、図5を用いて後述する。
【0040】
解析部201は、領域毎に、水平・垂直方向毎に1次元でケプストラム解析を行う。例えば、解析部201は、水平方向のケプストラム解析を行う場合、領域内の各行についてケプストラム解析を行い、各行の解析結果の平均を計算する。これにより、解析部201は、この領域の水平方向のケプストラム解析結果を得る。垂直方向も同様に行われる。
【0041】
水平・垂直方向のケプストラム解析は、公知の技術、例えば非特許文献1に記載されている技術を用いればよい。また、解析部201は、水平・垂直方向毎の解析結果の二乗平均から和の平方根をとり、総合ケプストラムを算出してもよい。
【0042】
図3は、ケプストラム解析結果(その1)の一例を示す図である。図3は、例えば、イントラブロックを含む領域に対して、水平方向にケプストラム解析を行った結果を示す。イントラブロックとは、例えば、画面内予測が行われるマクロブロックを言う。
【0043】
図3に示すように、イントラブロックを含む領域では、解析結果のピークの幅は、ほぼ均一になる。イントラブロックでは、動き補償がないため、ブロック境界の規則性が保たれるからである。
【0044】
図4は、ケプストラム解析結果(その2)の一例を示す図である。図4は、例えば、イントラブロックと、インターブロックを含む領域に対して、水平方向にケプストラム解析を行った結果を示す。インターブロックとは、例えば、画面間予測が行われるマクロブロックを言う。
【0045】
図4に示すように、イントラブロックとインターブロックを含む領域では、極大のピークに対して小さいピークが多く現れる。インターブロックでは動き補償があるため、ブロックの境界が動きベクトルにより移動するためである。
【0046】
よって、イントラブロックとインターブロックを含む領域の解析結果は、イントラブロックを含む領域の解析結果に比べて、極大のピーク以外でピークが多く発生する。
【0047】
次に、解析部201は、領域の所定サイズを、所定条件を満たすまで小さくしながら、ケプストラム解析を行うようにしてもよい。例えば、所定サイズは、復号画像のサイズから、次々に半分のサイズにしていく。
【0048】
図5は、所定サイズの変化の一例を示す図である。図5に示す復号画像11を含む所定サイズ20を用いて解析部201は、解析を行う。所定サイズ20は、復号画像11よりも少し大きいサイズにしておくとよい。
【0049】
次に、解析部201は、この所定サイズ20の領域での水平・垂直方向の解析結果が、図3に示すような解析結果でなければ、所定サイズ20の縦横を2で除算し、所定サイズ21にする。図3に示すような解析結果とは、ピーク幅が均一であることを示す。図4は、小さいピークを含めると、ピーク幅は不均一である。ここで、所定条件は、例えば、ピーク幅が均一であることである。
【0050】
次に、解析部201は、この所定サイズ21の領域での水平・垂直方向の解析結果が、図3に示すような解析結果でなければ、所定サイズ21の縦横を2で除算し、所定サイズ22にする。以下、解析部201は、所定サイズの領域の解析結果のピーク幅が、何れかの領域で均一になるまで、所定サイズを小さくする。所定サイズの下限は、例えば、マクロブロックサイズとする。
【0051】
つまり、解析部201は、分割された複数の領域のうち、1つの領域で水平・垂直方向の解析結果が両方とも所定の条件を満たすまで、所定サイズを小さくしていく。解析部201は、最終的に解析された解析結果をブロック歪強度決定部202及びタイプ判定部203に出力する。
【0052】
なお、解析部201は、画像符号化技術が、例えばH.264/AVCのように1つのフレーム内でスライス分割できる場合に、所定サイズを変える方法を用いるとよい。なぜなら、1つのフレーム内にイントラスライスとインタースライスが含まれる場合、予め設定されたサイズの領域で、解析結果のピーク幅が全て均一になるとは限らないからである。解析部201は、所定サイズを徐々に小さくしていくことで、イントラブロックを含む領域が特定され、イントラスライスの位置が特定されやすくする。
【0053】
また、画像符号化技術が、例えばMPEG2などのように、1つのフレームで、イントラ、インタータイプが決まる場合は、領域の所定サイズは予め設定されておいてもよい。
【0054】
図2に戻り、ブロック歪強度決定部202について説明する。ブロック歪強度決定部202は、解析部201から取得した解析結果のピーク値の大きさに基づいて、ブロック歪の強度を決定する。
【0055】
ブロック歪強度決定部202は、例えば、水平方向のケプストラムの全要素値についてk−means法のk=2でクラスタリングを行い、クラスタ中心値の大きい方のクラスタの平均値又は中央値を水平方向のピーク値とする。ブロック歪強度決定部202は、垂直方向についても同様に行う。
【0056】
ブロック歪強度決定部202は、例えば、各ブロック境界のピーク値の大きさを、ブロック歪の強度として決定する。ブロック歪決定部202は、決定した水平・垂直方向のブロック歪の強度をGOP構造決定部204及びブロック歪強度修正部205に出力する。
【0057】
タイプ判定部203は、領域毎のケプストラム解析結果を解析部201から取得し、各領域のタイプを、インターかイントラかを判定する。ここで、前述したが、イントラスライスの場合は、ブロック歪が均等に並ぶため、ケプストラムのピーク幅は均一となる。一方、インタースライスの場合は、動き補償によりブロック歪が不均一に並ぶため、ケプストラムのピーク幅は不均一となる。
【0058】
図6は、タイプ判定部203の構成の一例を示すブロック図である。図6に示すタイプ判定部203は、頻度算出部301、及びイントラ/インター判定部302を有する。
【0059】
頻度算出部301は、領域毎に、水平・垂直方向のケプストラム解析結果のピーク幅の頻度を算出し、ピーク幅のヒストグラムを生成する。頻度算出部301は、生成したヒストグラムをイントラ/インター判定部302に出力する。
【0060】
イントラ/インター判定部302は、水平・垂直方向のヒストグラムで、符号化でよく用いられる(マクロ)ブロックサイズの16の頻度が全体に占める所定割合以上であれば、この領域をイントラと判定する。所定割合は、例えば85%とする。
【0061】
また、イントラ/インター判定部302は、ブロックサイズの16の頻度が所定割合未満であれば、この領域をインターとする。イントラ/インター判定部302は、判定したタイプを領域に関連付けてGOP構造決定部204に出力する。タイプ判定部203は、ヒストグラムの生成と、タイプ判定とを全ての領域に対して行う。
【0062】
図7は、画像内のタイプの一例を示す図である。図7に示す1つの画像11内の領域30がイントラと判定された各領域を含み、領域31がインターと判定された各領域を含む。領域30は、例えばイントラスライスに対応し、領域31は、インタースライスに対応する。このように、イントラ/インター判定部302は、スライス位置と、そのスライスのタイプを判定することができる。
【0063】
図2に戻り、GOP構造決定部204について説明する。まず、先見知識として、一般の符号化では、イントラスライスは一定間隔で存在する。さらにイントラスライスに対して、後のインタースライスは、距離が遠くなるほど画質が劣化してブロック歪が多くなる可能性が高い。また、符号化の設定にも関係するが、Pスライスに対してBスライスの方が画質が悪く、ブロック歪も多くなる可能性が高い。
【0064】
GOP構造決定部204は、この先見知識を用いて、ブロック歪強度決定部202から取得したブロック歪強度と、タイプ判定部203から取得した領域毎のタイプとに基づいて、GOP構造を決定する。
【0065】
図8は、GOP構造決定部204の構成の一例を示すブロック図である。図8に示すGOP構造決定部204は、フレーム検出部401、頻度算出部402、イントラ/インター決定部403を有する。
【0066】
フレーム検出部401は、イントラと関連付けられた領域又はイントラスライスを含む第1フレームを検出する。フレーム検出部401は、検出した第1フレームを頻度算出部402に通知する。
【0067】
頻度算出部402は、フレーム検出部401から通知された第1フレームの間隔を算出し、第1フレームの間隔のヒストグラムを生成する。頻度算出部402は、算出したヒストグラムをイントラ/インター決定部403に出力する。
【0068】
イントラ/インター決定部403は、頻度算出部402から取得したヒストグラムで最も多い頻度の間隔値を、GOPのフレーム数(GOP値と呼ぶ。)と決定する。また、イントラ/インター決定部403は、第1フレームの間隔を調べ、決定したGOP値に一致する間隔を有するフレームをイントラフレームと決定する。また、イントラ/インター決定部403は、イントラフレームと決定したフレーム以外のフレームを、インターフレームと決定する。
【0069】
なお、イントラ/インター決定部403は、例えば、フレーム毎の水平・垂直方向のピーク値の大きさの平均値に対する時間方向の変化に基づいて、イントラフレームを決定してもよい。これは、第1フレームと検出されるはずのフレームが検出されていなくても、GOP値とフレームのピーク値の平均を考慮すれば、イントラフレームを検出することができる。
【0070】
ここで、イントラフレームが存在する位置に第1フレームが検出されなかった場合に、その位置のフレームを第2フレームと呼ぶ。第2フレームがイントラフレームであるか否かの判定に、ピーク値の平均値とGOP値とが用いられる。
【0071】
イントラ/インター決定部403は、まず、GOP値に基づき、第2フレームを検出する。イントラ/インター決定部403は、第2フレームの直前のフレームと第2フレームとの解析結果のピーク値の大きさの平均値が、大から小に変わっていれば、第2フレームは、イントラフレームと決定する。
【0072】
これは、イントラフレームではブロック歪は少なく、イントラフレームから時間的に離れたインターフレームはブロック歪が多いという考えに基づく。イントラ/インター決定部403は、決定した各情報を、ブロック歪強度修正部205に出力する。
【0073】
図9は、GOP構造の決定を説明するための図である。図9に示す符号50〜64は、1つの画像(フレーム)を示す。例えば、フレーム50、57、64が、イントラ/インター決定部403により、イントラフレームと決定されたとする。
【0074】
このとき、イントラ/インター決定部403は、GOP値をフレーム50〜56までの「7」と決定する。
【0075】
なお、イントラフレーム57が、フレーム検出部401で、第1フレームと検出されなかった場合を考える。また、頻度算出部402で算出したヒストグラムの最も多い頻度は、「7」であるとする。
【0076】
このとき、イントラ/インター決定部403は、ブロック歪強度決定部202から取得したフレーム毎のブロック歪の強度の平均値を用いて、イントラフレームを決定する。なお、イントラ/インター決定部403は、ブロック歪の強度の平均値を算出する際、フレーム内の水平方向又は垂直方向のどちらか一方、又は両方のブロック歪の強度を用いてもよい。イントラ/インター決定部403は、GOP値を考慮して、イントラフレーム50とイントラフレーム64からフレーム57は、イントラフレームではないかと推定できる。
【0077】
イントラ/インター決定部403は、推定したフレーム57の直前のフレーム56とフレーム57とのブロック歪の強度の平均値が、「大」から「小」に変わっていれば、フレーム57は、イントラフレームであると決定する。平均値の大小は、例えば閾値より大きければ「大」、閾値より小さければ「小」と判定できる。
【0078】
図2に戻り、ブロック歪強度修正部205について説明する。ブロック歪強度修正部205は、取得した水平・垂直方向のブロック歪の強度を、イントラフレームから遠いインターフレームほど、強いデブロッキングフィルタがかかるように、領域毎のブロック歪の強度を修正する。
【0079】
図10は、ブロック歪強度修正部205の構成の一例を示すブロック図である。図10に示すブロック歪強度修正部205は、平均値/中央値算出部501、差分算出部502、及び加算部503を有する。
【0080】
平均値/中央値算出部501は、各フレーム内に含まれる領域毎のブロック歪の強度の平均値又は中央値を算出する。平均値/中央値算出部501は、算出した各フレームの平均値又は中央値を差分算出部502に出力する。
【0081】
差分算出部502は、取得した各フレームの平均値又は中央値のうち、最大値と最小値との差分を算出する。差分算出部502は、算出した差分値を加算部503に出力する。
【0082】
加算部503は、差分算出部502から取得した差分値と、GOP構造決定部204から取得したGOP構造とに基づいて、ブロック歪の強度を修正する。例えば、以下の式(1)を用いて、加算部503は、ブロック歪の強度を修正する。
修正値=(n×Diff)/G ・・・式(1)
n(=0,1,2、・・・):GOP構造の最初のフレーム0とした時のフレーム番号
Diff:差分値
G:GOP値
加算部503は、この修正値を、そのフレームnの各領域のブロック歪の強度に加算して、ブロック歪の強度を修正する。加算部503は、修正したブロック歪の強度をデブロッキングフィルタ部108に出力する。
【0083】
デブロッキングフィルタ部108は、水平又は垂直方向のブロック歪の強度を用いて、例えばフィルタオフセット値αを修正する。デブロッキングフィルタ部108は、ブロック歪の強度が大きければ、オフセット値αを大きくし、強いデブロッキングフィルタがかかるようにする。
【0084】
なお、ブロック歪の強度の修正は、必ずしも必要な処理ではなく、ブロック歪強度決定部202により決定されたブロック歪の強度を用いて、デブロッキングフィルタ部108は、フィルタ処理を行ってもよい。
【0085】
<動作>
次に、実施例1における画像符号化装置100の動作について説明する。図11は、実施例1における情報解析処理の一例を示すフローチャートである。
【0086】
図11に示すステップS101で、解析部201は、復号画像を取得し、復号画像に対して、所定サイズの領域毎に、水平、垂直方向でケプストラム解析を行う。
【0087】
ステップS102で、ブロック歪強度決定部202は、水平・垂直方向のケプストラム解析結果を取得し、ケプストラム解析結果のピーク値の大きさに基づいて、ブロック歪の強度を決定する。例えば、ブロック歪強度決定部202は、ピーク値の大きさをブロック歪の強度とする。
【0088】
ステップS103で、タイプ判定部203は、領域毎のケプストラム解析結果のピーク幅をヒストグラム化し、水平及び/又は垂直方向で16の幅が所定割合以上であるか否かを判定する。タイプ判定部203は、16の幅が所定割合以上あれば、その領域をイントラと判定し、16の幅が所定割合未満であれば、その領域をインターと判定する。なお、ステップS102とS103の処理は、順不同である。
【0089】
ステップS104で、GOP構造決定部204は、領域のタイプと、領域のピーク値の大きさとに基づいて、フレームGOP構造を決定する。GOP構造は、1つのGOP内のフレーム数(GOP値)と、GOP内のフレームのイントラ/インタータイプとを含む。
【0090】
GOP構造決定部204は、イントラタイプの領域を含む第1フレームを検出し、第1フレームの間隔をヒストグラム化し、最も多い頻度の間隔をGOP値とする。GOP構造決定部204は、GOP値の間隔に対応する第1フレームをイントラフレームと決定する。
【0091】
また、GOP構造決定部204は、GOP値と、フレーム内のピーク値の平均値とを用いて、第1フレームではないフレームをイントラフレームとして決定することもできる。これは、前述した通り、イントラフレームから離れるほど、ブロック歪が多くなるという考えを用いて行う。
【0092】
ステップS105で、ブロック歪強度修正部205は、ブロック歪強度決定部202から取得したブロック歪の強度を、GOP構造決定部204から取得したGOP構造を用いて修正する。
【0093】
ブロック歪強度修正部205は、例えば、式(1)を用いて各フレームの修正値を算出し、この修正値を、そのフレーム内の領域毎のブロック歪の強度に加算することで、ブロック歪の強度を修正する。
【0094】
修正したブロック歪の強度は、デブロッキングフィルタ部108で、フィルタオフセット値の修正に用いられる。例えば、ブロック歪の強度が大きいほど、フィルタオフセット値αの値を大きくすることで、そのブロックには強いデブロッキンギフィルタ処理がかかるようにする。
【0095】
以上、実施例1によれば、ケプストラム解析結果のみを用いて、画像符号化に関する特徴を解析することができる。また、実施例1では、ブロック歪の強度をデブロッキングフィルタに用いる例について説明したが、情報解析部115で検出されるブロック歪の強度、スライスのタイプ情報、GOP構造などは、後段の処理で用いられればよい。
【0096】
例えば、スライスのタイプ情報やGOP構造は、再符号化などで用いられてもよいし、ブロック歪の強度は、画像の主観的な画質評価に用いられてもよい。よって、ケプストラム解析結果のみから決定、又は判定される情報は、何れかの後段の処理で用いられればよい。
【0097】
[実施例2]
図12は、実施例2における画像符号化装置600の構成の一例を示すブロック図である。画像符号化装置600は、上述した実施例1で説明した画像符号化処理をソフトウェアで実装した装置の一例である。
【0098】
図12に示すように、画像符号化装置600は、制御部601、主記憶部602、補助記憶部603、ドライブ装置604、ネットワークI/F部606、入力部607、表示部608を有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
【0099】
制御部601は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。また、制御部601は、主記憶部602又は補助記憶部603に記憶されたフィルタ処理を含む画像符号化処理のプログラムを実行する演算装置である。制御部601は、入力部607や記憶装置からデータを受け取り、演算、加工した上で、表示部608や記憶装置などに出力する。
【0100】
制御部601は、情報解析処理を含む画像符号化処理のプログラムを実行することで、各実施例で説明した情報解析処理を実現することができる。
【0101】
主記憶部602は、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部602は、制御部601が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
【0102】
補助記憶部603は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
【0103】
ドライブ装置604は、記録媒体605、例えばフレキシブルディスクからプログラムを読み出し、記憶装置にインストールする。
【0104】
また、記録媒体605に、所定のプログラムを格納し、この記録媒体605に格納されたプログラムはドライブ装置604を介して画像符号化装置600にインストールされる。インストールされた所定のプログラムは、画像符号化装置600により実行可能となる。
【0105】
ネットワークI/F部606は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と画像符号化装置600とのインターフェースである。
【0106】
入力部607は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部608の表示画面上でキーの選択等を行うためのマウスやスライスパット等を有する。また、入力部607は、ユーザが制御部601に操作指示を与えたり、データを入力したりするためのユーザインターフェースである。
【0107】
表示部608は、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等により構成され、制御部601から入力される表示データに応じた表示が行われる。
【0108】
なお、図1に示す復号画像記憶部109は、例えば主記憶部602又は補助記憶部603により実現され、図1に示す復号画像記憶部109以外の構成は、例えば制御部601及びワークメモリとしての主記憶部602により実現されうる。
【0109】
画像符号化装置600で実行されるプログラムは、実施例1で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部601が補助記憶部603からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部602上にロードされ、1又は複数の各部が主記憶部602上に生成されるようになっている。
【0110】
このように、上述した実施例1で説明した情報解析処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、前述した情報解析処理を実現することができる。
【0111】
また、このプログラムを記録媒体605に記録し、このプログラムが記録された記録媒体605をコンピュータや携帯端末に読み取らせて、前述した情報解析処理を実現させることも可能である。なお、記録媒体605は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
【0112】
なお、実施例では、画像符号化装置を例にして説明したが、画像復号装置でも同様に情報解析処理を適用することができる。画像符号化装置及び画像復号装置をまとめて画像処理装置と呼ぶ。
【0113】
画像処理装置で実行されるプログラムは、前述した各部を含むモジュール構成となっており、実際のハードウェアとしては制御部601が補助記憶部604からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部602上にロードされ、1又は複数の各部が主記憶部602上に生成されるようになっている。
【0114】
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記変形例以外にも種々の変形及び変更が可能である。
【符号の説明】
【0115】
100、600 画像符号化装置
101 予測画像生成部
102 直交変換部
103 量子化部
104 エントロピー符号化部
105 逆量子化部
106 逆直交変換部
107 復号画像生成部
108 デブロッキングフィルタ部
109 復号画像記憶部
110 イントラ予測部
111 インター予測部
112 動きベクトル計算部
113 符号化制御及びヘッダ生成部
114 予測画像選択部
201 解析部
202 ブロック歪強度決定部
203 タイプ判定部
204 GOP構造決定部
205 ブロック歪強度修正部
301 頻度算出部
302 イントラ/インター判定部
401 フレーム検出部
402 頻度算出部
403 イントラ/インター決定部
501 平均値/中央値算出部
502 差分算出部
503 加算部
601 制御部
602 主記憶部
603 補助記憶部
604 ドライブ装置
606 ネットワークI/F部
607 入力部
608 表示部

【特許請求の範囲】
【請求項1】
復号画像に対し、所定サイズの領域毎にケプストラム解析を行う解析部と、
前記解析部により解析された解析結果のピーク値の大きさに基づいて、ブロック歪の強度を決定するブロック歪強度決定部と、
を備える画像処理装置。
【請求項2】
前記解析結果のピーク幅の頻度に基づいて、前記領域がイントラタイプかインタータイプかを判定するタイプ判定部をさらに備える請求項1記載の画像処理装置。
【請求項3】
前記タイプ判定部によりイントラタイプと判定された領域を含む第1フレームを検出し、前記第1フレームの間隔のうち、最も多い頻度の間隔をGOPのフレーム数と決定するGOP構造決定部をさらに備える請求項2記載の画像処理装置。
【請求項4】
前記GOP構造決定部は、
前記ピーク値の大きさの平均値をフレーム毎に求め、前記平均値の時間方向の変化と前記GOPのフレーム数とに基づいて、イントラフレームを決定する請求項3記載の画像処理装置。
【請求項5】
前記GOP構造決定部により決定されたGOPの構造と、前記ブロック歪強度決定部により決定された各フレームのブロック歪の強度の平均値又は中央値とを用いて、前記各フレームに含まれる領域毎のブロック歪の強度を修正するブロック歪強度修正部をさらに備える請求項3又は4記載の画像処理装置。
【請求項6】
前記ブロック歪強度修正部は、
1つのGOP内において、各フレーム内に含まれる領域毎のブロック歪の強度の平均値又は中央値を算出する第1算出部と、
前記第1算出部により算出された平均値又は中央値の最大値と最小値との差分を算出する第2算出部と、
前記第2算出部により算出された差分を、GOP内のフレームの位置に応じて重み付けし、重み付けされた差分を、該フレームの領域毎のブロック歪の強度に加算する加算部とを備える請求項5記載の画像処理装置。
【請求項7】
前記解析部は、
前記所定サイズを、前記解析結果のピーク値の幅が均一になるまで前記復号画像のサイズから徐々に小さくする請求項1乃至6いずれか一項に記載の画像処理装置。
【請求項8】
前記ブロック歪の強度に応じて修正したフィルタオフセット値を用いてデブロッキングフィルタ処理を行うデブロッキングフィルタ部をさらに備える請求項1乃至7いずれか一項に記載の画像処理装置。
【請求項9】
復号画像に対し、所定サイズの領域毎にケプストラム解析を行う解析ステップと、
前記解析ステップで解析された解析結果のピーク値の大きさに基づいて、ブロック歪の強度を決定するブロック歪強度決定ステップとをコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2013−102304(P2013−102304A)
【公開日】平成25年5月23日(2013.5.23)
【国際特許分類】
【出願番号】特願2011−244005(P2011−244005)
【出願日】平成23年11月7日(2011.11.7)
【出願人】(000004352)日本放送協会 (2,206)
【Fターム(参考)】