説明

擬似立体画像生成装置及びカメラ

【課題】非立体画像信号を擬似立体画像信号に変換する場合に、どのような非立体画像のシーンであっても、違和感のない現実のイメージに近い擬似立体画像信号を生成する。
【解決手段】CPU108は、入力された、測距エリアの撮影画面内での位置、被写体までの推定距離、推定被写界深度、被写体が顔か否かのデータ、顔の場合の顔の大きさのデータなど各種データに基づいて、フレーム毎に制御信号CTL1、CTL2及びCTL3を算出して、非立体画像から擬似立体画像を生成する2D3D変換部115の擬似立体画像生成用パラメータとして供給する。制御信号CTL1は、複数の基本奥行きモデルタイプの各画像の合成比率を制御する。制御信号CTL2は、復号画像信号a中のR信号成分のみを重み付けするための重み付け係数を示す制御信号である。制御信号CTL3は、奥行きを示すパラメータと輻輳を示すパラメータとを含む制御信号である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は擬似立体画像生成装置及びカメラに係り、特に奥行き情報が明示的にも又はステレオ画像のように暗示的にも与えられていない通常の動画像(非立体動画像)から擬似的な立体画像を生成する擬似立体動画像生成装置及びカメラに関する。
【背景技術】
【0002】
近年、立体画像を生成する立体画像生成装置が、数多く発表されている。この立体画像生成装置は大きく3種類に分類できる。一つ目は、右目用と左目用の光学系をそれぞれ備えて、それぞれの光学系で撮影した画像を記録、再生するものである。二つ目は、主たる一つの光学系に加えて現実の奥行き情報を測定する構成を備えて、主たる一つの光学系で撮影した2次元の静止画像又は動画像(以下、非立体画像という)と、測定した奥行き情報とを合成して立体画像を構成するものである。
【0003】
特許文献1に開示された立体画像生成装置では、非立体画像である2次元画像の画面の各画素について距離を測定する。そして、2つのカメラ又はレーザー光を用いて、画面内の全ての被写体とカメラとの距離を測定し、2次元画像の画面の各画素についての距離情報を得る。続いて、この立体画像生成装置では、撮影者の撮影時の意図を反映させた奥行き画像及び奥行き精度画像を簡便に生成するために、個々の画素毎に、非線形な関数(マッピングテーブル)によって距離情報から奥行き値を算出する。このとき、複数のマッピングテーブルを撮影情報に応じて選択する。また、この立体画像生成装置では、奥行き情報の精度について、画面内で精度の高い部分と低い部分とを設けることができるようにしている。
【0004】
三つ目は、非立体画像から推定して擬似的な奥行き情報を生成し、その擬似的な奥行き情報と非立体画像とを合成して立体画像を構成する立体画像生成装置である。この立体画像生成装置は、推定によって擬似的な奥行き情報を生成するので、2次元画像の画面の各画素について距離を測定することはない構成である。
【0005】
また、本出願人による特許文献2には、擬似立体画像を生成する際に、自動的な処理方法で推定される奥行き情報を、非立体画像の1画面毎の場面(以下、シーンという)に応じて補正することを可能にする擬似立体画像生成装置が開示されている。
【0006】
この特許文献2に開示された擬似立体画像生成装置では、奥行き感を有する画像(以下、基本奥行きモデルタイプという)を複数用意し、非立体画像の1画面における輝度信号の高域成分を算出して、その算出値に基づいて複数の基本奥行きモデルタイプの合成比率を自動的に算出する。そして、算出した合成比率から非立体画像の奥行き感を出すための奥行きデータを推定して、非立体画像と奥行きデータとにより擬似立体画像を生成する。
【0007】
このとき、複数の基本奥行きモデルタイプの合成比率は、すべての非立体画像に対して予め定めた同一の方法により自動的に算出すると、シーンによっては、適切な奥行き情報が得られず、違和感のある擬似立体画像が生成されてしまう場合がある。しかし、非立体画像のシーンに応じて、その都度ユーザー自身が擬似立体画像のアルゴリズムやパラメータを調整することは現実的に困難である。そこで、上記の特許文献2記載の擬似立体画像生成装置では、違和感のない、現実のイメージにより近い擬似立体画像を生成するために、製作者側において奥行き情報を、シーンに応じて補正することを目的にしている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2008−141666号公報
【特許文献2】特開2009−044722号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、特許文献1記載の立体画像生成装置では、距離情報の取得のために2つのカメラあるいはレーザー光を用いた距離測定手段が必要であるため、装置が高価格のものになってしまう。また、この立体画像生成装置では、撮影した情報を記録する場合には、2次元画像データと共に各画素毎の奥行き情報を記録する必要があり、記録画データが大きくなって、その保存や伝送にかかるコストも問題となる。
【0010】
一方、特許文献2には、奥行き情報の調整を行うための具体的な方法については開示されていない。例えば、人が実際にシーンを視聴して、手作業で調整パラメータを決定してもよい。しかしながら、ユーザーがハンディビデオカメラで撮影した非立体画像を擬似立体画像に変換するような場合には、特許文献2記載の擬似立体画像生成装置では、ユーザーが製作者となって、手作業で調整パラメータを調整することとなるが、違和感のない、現実のイメージにより近い擬似立体画像を生成するための調整は非常に煩わしい。
【0011】
本発明は、上記の点に鑑みなされたもので、ビデオカメラで撮影した得られた非立体画像信号を擬似立体画像信号に変換する場合に、どのような非立体画像のシーンであっても、違和感のない、現実のイメージにより近い擬似立体画像信号を生成することができる擬似立体画像生成装置及びカメラを提供することを目的とする。
【課題を解決するための手段】
【0012】
上記の目的を達成するため、本発明の擬似立体画像生成装置は、ズームレンズ、フォーカスレンズ及び絞りを含む光学系を通して撮像素子の撮像面に結像された被写体の光学像を、撮像素子により光電変換して得られた非立体画像信号から被写体が人物であるとき、その人物の顔の大きさ情報を取得する顔の大きさ情報取得手段と、非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、基本奥行きモデル発生手段から供給される複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、非立体画像信号に対して第2の制御信号が示す重み付け係数を乗算する重み付け手段と、重み付け手段により重み付けされた非立体画像信号と、奥行きモデル合成手段により生成された奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、奥行きと輻輳とを示す第3の制御信号により奥行きと輻輳とが調整された奥行き推定データに基づいて、非立体画像信号のテクスチャをシフトして、擬似立体画像信号を生成するテクスチャシフト手段と、第1〜第3の制御信号をそれぞれ算出して出力する際に、顔の大きさ情報を用いて、算出する第1〜第3の制御信号のうちの少なくともいずれか一つの制御信号の値を可変する制御信号算出手段とを有することを特徴とする。
【0013】
また、上記の目的を達成するため、本発明の擬似立体画像生成装置は、光学系を構成するズームレンズ及びフォーカスレンズの各位置をそれぞれ取得するレンズ位置取得手段と、レンズ位置取得手段で取得されたズームレンズ位置及びフォーカスレンズの位置に基づいて、フォーカスレンズの位置から被写体までの推定距離を算出する被写体推定距離算出手段と、光学系を通して撮像素子の撮像面に結像された被写体の光学像を、撮像素子により光電変換して得られた非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、基本奥行きモデル発生手段から供給される複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、非立体画像信号に対して第2の制御信号が示す重み付け係数を乗算する重み付け手段と、重み付け手段により重み付けされた非立体画像信号と、奥行きモデル合成手段により生成された奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、奥行きと輻輳とを示す第3の制御信号により奥行きと輻輳とが調整された奥行き推定データに基づいて、非立体画像信号のテクスチャをシフトして、擬似立体画像信号を生成するテクスチャシフト手段と、第1乃び第3の制御信号をそれぞれ算出して出力する際に、算出された被写体までの推定距離の情報を用いて、算出する第1及び第3の制御信号のうちの少なくともいずれか一方の制御信号の値を可変する制御信号算出手段とを有することを特徴とする。
【0014】
また、上記の目的を達成するため、本発明の擬似立体画像生成装置は、光学系を構成するズームレンズの位置、フォーカスレンズの位置及び絞りの絞り値をそれぞれ取得する光学系情報取得手段と、光学系情報取得手段で取得された絞り値及びズームレンズ位置に基づいて、推定被写界深度を算出する被写界深度算出手段と、光学系を通して撮像素子の撮像面に結像された被写体の光学像を、撮像素子により光電変換して得られた非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、基本奥行きモデル発生手段から供給される複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、非立体画像信号に対して第2の制御信号が示す重み付け係数を乗算する重み付け手段と、重み付け手段により重み付けされた非立体画像信号と、奥行きモデル合成手段により生成された奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、奥行きと輻輳とを示す第3の制御信号により奥行きと輻輳とが調整された奥行き推定データに基づいて、非立体画像信号のテクスチャをシフトして、擬似立体画像信号を生成するテクスチャシフト手段と、第1〜第3の制御信号をそれぞれ算出して出力する際に、算出された推定被写界深度の情報を用いて、算出する第1〜第3の制御信号のうちの少なくともいずれか一つの制御信号の値を可変する制御信号算出手段とを有することを特徴とする。
【0015】
また、上記の目的を達成するため、本発明の擬似立体画像生成装置は、光学系を構成するズームレンズ及びフォーカスレンズの各位置をそれぞれ取得するレンズ位置取得手段と、光学系を通して撮像素子の撮像面に結像された被写体の光学像を、撮像素子により光電変換して得られた非立体画像信号のうち、撮像素子の撮像画面内の所定の小領域である測距エリア内の非立体画像信号の高域成分が最大となる合焦位置を求めるために、フォーカスレンズの位置を移動制御する自動焦点調節手段と、撮像画面内の測距エリアの位置データを取得する位置データ取得手段と、フォーカスレンズの合焦位置から被写体までの推定距離を算出する被写体推定距離算出手段と、非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、基本奥行きモデル発生手段から供給される複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、非立体画像信号に対して第2の制御信号が示す重み付け係数を乗算する重み付け手段と、重み付け手段により重み付けされた非立体画像信号と、奥行きモデル合成手段により生成された奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、奥行きと輻輳とを示す第3の制御信号により奥行きと輻輳とが調整された奥行き推定データに基づいて、非立体画像信号のテクスチャをシフトして、擬似立体画像信号を生成するテクスチャシフト手段と、第1〜第3の制御信号をそれぞれ算出して出力する際に、測距エリアの位置データと被写体までの推定距離とに応じて、算出する第1及び第3の制御信号のうち少なくともいずれか一方の制御信号を可変する制御信号算出手段とを有することを特徴とする。
【0016】
また、上記の目的を達成するため、本発明の擬似立体画像生成装置は、光学系を通して撮像面に結像された被写体の光学像を光電変換して非立体画像信号を得る撮像素子の搖動の大きさ情報と、パンニング、チルティングの大きさ情報とからなる手振れ情報を検出する手振れ検出手段と、撮像素子により得られた非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、基本奥行きモデル発生手段から供給される複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、非立体画像信号に対して第2の制御信号が示す重み付け係数を乗算する重み付け手段と、重み付け手段により重み付けされた非立体画像信号と、奥行きモデル合成手段により生成された奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、奥行きと輻輳とを示す第3の制御信号により奥行きと輻輳とが調整された奥行き推定データに基づいて、非立体画像信号のテクスチャをシフトして、擬似立体画像信号を生成するテクスチャシフト手段と、第1〜第3の制御信号をそれぞれ算出して出力する際に、手振れ情報を用いて、算出する第1〜第3の制御信号のうちの少なくともいずれか一つの制御信号の値を可変する制御信号算出手段とを有することを特徴とする。
【0017】
また、上記の目的を達成するため、本発明の擬似立体画像生成装置は、光学系を通して撮像面に結像された被写体の光学像を光電変換して非立体画像信号を得る撮像素子の光軸周りのロール角度を検出するロール角度検出手段と、撮像素子により得られた非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、基本奥行きモデル発生手段から供給される複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、非立体画像信号に対して第2の制御信号が示す重み付け係数を乗算する重み付け手段と、重み付け手段により重み付けされた非立体画像信号と、奥行きモデル合成手段により生成された奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、奥行きと輻輳とを示す第3の制御信号により奥行きと輻輳とが調整された奥行き推定データに基づいて、非立体画像信号のテクスチャをシフトして、擬似立体画像信号を生成するテクスチャシフト手段と、第1〜第3の制御信号をそれぞれ算出して出力する際に、ロール角度検出手段により検出されたロール角度検出情報を用いて、算出する第1及び第3の制御信号のうちの少なくともいずれか一方の制御信号の値を可変する制御信号算出手段とを有することを特徴とする。
【0018】
更に、上記の目的を達成するため、本発明のカメラは、光学系を通して撮像面に結像された被写体の光学像を光電変換して、非立体画像信号を得る撮像素子を有するカメラにおいて、カメラから被写体までの推定距離を算出する被写体推定距離算出手段と、光学系を通して撮像面に結像された被写体の光学像を光電変換する撮像素子から出力される非立体画像信号の隣接する2フレーム間の信号変化と推定距離とに基づいて、撮影シーン情報を取得する撮影シーン情報取得手段と、撮像素子から出力される非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、基本奥行きモデル発生手段から供給される複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、非立体画像信号に対して第2の制御信号が示す重み付け係数を乗算する重み付け手段と、重み付け手段により重み付けされた非立体画像信号と、奥行きモデル合成手段により生成された奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、奥行きと輻輳とを示す第3の制御信号により奥行きと輻輳とが調整された奥行き推定データに基づいて、非立体画像信号のテクスチャをシフトして、擬似立体画像信号を生成するテクスチャシフト手段と、第1乃至第3の制御信号をそれぞれ算出して出力する際に、撮影シーン情報取得手段により取得された撮影シーン情報を用いて、算出する第1乃至第3の制御信号のうちの少なくともいずれか一つの制御信号の値を可変する制御信号算出手段とを有することを特徴とする。
【発明の効果】
【0019】
本発明によれば、画面毎に得られる撮影時のパラメータから制御信号を補正することにより、撮影して得られた非立体画像信号に対して、最適な奥行きモデルの擬似立体画像信号を生成することができ、これにより擬似立体画像信号を視聴するユーザーの違和感や疲労感を抑制し、更に迫力や臨場感のある擬似立体画像信号を生成することができる。
【図面の簡単な説明】
【0020】
【図1】本発明の擬似立体画像生成装置を備えたビデオカメラの第1の実施形態のブロック図である。
【図2】図1中の2D3D変換部の一例のブロック図である。
【図3】図2中の奥行き推定データ生成部の一例のブロック図である。
【図4】図2中のステレオペア生成部の一例のブロック図である。
【図5】基本奥行きモデルタイプAの画像の立体構造の一例である。
【図6】基本奥行きモデルタイプBの画像の立体構造の一例である。
【図7】基本奥行きモデルタイプCの画像の立体構造の一例である。
【図8】図3中の合成比率決定部における合成比率の決定条件の一例を示す図である。
【図9】図3中の奥行きモデル合成部の一例のブロック図である。
【図10】本発明の擬似立体画像生成装置を備えたビデオカメラの第2の実施形態のブロック図である。
【図11】本発明の擬似立体画像生成装置を備えたビデオカメラの第3の実施形態のブロック図である。
【発明を実施するための形態】
【0021】
次に、本発明の各実施形態について図面と共に説明する。
【0022】
<第1の実施形態>
図1は、本発明になる擬似立体画像生成装置を備えたカメラの第1の実施形態のブロック図を示す。以後の各実施形態の説明において、カメラはビデオカメラとして説明するが、ビデオカメラに限定するものではない。本実施形態のビデオカメラ100は、ズームレンズ101、フォーカスレンズ102、絞り103及び撮像素子104からなる光学系を有するハンディビデオカメラである。
【0023】
ズームレンズ101はズームレンズ駆動部105により、またフォーカスレンズ102はフォーカスレンズ駆動部106により、それぞれ撮像素子104の撮像面に対して近付く方向又は遠ざかる方向に互いに独立して移動制御される。絞り103は、絞り駆動部107により絞り値が制御される。撮像素子104は、CCD(Charge Coupled Devise;電荷結合素子)あるいはCMOS(Complementary Metal Oxide Semiconductor)センサからなり、行方向及び列方向に多数個の画素がマトリクス状に配列された撮像面を有する。撮像素子104は、撮像面に結像された被写体の光学像を光電変換して撮像信号を出力する。
【0024】
また、ズームレンズ駆動部105は、ズームレンズ101の移動位置を検出する機能を有する。同様に、フォーカスレンズ駆動部106は、フォーカスレンズ102の移動位置を検出する機能を有する。絞り駆動部107は、絞り量(絞り値)を検出する機能を有する。
【0025】
CPU(Central Processing Unit;中央処理装置)108は、本発明における被写体の顔の大きさ情報取得手段、ズームレンズ101及びフォーカスレンズ102の各位置をそれぞれ取得するレンズ位置取得手段、光学系を構成するズームレンズ101の位置、フォーカスレンズ102の位置及び絞り103の絞り値をそれぞれ取得する光学系情報取得手段、フォーカスレンズ102の合焦位置から被写体までの推定距離を算出する被写体推定距離算出手段、推定被写界深度を算出する被写界深度算出手段、撮像画面内の測距エリアの位置データを取得する位置データ取得手段、制御信号CTL1〜CTL3を算出する制御信号算出手段を構成している。また、CPU108は、フォーカスレンズ駆動部106と共にフォーカスレンズ102を合焦位置に移動制御する自動焦点調節手段も構成している。
【0026】
すなわち、CPU108は、ズームレンズ駆動部105により検出されたズームレンズ101の移動位置、フォーカスレンズ駆動部106により検出されたフォーカスレンズ102の移動位置、及び絞り駆動部107により検出された絞り量(絞り値)が入力され、これらの入力情報をメモリ109に格納されたプログラム及びテーブルに従って演算処理する。また、CPU108は、撮像信号のシーン毎に得られる撮影情報から後述する制御信号CTL1、CTL2及びCTL3を生成する。
【0027】
メモリ109は、ズームレンズ101の移動位置と合焦状態でのフォーカスレンズ102の移動位置との組み合わせから、フォーカスレンズ102の合焦位置から被写体までの距離を推定するための数値テーブル(以下、「被写体距離推定テーブル」と称する)を格納している。また、メモリ109は、絞り値とズームレンズ101の移動位置と被写体との距離との推定値から、いわゆる被写界深度を推定するための数値テーブル(以下、「被写界深度テーブル」と称する)を格納している。
【0028】
また、ビデオカメラ100は、撮像信号をデジタル信号に変換するためのA/D変換器110、デジタル信号に対して所定の信号処理を行って画像データを出力する信号処理部111、信号処理された画像データを記憶する画像記憶部112、画像データに対して符号化等の画像処理を行う画像処理部113及び録再インタフェース(I/F;Interface)部114を有する。
【0029】
更に、ビデオカメラ100は、擬似立体画像生成部(以下、「2D3D変換部」という)115及び表示I/F部116を有する。2D3D変換部115は、後に詳述するように、CPU108により生成された制御信号CTL1、CTL2及びCTL3に基づき、非立体画像である撮影画像から奥行き情報を推定して、各シーンで違和感の殆どない擬似立体画像を生成する。表示I/F部116は、擬似立体画像を表示する。2D3D変換部115は、前述したCPU108に直接に接続される一方、画像記憶部112、画像処理部113、録再I/F部114と共に双方向の画像データバス117を介してCPU108に接続されている。
【0030】
また、ビデオカメラ100は、操作部118を備えている。操作部118は、タッチパネルを備えており、タッチパネルのある位置にユーザーが指をタッチすることで、撮影画面でその位置に対応する位置が測距エリアとして選択されるようにされる。ビデオカメラ100において、ズームレンズ101、フォーカスレンズ102、絞り103、撮像素子104、ズームレンズ駆動部105、フォーカスレンズ駆動部106、絞り駆動部107、CPU108、メモリ109、録再I/F部114、及び2D3D変換部115は、本実施形態の擬似立体画像生成装置を構成している。
【0031】
上記の各構成要素からなるビデオカメラ100は、所望の撮影モードによる被写体の撮影、撮影した画像データの記録媒体への記録、記録媒体から再生した画像データに基づく擬似立体画像の生成、擬似立体画像の表示を適宜選択して行う。
【0032】
そこで、まず、ビデオカメラ100の撮影時と、撮影した画像データの記録媒体への記録時の動作について説明する。撮影時には、ズームレンズ101、フォーカスレンズ102、絞り103を順次に通過した被写体からの入射光は、撮像素子104の撮像面に光学像として結像されて光電変換され、撮像信号として出力される。
【0033】
A/D変換器110は、撮像素子104から出力された撮像信号をデジタル信号である画像データに変換し、信号処理部111に供給する。信号処理部111は、入力された画像データに対し、画素補間処理を含むカラープロセス処理を施し、デジタル値の輝度信号(Y)及び色差信号(Cb,Cr)を生成すると共に、それらの信号中のノイズ除去を行う。画像記憶部112は、信号処理部111で生成されたデジタル値の輝度信号(Y)及び色差信号(Cb,Cr)を順次格納する。画像記憶部112には、数フレーム分の信号が格納される。
【0034】
画像処理部113は、画像データバス117を介して画像記憶部112にアクセスし、画像記憶部112に格納された画像データを、公知のMPEG−2(Moving Picture Experts Group 2)方式やMPEG−4 AVC(Moving Picture Experts Group 4 Advanced Video Coding)方式によって符号化する。
【0035】
このように撮影して得られた被写体の符号化画像データは記録媒体に記録される。すなわち、録再I/F部114は、被写体の撮像画像を画像処理部113により符号化して得られた画像データを、画像データバス117を介して取り込み、その画像データを図示しない記録媒体に記録する。ただし、記録媒体には後述するように符号化された画像データだけでなく、所定のデータが符号化された画像データに多重されて記録される。記録媒体としては、磁気ディスク、光ディスク、半導体記憶媒体、磁気テープ等がある。また、記憶媒体は、外部取り外しの可能な記憶媒体または内蔵の記憶媒体とすることができる。
【0036】
ここで、ビデオカメラ100は、自動焦点調節(AFともいう)撮影モードを備えている。AF方法には、いくつかの方式が公知となっているが、ここでは画面内の所定の小領域の輝度信号(Y)の高域成分が最大になるフォーカスレンズの位置を合焦位置とする方式(いわゆる山登り方式)を用いる。この山登り方式は測距範囲の全域にわたりフォーカスレンズ102の位置を移動しながら撮像素子104から得られる輝度信号の高域成分(以下焦点評価値という)を記憶していき、記憶した値の最大値に相当するフォーカスレンズ位置を合焦位置とする方式を用いる。一旦、合焦位置が求まったら、以後の撮影は合焦位置の近傍でフォーカスレンズ102を駆動して輝度信号の高域成分の最大値を求めることで、動画像撮影に対応する。
【0037】
このAF撮影モードでは、CPU108は、画像記憶部112に格納されている1フレーム分の輝度信号(Y)のうち、所定の小領域に属する画素のデータを画像データバス117を介して読み出す。そして、CPU108は、この画素データから高域成分をデジタルフィルタ演算によって算出することで、焦点評価値を得る。また、CPU108は、フォーカスレンズ駆動部106に指示を出してフォーカスレンズ102を移動させる。
【0038】
上記の所定の小領域は、測距エリアと呼ばれる。この測距エリアを決定する方法にはいくつかの方法が知られている。第1の測距エリア決定方法は、測距エリアを撮影画面の中央部分に固定する方法である。第2の測距エリア決定方法は、測距エリアをユーザーが撮影画面の所望の位置に選択する方法である。この方法では、操作部118が備えるタッチパネルをユーザーがタッチすることで、撮影画面のタッチした位置に対応する位置を中心とする所定の大きさの小領域が測距エリアとして選択される。
【0039】
また、第3の測距エリア決定方法は、ユーザーが上記タッチパネルにタッチした時点で撮影画面のタッチした位置に対応する位置を中心とする所定の大きさの小領域内に存在する被写体を追尾して、その追尾領域を測距エリアとする方法である。例えば、草原を歩き回る犬を撮影するような場合、撮影画面内の犬の位置に対応する位置をタッチすることで、それ以降に犬が歩き回っても、犬の位置を自動で追尾して測距エリアとする。
【0040】
CPU108は、画像記憶部112に格納されている1フレーム分の輝度信号(Y)及び色差信号(Cb,Cr)を読み出し、それらの信号を用いてタッチパネルのタッチされた位置に対応する撮影画面内の位置を中心とする小領域の信号の特徴量を抽出する。特徴量としては、色の分布や輝度信号の高域成分の形状などを利用する。測距エリアを移動する被写体に追尾する方法では、被写体の移動中は、後続の各々のフレームの輝度信号(Y)及び色差信号(Cb,Cr)を用いて類似の特徴量を有する位置を探索することで、測距エリアを決定する。
【0041】
また、第4の測距エリア決定方法は、撮影画面内で被写体の人物の顔を自動で検出して、その顔の位置を中心とする所定の大きさの小領域を測距エリアとする方法である。人物の顔の検出手段自体は公知であるので、その説明は省略する。複数の顔が検出された場合は、その内で主要被写体と判断される顔の位置を中心とする所定の大きさの小領域を測距エリアとする。
【0042】
この測距エリア決定方法としては、例えばユーザーが上記タッチパネルをタッチすることで、タッチした位置に相当する顔を主要被写体の顔と判断する方法がある。あるいは、個人認証機能により、予め登録した人物の特徴量がメモリ109に格納されている場合には、登録していない人物よりも登録した人物の顔を主要被写体の顔と判断し、登録した複数の人物の顔が検出された場合には、登録時にユーザーが設定した登録順位に従って主要被写体の顔と判断する方法がある。
【0043】
なお、顔の位置を測距エリアとした場合には、その顔の大きさ情報も取得する。顔の大きさ情報は、例えば、撮影画面内で検出された被写体の人物の顔の撮影画面面積(画素数)を、その撮影時点におけるズームレンズ101の位置(ズーム比)と対応させた情報である。上記のAF撮影モードでは測距エリアの合焦位置は時々刻々変化し、また、上記の追尾方式や顔検出方式では測距エリアの位置は時々刻々変化する。
【0044】
また、撮影時には、操作部118に対するユーザーの操作に従いズームレンズ101を移動させて、撮影画面を拡大したり、縮小したりすることかできる。この場合、CPU108は、操作部118から入力されるズームレンズ操作用信号に対応してズームレンズ駆動部105に指示を出してズームレンズ101を移動させる。
【0045】
また、撮影時には、操作部118に対するユーザーの操作に従い絞り量(絞り値)を変化させることができる。この場合、CPU108は、操作部118からの絞り制御信号に対応して絞り駆動部107に指示を出して絞り103の絞り量を変化させる。絞り量は被写体の明るさに応じて、CPU108が自動で制御する場合もある。
【0046】
ズームレンズ101の移動位置、フォーカスレンズ102の移動位置及び絞り103の絞り量は、ズームレンズ駆動部105、フォーカスレンズ駆動部106及び絞り駆動部107でそれぞれ取得され、その取得情報がCPU108に送られる。CPU108は、これらの取得情報とメモリ109に格納されている被写体距離推定テーブルとを用いて、フォーカスレンズ102の合焦位置から被写体までの距離を推定する(すなわち、被写体までの推定距離を算出する)。また、CPU108は、これらの取得情報とメモリ109に格納されている被写界深度テーブルとを用いて被写界深度を推定する。
【0047】
続いて、CPU108は、フレーム毎の測距エリアの撮影画面内での位置データ、被写体までの推定距離のデータ、被写界深度の推定データ及び被写体が顔か否かのデータ、更に顔の場合には顔の大きさのデータを含めて、それらの各種データを録再I/F部114に出力する。録再I/F部114は、画像処理部113で符号化された画像データと、CPU108で生成された上記の各種データとを、対応させて多重化して図示しない記録媒体に記録する。上記の各種データを符号化画像データに多重化する方法は、特に限定されるものではないが、例えば、上記の各種データを符号化画像データの中に、ユーザデータとして公知の方法により埋め込むようにしてもよい。
【0048】
なお、測距エリアの位置、被写体までの推定距離と推定被写界深度のデータの多重化は必ずしも毎フレームでなくてもよく、数フレーム置きでもよいし、所定の閾値よりも大きな変化があった場合に限定してもよい。
【0049】
また、被写体までの推定距離と推定被写界深度については、これらの替りにズームレンズ101の移動位置、フォーカスレンズ102の移動位置、及び絞り103の絞り量を符号化するようにしてもよい。これらと共に被写体距離推定テーブル、被写界深度テーブルに相当するデータを多重化して記録すれば、再生側で被写体までの推定距離と推定被写界深度とが算出できる。また、自己記録再生に限定すれば、被写体距離推定テーブル、被写界深度テーブルは記録しなくてもよい。
【0050】
また、本実施形態では、被写体までの推定距離を山登り法で求めたが、これに限定されるものではなく、赤外線を照射してその反射波を観測する方式や、いわゆる位相差検出方式を用いてもよい。
【0051】
次に、本実施形態の記録媒体から再生した画像データに基づく擬似立体画像の生成時の動作について説明する。
【0052】
再生時には、録再I/F部114は、図示しない記録媒体に記録されている多重化データを読み出し、その多重化データのうち符号化画像データは画像データバス117を介して画像処理部113に供給する。また、録再I/F部114は、読み出した多重化データのうち、符号化画像データ以外の、測距エリアの位置、被写体までの推定距離、推定被写界深度、被写体が顔か否かのデータ、顔の場合の顔の大きさのデータなど各種データは画像データバス117を介してCPU108に供給する。
【0053】
画像処理部113は、入力された符号化画像データを復号して、デジタル値の復号輝度信号(Y)及び復号色差信号(Cb,Cr)を得て、これらを画像記憶部112に格納する。画像記憶部112は、格納した復号輝度信号(Y)及び復号色差信号(Cb,Cr)を、各フレームの時間順の並べ替えなどを行って読み出して、2D3D変換部115に供給する。
【0054】
一方、CPU108は、入力された、測距エリアの位置、被写体までの推定距離、推定被写界深度、被写体が顔か否かのデータ、顔の場合の顔の大きさのデータなど各種データに基づいて、後述するようにフレーム毎に制御信号CTL1、CTL2及びCTL3を算出して、2D3D変換部115に供給する。このとき、CPU108は、上記の復号輝度信号(Y)及び復号色差信号(Cb,Cr)(以下、これらを復号画像信号aという)中のあるフレームが2D3D変換部115に入力するタイミングに合わせて、そのフレームに対応する前記の制御信号CTL1〜CTL3を2D3D変換部115に供給する。
【0055】
ここで、上記の制御信号CTL1〜CTL3は、制御信号の無い場合に得られた擬似立体画像が不自然になる場合に、CPU108によって1フレーム毎に自動的に生成される信号である。なお、制御信号CTL1〜CTL3は1フィールド毎に生成してもよい。
【0056】
上記の制御信号CTL1は、後述する基本奥行きモデルタイプA、B及びCの各画像の合成比率を制御する信号であり、基本奥行きモデルタイプAの合成比率k1、基本奥行きモデルタイプBの合成比率k2、基本奥行きモデルタイプCの合成比率k3をそれぞれ示すパラメータを含む。なお、上記の3つの合成比率k1〜k3の合計値は常に「1」であるので、制御信号CTL1は例えば3つの合成比率k1〜k3のうちの任意の2つの合成比率を伝送し、残りの1つの合成比率は2D3D変換部115内で、伝送される任意の2つの合成比率の和を「1」から減算することで生成させることも可能である。
【0057】
また、上記の制御信号CTL2は、画像処理部113で復号して得られた、非立体画像信号である復号画像信号a中の赤色信号(R信号)成分のみを重み付けするための重み付け係数を示す制御信号である。この制御信号CTL2により、復号画像信号aの輝度差が強い場合であっても、不自然な擬似立体画像となることを抑制することができる。
【0058】
更に、上記の制御信号CTL3は、奥行きを示すパラメータと輻輳を示すパラメータとを含む制御信号である。輻輳とは、遠景に対しては擬似立体画像のユーザーの両目の視線がほぼ平行となるようにし、近景に対しては両目の視線を内転させることができるようにすることをいう。
【0059】
図1において、2D3D変換部115は、画像記憶部112から供給される復号映像信号aと、CPU108から供給される制御信号CTL1〜CTL3とを入力信号として受け、後述するように、復号映像信号a又は制御信号CTL1及びCTL2に基づいて奥行き推定データdを生成してCPU108に出力すると共に、復号映像信号a及び制御信号CTL1〜CTL3に基づいて擬似立体画像信号を生成する。
【0060】
次に、2D3D変換部115の構成及び動作について詳細に説明する。
【0061】
図2は、2D3D変換部115の一例のブロック図、図3は、図2中の奥行き推定データ生成部の一例のブロック図、図4は、図2中のステレオペア生成部300の一例のブロック図を示す。
【0062】
図2に示すように、2D3D変換部115は、奥行き推定データ生成部200とステレオペア生成部300とから構成される。2D3D変換部115は、画像記憶部112から供給される非立体画像信号である復号画像信号aを、加工することなくそのまま例えば右目用映像信号e2として出力すると共に、奥行き推定データ生成部200及びステレオペア生成部300にそれぞれ供給する。
【0063】
奥行き推定データ生成部200は、CPU108から供給される制御信号CTL1及びCTL2と、画像記憶部112から供給される復号画像信号aとから奥行き推定データdを生成してCPU108及びステレオペア生成部300に供給する。ステレオペア生成部300は、奥行き推定データdと、CPU108から供給される制御信号CTL3と、画像記憶部112から供給される復号画像信号aとから擬似立体画像信号の左目用映像信号e1を生成して出力する。
【0064】
奥行き推定データ生成部200は、図3に示すように、画像入力部201と、画面上部の高域成分評価部202と、画面下部の高域成分評価部203と、合成比率決定部204と、スイッチ205と、奥行きモデル合成手段である奥行きモデル合成部206と、それぞれ基本奥行きモデル発生手段であるフレームメモリ207、208及び209と、制御信号判定部210と、重み付け手段である重み付け部211と、奥行き推定データを生成する奥行き推定データ生成手段である加算部212とから構成されている。
【0065】
画像入力部201は、フレームメモリを備えており、非立体画像信号である1フレーム分の復号画像信号aを一時記憶した後、その1フレーム分の復号画像信号aを画面上部の高域成分評価部202及び画面下部の高域成分評価部203にそれぞれ供給すると共に、復号画像信号a中の赤色信号(R信号)成分のみを重み付け手段である重み付け部211の一方の入力端子に供給する。重み付け部211の他方の入力端子には、制御信号判定手段である制御信号判定部210からの制御信号CTL2が供給される。
【0066】
画面上部の高域成分評価部202は、1フレーム分の復号画像信号aにおける画面の上部約20%にあたる領域内での高域成分を求めて、画面上部の高域成分評価値として算出する。そして、画面上部の高域成分評価部202は、画面上部の高域成分評価値を合成比率決定部204に供給する。画面下部の高域成分評価部203は、1フレーム分の復号画像信号aにおける画面の下部約20%領域内にあたる領域内での高域成分を求めて、画面下部の高域成分評価値として算出する。そして、画面下部の高域成分評価部203は、画面下部の高域成分評価値を合成比率決定部204に供給する。
【0067】
一方、フレームメモリ207は基本奥行きモデルタイプA、フレームメモリ208は基本奥行きモデルタイプB、フレームメモリ209は基本奥行きモデルタイプCの画像を予め格納している。これらの基本奥行きモデルタイプA〜Cの画像は、それぞれ非立体画像信号を基に奥行き推定データを生成して擬似立体画像信号を生成するための基本となるシーンの画像を示す。
【0068】
すなわち、上記の基本奥行きモデルタイプAの画像は、球面状の凹面による奥行きモデルの画像で、図5に示すような立体構造の画像を示す。多くの場合に、この基本奥行きモデルタイプAの画像が使用される。オブジェクトが存在しないシーンにおいては、画面中央を一番遠距離に設定することにより、違和感の少ない立体感及び快適な奥行き感が得られるからである。
【0069】
また、上記の基本奥行きモデルタイプBの画像は、基本奥行きモデルタイプAの画像の上部を球面でなく、アーチ型の円筒面に置き換えたもので、図6に立体構造を示すような、上部を円筒面(軸は垂直方向)で下部を凹面(球面)としたモデルの画像である。
【0070】
更に、上記の基本奥行きモデルタイプCの画像は、図7に立体構造を示すような、上部を平面とし、下部をその平面から連続し、下に行くほど手前側に向かう円筒面状としたもので、上部が平面、下部が円筒面(軸は水平方向)としたモデルの画像である。基本奥行きモデルタイプ発生手段を構成するフレームメモリ207〜209に格納されている、これら基本奥行きモデルタイプA〜Cの画像は、奥行きモデル合成部206へ供給される。
【0071】
合成比率決定部204は、画面上部の高域成分評価部202から供給された画面上部の高域成分評価値と、画面下部の高域成分評価部203から供給された画面下部の高域成分評価値とに基づいて、画像のシーンを考慮することなく、予め定められた方法により、基本奥行きモデルタイプAの合成比率k1、基本奥行きモデルタイプBの合成比率k2、基本奥行きモデルタイプCの合成比率k3を自動的に算出し、それらを合成比率信号COMとして制御信号判定手段であるスイッチ205に供給する。なお、3つの合成比率k1〜k3の合計値は常に「1」である。
【0072】
図8は、合成比率の決定条件の一例を示す。図8は、横軸に示す画面上部の高域成分評価値(以下、上部の高域成分評価値と略す)と、縦軸に示す画面下部の高域成分評価値(以下、下部の高域成分評価値と略す)の各値と、予め指定された値tps、tpl、bms、bmlとの兼ね合いにより合成比率が決定されることを示す。この合成比率の決定条件は、本出願人が特許第4214976号公報にて開示した公知の決定条件であるが、これに限定されるものではない。
【0073】
図8において、複数のタイプが記載されている領域については、高域成分評価値に応じて線形に合成される。例えば、図8において、「typeA/B」の領域では、下記のように(上部の高域成分評価値)と(下部の高域成分評価値)の比率で基本奥行きモデルタイプAの値であるtypeAと基本奥行きモデルタイプBの値であるtypeBの比率が決定され、基本奥行きモデルタイプCの値であるtypeCは比率の決定には用いられない。
【0074】
typeA:typeB:typeC
=(上部の高域成分評価値−tps):(tp1−下部の高域成分評価値):0
また、図8において、「typeA/B/C」の領域では、typeA/BとtypeA/Cとの平均を採用して、下記のようにtypeA/B/Cの値が決定される。
【0075】
typeA:typeB:typeC
=(上部の高域成分評価値−tps)+(下部の高域成分評価値−bms):(tpl−
上部の高域成分評価値):(bml−下部の高域成分評価値)
なお、合成比率k1、k2、k3は次式で算出される。
【0076】
k1=type1/(typeA+typeB+typeC)
k2=type2/(typeA+typeB+typeC)
k3=type3/(typeA+typeB+typeC)
図3に戻って説明する。スイッチ205は、CPU108から制御信号CTL1が供給される場合には制御信号CTL1を選択して奥行きモデル合成部206に供給し、制御信号CTL1が供給されない場合には合成比率決定部204より供給される合成比率信号COMを選択する。スイッチ205は、選択した信号を合成手段である奥行きモデル合成部206に供給する。
【0077】
奥行きモデル合成部206は、スイッチ205から供給された制御信号CTL1あるいは合成比率信号COMが示す合成比率k1〜k3が示す比率で、基本奥行きモデルタイプA〜Cの画像を合成して合成奥行きモデルとなる画像信号を生成する。
【0078】
図9は、奥行きモデル合成部206の一例のブロック図を示す。同図に示すように、奥行きモデル合成部206は、スイッチ205により選択された制御信号CTL1又は合成比率信号COMが示す合成比率k1、k2、k3と、フレームメモリ207、208、209からの基本奥行きモデルタイプA、B、Cの各画像信号とを、乗算器2061、2062、2063において別々に乗算し、それら3つの乗算結果を加算器2064で加算して、得られた加算結果を奥行き推定データ生成手段である加算部212へ出力する構成である。
【0079】
図3において、制御信号判定部210は、CPU108より制御信号CTL2が供給されているか否かを判定する。制御信号判定部210は、制御信号CTL2が供給される場合は、その制御信号CTL2を重み付け部211に供給する。一方、制御信号CTL2が供給されていない場合、予め制御信号判定部210内に設定されている重み付け係数に相当するパラメータを含む制御信号CTL2を重み付け部211に供給する。
【0080】
重み付け部211は、制御信号判定部210から供給される制御信号CTL2に含まれる最大値を「1」とする重み付け係数と、画像入力部201から供給される復号画像信号aのR信号成分とを乗算して、復号画像信号aのR信号成分に重み付けをする。R信号成分は、画像入力部201において、輝度信号(Y)及び色差信号Crとから、R=Y+Crといった演算で算出される。
【0081】
なお、R信号成分を使用する理由の一つは、順光に近い環境で、かつ、テクスチャの明るさの度合い(明度)の変化が大きくない条件下で、R信号成分の大きさが原画像の凹凸と一致する確率が高いという経験則による。テクスチャとは、画像を構成する要素であり、単一の画素もしくは画素群で構成される。
【0082】
更に、R信号成分を使用するもう一つの理由として、赤色及び暖色は色彩学における前進色であり、寒色系よりも奥行きが手前に認識されるという特徴があり、この奥行きを手前に配置することで立体感を強調することが可能であるということである。
【0083】
なお、赤色及び暖色が前進色であるのに対し、青色は後退色であり、暖色系よりも奥行きが奥に認識される特徴がある。よって、青色の部分を奥に配置することによっても立体感の強調は可能である。更に双方を併用して、赤色の部分を手前、青色の部分を奥に配置することによって立体感を強調することも可能である。
【0084】
加算部212は、奥行きモデル合成部206より供給される合成奥行きモデルの画像信号と、重み付け部211から供給される重み付けされた復号画像信号aのR信号成分とから、奥行き推定データdを生成する。例えば、奥行きモデル合成部206より供給される合成奥行きモデルの画像信号に、重み付け部211から供給される重み付けされた復号画像信号aのR信号成分を重畳して、奥行き推定データdを生成する。重畳した値が奥行き推定データdに割り当てられる所定のビット数を超える場合は、所定のビット数に制限される。生成された奥行き推定データdは、ステレオペア生成部300に供給される。また、CPU108にも供給される。
【0085】
次に、ステレオペア生成部300の構成及び動作について説明する。図4は、ステレオペア生成部300の一例のブロック図を示す。制御信号判定手段である制御信号判定部301は、CPU108より制御信号CTL3が供給されているか否かを判定する。制御信号CTL3が供給されていない場合、予め制御信号判定部301内に設定されている輻輳及び奥行きを表す2つのパラメータをテクスチャシフト部302に供給する。制御信号CTL3が供給されている場合、その制御信号CTL3に含まれている輻輳及び奥行きを表す2つのパラメータをテクスチャシフト部302に供給する。
【0086】
テクスチャシフト手段であるテクスチャシフト部302は、供給される復号画像信号aと奥行き推定データdと制御信号判定部301からの輻輳及び奥行きを表す2つのパラメータとに基づいて、復号画像信号aとは別視点の画像信号を生成する。例えば、テクスチャシフト部302は、復号画像信号aを画面表示させた場合の視点を基準にして、左に視点移動した画像信号を生成する。その場合、テクスチャシフト部302は、ユーザーに対してテクスチャを近景として表示させるときは、近い画像ほどユーザーの内側(鼻側)に見えるので、画面右側へテクスチャを奥行きに応じた量だけ移動した画像信号を生成する。また、テクスチャシフト部302は、ユーザーに対してテクスチャを遠景として表示させるときは、遠い画像ほどユーザーの外側に見えるので、画面左側へテクスチャを奥行きに応じた量だけ移動した画像信号を生成する。
【0087】
ここでは、それぞれの画素に対する奥行き推定データdを8ビットの値Ddで表すものとする。テクスチャシフト部302は、Ddの小さい値(すなわち、画面奥に位置するもの)から順に、そのDdに対応する復号画像信号aのテクスチャをそれぞれの画素毎に(Dd−m)/n画素分右にシフトした画像信号を生成する。上記のmは飛び出し感を表すパラメータ(輻輳値)であり、上記のnは奥行きを表すパラメータ(奥行き値)である。
【0088】
なお、ユーザーには、奥行き推定データdを示す値Ddの小さいテクスチャは画面奥側に見え、奥行き推定データdを示す値Ddの大きいテクスチャは画面手前に見える。奥行き推定データdを示す値Dd、輻輳値m、奥行き値nは0〜255の範囲の値であり、例えば、制御信号判定部301に予め設定されている値は、輻輳値m=200、奥行き値n=20である。
【0089】
オクルージョン補償部303は、テクスチャシフト部302より出力された別視点の画像信号に対してオクルージョンの補償を行い、オクルージョン補償された画像信号をポスト処理部304に供給する。オクルージョンとは、テクスチャをシフトした結果、画像中の位置関係変化によりテクスチャの存在しない部分のことをいう。オクルージョン補償部303は、テクスチャシフトされた画像信号に対応する元の復号画像信号aによりオクルージョンの箇所を充填する。また、公知の文献(山田邦男、望月研二、相澤清晴、齊藤隆弘:"領域競合法により分割された画像のテクスチャの統計量に基づくオクルージョン補償”、映像情報学会誌、Vol.56,No.5,pp.863〜866(2002.5))に記載の手法でオクルージョンを補償してもよい。
【0090】
ポスト処理手段であるポスト処理部304は、オクルージョン補償部303によりオクルージョン補償された画像信号に対して、平滑化やノイズの除去などのポスト処理を公知の方法で必要に応じて行い、左目用画像信号e1を出力する。なお、2D3D変換部115は、録再I/F部114により記録媒体から再生された復号画像信号aを右目用画像信号e2とする。
【0091】
図1において、表示I/F部116は、2D3D変換部115から出力される右目用画像信号e2とポスト処理された左目用画像信号e1とを入力信号として受け、その入力信号をステレオ画像表示に対応したモニタ(図示せず)に出力する。これにより、ユーザーはステレオ画像を見ることができる。以上のようにして、記録媒体から再生した画像データに基づく擬似立体画像の生成と擬似立体画像の表示とが行われる。
【0092】
次に、本実施形態の要部の動作について更に詳細に説明する。
【0093】
ユーザーがビデオカメラ100で撮影した非立体画像を擬似立体画像に変換する場合に、ユーザーが製作者となることなく、擬似立体画像生成用パラメータを自動的に調整するための制御信号CTL1〜CTL3の生成方法について具体的に説明する。
【0094】
CPU108は、録再I/F部114が図示しない記録媒体から読み出した多重化データのうち、測距エリアの位置、被写体までの推定距離、推定被写界深度、被写体が顔か否かのデータ、顔の場合の顔の大きさのデータなど各種データを取得する。そして、CPU108は、この取得データと2D3D変換部115から供給される奥行き推定データdとから、以下のように制御信号CTL1〜CTL3を算出する。
【0095】
CPU108は、測距エリアの撮影画面内での位置が画面の水平方向の中央で、かつ、被写体までの推定距離が所定の閾値1よりも小さい場合には、そうでない場合よりも基本奥行きモデルタイプCの混合比率が高くなるように制御信号CTL1を生成する。その理由は、近距離にある被写体が主たる被写体であり、再生鑑賞する際に注視する部分であることが多い。従って、基本奥行きモデルタイプAやBのように画面中央ほど遠方に配置されるモデルでは、注視部分が遠方になってしまい、違和感があるためである。
【0096】
また、CPU108は、被写体が顔であって、正規化した顔の大きさが所定の閾値2より大きい場合には、被写体の胸から上を含めた顔全体を捉えたショットであるバストショットの確率が高いので、そうでない場合よりも基本奥行きモデルタイプCの混合比率が高くなるように制御信号CTL1を生成する。これは、上記の理由と同じ理由に基づく。同様に、推定被写界深度が浅い値であるほど基本奥行きモデルタイプCの混合比率が高くなるように制御信号CTL1を生成する。焦点が合っていない部分の奥行きに変化があると違和感があるからである。
【0097】
さらに、CPU108は、測距エリアの撮影画面内での位置が画面の水平方向の右端または左端で、かつ、被写体までの推定距離が所定の閾値3よりも小さい場合には、基本奥行きモデルタイプBの混合比率がそうでない場合よりも高くなるように制御信号CTL1を生成する。その理由は、注視する部分が画面の水平方向の右端又は左端であると考えられるので、その部分を画面手前に、他の部分を画面奥側に配置するモデルにした方が違和感が少ないためである。
【0098】
また、CPU108は、被写体までの推定距離が所定の閾値4よりも大きい場合には、基本奥行きモデルタイプAの混合比率がそうでない場合よりも高くなるように制御信号CTL1を生成する。その理由は、画面に拡がり感を持たせることで擬似立体画像に迫力がでるからである。
【0099】
これら以外の場合には制御信号CTL1を出力しない。従って、上記以外の場合は、スイッチ205は合成比率信号COMを出力する。 また、CPU108は、主たる被写体が顔であって、正規化された顔の大きさが所定の閾値5より大きい場合には、制御信号CTL2に含まれる重み付け係数を、それ以外の場合よりも大きな値とする。その理由は、顔の肌色部分にはR信号成分が含まれるため、重み付け係数を大きくすることで顔が周囲よりも画面の手前に配置されるので、擬似立体画像としての印象が強くなるからである。
【0100】
更に、CPU108は、推定被写界深度が深い値であるほど、制御信号CTL2に含まれる重み付け係数を、それ以外の場合よりも大きな値とする。これは、推定被写界深度が深い値である場合、画面内の多くの部分がぼけないで映っていることが多く、2次元画像(非立体画像)で見ると、奥行き感が失われている状態となるので、奥行き感を持たせるためである。
【0101】
また、CPU108は、奥行き推定データdのそれぞれの画素のうち、測距エリアの撮影画面内での位置に相当する複数の画素の奥行き推定データdを示す値Ddの平均値を求める。この平均値をmとする。すなわち、輻輳及び奥行きを制御する制御信号CTL3のうちの輻輳値mが算出される。従って、前述のシフト量(Dd−m)/n画素分の式から、測距エリアの撮影画面内での位置に相当する領域が、シフト量0の領域となる。右目用と左目用の画像データでシフト量が0の領域は、立体表示ではモニタの実際の表示面に位置して見えるようにする。これは、測距エリアには、主たる被写体が存在し、再生鑑賞する際の注視部分であると考えられることから、その部分を常にモニタの実際の表示面に位置させることで、安定した印象を与えることが目的である。
【0102】
更に、CPU108は、推定被写界深度が深い値であるほど、制御信号CTL3のうちの奥行き値nの値を小さくする。すなわち、立体画像としての奥行きを大きくする。逆に、推定被写界深度が浅い値であるほど、CPU108は制御信号CTL3のうちの奥行き値nの値を小さくする。すなわち、立体画像としての奥行きを小さくする。
【0103】
これは次の理由による。推定被写界深度が深い値である場合、画面内の多くの画像部分がぼけないで映っていることが多い。この場合、2次元画像(非立体画像)で見ると、奥行き感が失われている状態となる。これを2D3D変換で補うことで、奥行き感を得ることができる。逆に、推定被写界深度が浅い値である場合には、焦点が合ったように見える画像部分が限定されていることが多く、2次元画像(非立体画像)で見ても、奥行き感が感じられる。この状態で2D3D変換により、更に奥行き感を加えると、ユーザーには目の焦点の位置まで強制されているように感じてしまい、不快な感じを抱くことがあるからである。
【0104】
また、CPU108は、主たる被写体が顔であって、正規化された顔の大きさが所定の閾値5より大きい場合には、制御信号CTL3のうちの奥行き値nの値をそれ以外の場合よりも小さくする。すなわち、立体画像としての奥行きを小さくする。
【0105】
なお、以上の制御信号CTL1〜CTL3の値は、連続するフレームにおいて時間的な連続を考慮して生成する。すなわち、値の変更が時間的に緩やかであるようにする。急激な変更には擬似立体画像を見るユーザーの視覚感覚がついていけないからである。
【0106】
以上のように、本実施形態によれば、非立体画像である撮影画像から奥行き情報を推定して擬似立体画像を生成する場合に、第1乃至第3の制御信号によって複数の基本奥行きモデルタイプの画像の合成比率や非立体画像信号の重み付け係数やテクスチャシフトの際の奥行き値や輻輳値を制御する際に、画面毎に得られる撮影時のパラメータから第1乃至第3の制御信号の値を最適な奥行きモデルが得られるように自動的に可変するようにしたため、ユーザーが撮影シーンなどに応じて個々に設定しなくても、どのような非立体画像のシーンであっても、違和感のない、現実のイメージにより近い擬似立体画像を生成することができる。
【0107】
また、本実施形態によれば、被写体が顔である場合には人物撮影に適した奥行き感を与えることができる。更に、合焦している領域である測距エリアがモニタの実際の表示面に位置して見えることで、安定した擬似立体画像を表示できる。また、本実施形態では、制御信号CTL1〜CTL3の値の変更を時間的に緩やかにするようにしているため、ボケ量と奥行きの関係がユーザーにとって違和感のない自然なものにできる。
【0108】
<第2の実施形態>
次に、本発明の第2の実施形態について説明する。図10は、本発明になる擬似立体画像生成装置を備えたビデオカメラの第2の実施形態のブロック図を示す。同図中、図1と同一構成部分には同一符号を付し、その説明を省略する。図10に示す第2の実施形態のビデオカメラ150は、再生した画像データに対して2D3D変換を行うのではなく、撮影した画像信号に対して2D3D変換を行い、その結果を記録する点でビデオカメラ100と相違する。
【0109】
このビデオカメラ150は、所望の撮影モードによる被写体の撮影、撮影した画像データに基づく擬似立体画像の生成と、その擬似立体画像の記録媒体への記録、記録媒体から再生した擬似立体画像の表示を適宜選択して行う。
【0110】
撮影時において、ビデオカメラ150内の画像記憶部151は、信号処理部111から出力される被写体画像のデジタル値の輝度信号(Y)及び色差信号(Cb,Cr)を順次格納する点は画像記憶部112と同様であるが、格納した輝度信号(Y)及び色差信号(Cb,Cr)をCPU152と2D3D変換部115にそれぞれ出力する点で画像記憶部112と異なる。
【0111】
CPU152は、画像記憶部151から読み出された1フレーム分の輝度信号(Y)及び色差信号(Cb,Cr)と、ズームレンズ101の移動位置、フォーカスレンズ102の移動位置及び絞り103の絞り量などの取得情報と、メモリ109に格納されている被写体距離推定テーブルや被写界深度テーブルなどを用いて、CPU108と同様にしてフレーム毎の測距エリアの撮影画面内での位置データ、フォーカスレンズ102の合焦位置から被写体までの推定距離のデータ、被写界深度の推定データ及び被写体が顔か否かのデータ、更に顔の場合には顔の大きさのデータを生成する。
【0112】
続いて、CPU152は、生成したそれら各種のデータと2D3D変換部115から供給される奥行き推定データdとから、第1の実施形態で説明したと同様の方法により制御信号CTL1〜CTL3を算出して2D3D変換部115に供給する。
【0113】
2D3D変換部115は、画像記憶部151から読み出された、非立体画像信号である輝度信号(Y)及び色差信号(Cb,Cr)と、CPU152で算出された制御信号CTL1及びCTL2とに基づいて、第1の実施形態で説明したと同様の方法により奥行き推定データdを生成してCPU152に出力すると共に、非立体画像信号(Y,Cb,Cr)と制御信号CTL1〜CTL3とに基づいて、左目用画像信号e1及び右目用画像信号e2を生成する。そして、2D3D変換部115は、生成した左目用画像信号e1及び右目用画像信号e2を画像処理部153に供給する。
【0114】
画像処理部153は、2D3D変換部115から供給される左目用画像信号e1及び右目用画像信号e2を、それぞれ独立に公知のMPEG−2方式やMPEG−4 AVC方式によって符号化する。あるいは、画像処理部153は、2D3D変換部115から供給される左目用画像信号e1及び右目用画像信号e2を一組の擬似立体画像信号として、例えばMPEG−4MVC(Moving Picture Experts Group 4 Multiview Video Coding)方式に基づいて符号化する。
【0115】
録再I/F部114は、画像処理部153において符号化された画像信号が画像データバス117を介して入力され、その入力された符号化画像信号を図示しない記録媒体に記録する。
【0116】
本実施形態によれば、撮影した被写体画像の擬似立体画像信号を記録媒体に記録することができるので、このビデオカメラ150で記録媒体から擬似立体画像信号を再生する場合に限らず、他の装置でこのビデオカメラ150で記録した記録媒体から擬似立体画像信号を再生して表示させることができる。
【0117】
<第3の実施形態>
次に、本発明の第3の実施形態について説明する。図11は、本発明になる擬似立体画像生成装置を備えたビデオカメラの第3の実施形態のブロック図を示す。同図中、図1と同一構成部分には同一符号を付し、その説明を省略する。図11に示す第3の実施形態のビデオカメラ170は、ビデオカメラ100の構成に手振れセンサ171及び姿勢センサ172を追加した構成である。
【0118】
手振れセンサ171は、ジャイロセンサなどで構成され、カメラの搖動を測定して、その測定結果をCPU173に出力する。また、手振れセンサ171は、カメラのパンニング、チルティング操作を測定する手段ともなっている。カメラの搖動をジャイロセンサなどで測定した場合、その角速度成分の周波数が3〜10Hzであれば、その搖動は手振れによるものであると考えられる。一方、一定時間、一定方向にカメラを動かすパンニング、チルティング操作の場合、ほぼ直流成分の角速度となる。すなわち、手振れセンサ171からの出力信号であるカメラの搖動の測定結果を用いて、CPU173で演算することで、その搖動が手振れによるものであるか、パンニング、チルティング操作によるものであるかを推定し、更にいずれの場合も揺れの大きさを算出する。
【0119】
なお、カメラの搖動は、ジャイロセンサなどによらない方法で算出してもよい。例えば、公知のように、撮影画面のあるフレームと次のフレームで画面内の全被写体の動きベクトルの平均値を算出し、その動きベクトルの画面毎の変動をカメラの搖動として測定してもよい。
【0120】
姿勢センサ172は、重力センサなどで構成され、ここでは撮像素子104の光軸周りのロール角度を測定して、その測定結果をCPU173に出力する。撮像素子104の光軸周りのロール角度は、水平線を撮影したときに、撮影画面で水平線が水平になる場合が0°であり、水平線が右下がりに撮影される場合が+a°(aは正数)、水平線が左下がりに撮影される場合が−a°(aは正数)である。
【0121】
CPU173は、本発明における被写体の顔の大きさ情報取得手段、ビデオカメラ170から被写体までの推定距離を算出する被写体推定距離算出手段、推定被写界深度を算出する被写界深度算出手段、撮像画面内の測距エリアの位置データを取得する位置データ取得手段、制御信号CTL1〜CTL3を算出する制御信号算出手段、手振れ検出手段、撮像素子の光軸周りのロール角度検出手段、及び撮影シーン情報取得手段を構成している。なお、手振れ検出手段が検出する手振れ情報には、前述した手振れによるカメラの搖動の大きさ情報だけでなく、パンニング及びチルティングの大きさ情報も含まれる。
【0122】
すなわち、CPU173は、第1の実施形態で前述した、測距エリアの位置、被写体までの推定距離、推定被写界深度、被写体が顔か否かのデータ、顔の場合の顔の大きさのデータなど各種データに、更に手振れセンサ171により得られたカメラの搖動の大きさ情報と、パンニング、チルティングの大きさ情報と、姿勢センサ172により得られた撮像素子104の光軸周りのロール角度情報とを多重化する。
【0123】
なお、被写体までの推定距離は、第1の実施形態と同様に山登り法で求めてもよいし、赤外線を照射してその反射波を観測する方式や、いわゆる位相差検出方式を用いてもよい。また、被写体までの推定距離は、フォーカスレンズと被写体までの距離であってもよいし、カメラの他の部分と被写体までの距離であってもよい。
【0124】
また、CPU173は、画像記憶部112に格納されている1フレーム分の輝度信号(Y)及び色差信号(Cb,Cr)を読み出し、色相(H)、彩度(S)、明度(V)に変換する。更に、CPU173は、1フレーム分の画面を、例えば横30、縦20に分割した各ブロックのそれぞれで、ブロック内の信号の色相(H)、彩度(S)、明度(V)の平均値を算出して、その算出結果をメモリ174に格納する。メモリ174には、現在の1フレームの算出結果と、一つ前のフレームの算出結果とが格納される。なお、メモリ174には、CPU173の動作用プログラムの他に、メモリ109と同様に、被写体距離推定テーブル及び被写界深度テーブルが格納されている。
【0125】
CPU173は、これらの算出結果と前述の被写体までの推定距離とから撮影シーンを判定する。例えば、画面上部の多くのブロックの明度(V)が明るく、色相(H)が青で、推定距離が所定の閾値より大きい場合は、昼間の風景撮影シーンと判定する。また、CPU173は、一画面全体において、一つ前のフレームの明度(V)と現在のフレームの明度(V)とを、画面内の同じ位置に相当するブロック同士で比較して、変化の大きさが第1の閾値よりも大きいブロックの数が第2の閾値よりも多い場合には、被写体の動きが多いと判断してスポーツ撮影シーンと判定する。また、CPU173は、画面中央のブロックの色相(H)が赤や青で、彩度(S)が第3の閾値より大きく、被写体までの推定距離が第4の閾値より小さい場合は、花のマクロ撮影シーンと判定する。
【0126】
CPU173は、これらの撮影シーン情報についても、上記の手振れによる振動の大きさ情報及び光軸周りのロール角度情報と、第1の実施形態で説明した各種データと共に多重化して、録再I/F部114に供給する。録再I/F部114は、供給された多重化データと、対応するフレームの符号化画像データと共に図示しない記録媒体に対応付けて記録する。
【0127】
次に、このビデオカメラ170の再生信号に基づく擬似立体画像信号生成動作について説明する。録再I/F部114は、図示しない記録媒体から読み出したデータのうち、符号化画像データは画像データバス117を介して画像処理部113に供給する一方、符号化画像データ以外の測距エリアの位置、被写体までの推定距離、推定被写界深度、被写体が顔か否かのデータ、顔の場合の顔の大きさのデータ、手振れによるカメラの搖動の大きさ情報、パンニング、チルティングの大きさ情報及び撮像素子の光軸周りのロール角度情報、及び撮影シーン情報を画像データバス117を介してCPU173に供給する。
【0128】
CPU173は、この録再I/F部114から供給されるデータと、2D3D変換部115から供給される奥行き推定データdとから、以下のように制御信号CTL1〜CTL3を算出する。なお、CPU173による制御信号CTL1〜CTL3の算出動作は、CPU108による制御信号CTL1〜CTL3の算出動作と同じ算出動作も含むが、その説明は既に説明したので省略し、本実施形態特有の制御信号CTL1〜CTL3の算出動作について以下説明する。
【0129】
CPU173は、撮影シーン情報がスポーツ撮影シーンを示しているときには、基本奥行きモデルタイプCの混合比率が、そうでない場合よりも高くなるように制御信号CTL1を生成する。その理由は、スポーツ撮影シーンの場合、撮影対象の動きが激しいことが多く、画面の中央だけでなく画面の端の方にも撮影対象が動きまわるため、基本奥行きモデルタイプAやBのように、画面中央ほど画面奥側に配置されるモデルでは距離感の変化が大きく、擬似立体画像を視聴するユーザーの違和感につながることがあり、それを防止するためである。
【0130】
また、CPU173は、パンニング、チルティングの大きさ情報の値が所定の閾値よりも大きい場合には、基本奥行きモデルタイプCの混合比率が、そうでない場合よりも高くなるように制御信号CTL1を生成する。その理由は、パンニングを行う場合、それまでは画面の左右の端にあった被写体が画面中央に移動することになる。その場合、その被写体の奥行き感が画面の左右の端にあった時と画面の中央にある時とで異なることになるのは不自然なので、そのような事態を防止するためである。
【0131】
また、CPU173は、撮影シーン情報が昼間の風景撮影シーンを示しているときには、基本奥行きモデルタイプAの混合比率が、そうでない場合よりも高くなるように制御信号CTL1を生成する。その理由は、画面の拡がり感を持たせることで、擬似立体画像に迫力がでるからである。
【0132】
また、CPU173は、撮影シーン情報が花のマクロ撮影シーンを示しているときには、制御信号CTL2に含まれる重み付け係数を、それ以外の場合よりも大きな値とする。これは、重み付け係数を大きくすることで、R信号成分を含む花の画像が画面手前に配置され、擬似立体画像としての印象が強くなるためである。
【0133】
一方、CPU173は、光軸周りのロール角度情報が0°から離れているほど、制御信号CTL2に含まれる重み付け係数を小さくする。その理由は、光軸周りのロール角度情報が0°から離れているほど、撮影画面が水平線に対して傾いた状態で撮影が行われており、再生視聴時に立体感を強調すると、ユーザーの画像視聴中の姿勢は傾いていないために違和感があるため、これを防止するためである。同様に、手振れによる振動の大きさが大きいほど、制御信号CTL2に含まれる重み付け係数を小さくする。画面が揺れている状態で立体感を強調すると、ユーザーの画像視聴中の姿勢は傾いていないために違和感があるからである。
【0134】
また、CPU173は、手振れによる振動の大きさが大きいほど、制御信号CTL3のうちの奥行き値nの値を大きくする。すなわち、立体画像としての奥行きを小さくする。手振れによる振動が大きい場合には、再生視聴時に画面の揺れが画像を見るユーザーに感知されるので、2次元画像(非立体画像)で見ても乗り物に酔ったような感じがする。この状態で2D3D変換して得た擬似立体画像を見ると、更に酔ったような感じが強くなる。これを防止するために、手振れによる振動の大きさが大きいほど、立体画像としての奥行き感を減らすのである。
【0135】
また、CPU173は、光軸周りのロール角度情報が0°から離れているほど、制御信号CTL3のうちの奥行き値nの値を大きくする。すなわち、立体画像としての奥行きを小さくする。その理由は、光軸周りのロール角度情報が0°から離れているほど、撮影画面が水平線に対して傾いた状態で撮影が行われており、表示される画像が画面の水平線に対して傾いているのに対し、表示画像を見るユーザーの両目の高さは表示画像の傾きに追従していないことが多いので、この状態で2D3D変換して得た擬似立体画像を奥行き感が大きな状態で表示すると、ユーザーの違和感が大きくなる、ということを防止するためである。
【0136】
また、CPU173は、撮影シーン情報がスポーツ撮影シーンを示しているときには、制御信号CTL3のうちの奥行き値nの値を大きくする。すなわち、立体画像としての奥行きを小さくする。この場合は、撮影対象の動きが激しいので、右目用画像と左目用画像との視差の時間的な変動も大きく、奥行き感の大きな擬似立体画像をユーザーが視聴した場合、ユーザーの疲労感につながるおそれがあるので、それを防止するためである。
【0137】
更に、CPU173は、撮影シーン情報が昼間の風景撮影シーンを示しており、手振れによる振動の大きさが第1の所定値よりも小さく、光軸周りのロール角度が0°に近く、被写体までの推定距離が第2の所定値よりも大きいという条件を満たしている場合は、制御信号CTL3のうちの奥行き値nの値を小さくする。すなわち、立体画像としての奥行きを大きくする。その理由は、この場合の画像に対しては、生成される擬似立体画像の奥行き感を強く持たせることで、臨場感を高めることができるためである。
【0138】
このように、本実施形態によれば、撮影時のパラメータを用いて2D3D変換部115に供給する制御信号CTL1〜CTL3を自動的に制御するようにしたので、ユーザーが撮影シーンなどに応じて個々に設定しなくても最適な奥行きモデルが自動的に生成される。特に本実施形態では、制御信号CTL1〜CTL3を自動的に制御する撮影時のパラメータとして、手振れによるカメラの搖動の大きさ情報、パンニング、チルティングの大きさ情報、光軸周りのロール角度情報及び撮影シーン情報を含んでいるため、スポーツ撮影シーン、昼間の風景撮影シーン、花のマクロ撮影シーンなどの撮影シーンに応じて、また画面の水平線に対して傾いている非立体画像や、画面内での揺れが大きな非立体画像に対して、最適な奥行きモデルの擬似立体画像を生成して、擬似立体画像を視聴するユーザーの違和感や疲労感を抑制し、更に迫力や臨場感のある擬似立体画像を生成して表示することができる。
【0139】
なお、本発明は以上の実施形態に限定されるものではなく、例えば、以上の各実施形態の擬似立体画像生成動作をCPU108、152、又は173により実行させる擬似立体画像生成プログラムも本発明に含まれる。この場合、擬似立体画像生成プログラムは、記録媒体からCPUに取り込まれてもよいし、通信ネットワークを通して配信されてCPUに取り込まれてもよい。
【0140】
また、本発明は第2の実施形態のビデオカメラ150に、手振れセンサや姿勢センサを追加して、これらにより得られた手振れによるカメラの搖動の大きさ情報、パンニング、チルティングの大きさ情報及び撮像素子の光軸周りのロール角度情報を用いて第3の実施形態と同様にして最適な奥行きモデルの擬似立体画像信号を生成し、その擬似立体画像信号を記録媒体に記録する構成も含む。さらに、基本奥行きモデルタイプの画像は前述したA、B、Cの立体構造に限定されるものではなく、また3種類以外の複数種類であってもよい。
【符号の説明】
【0141】
100、150、170 ビデオカメラ
101 ズームレンズ
102 フォーカスレンズ
103 絞り
104 撮像素子
105 ズームレンズ駆動部
106 フォーカスレンズ駆動部
107 絞り駆動部
108、152、173 中央処理装置(CPU)
109、174 メモリ
112、151 画像記憶部
113、153 画像処理部
114 録再I/F部
115 2D3D変換部
118 操作部
171 手振れセンサ
172 姿勢センサ
200 奥行き推定データ生成部
202 画面上部の高域成分評価部
203 画面下部の高域成分評価部
204 合成比率決定部
205 スイッチ
206 奥行きモデル合成部
207〜209 フレームメモリ
210、301 制御信号判定部
211 重み付け部
212 加算部
300 ステレオペア生成部
302 テクスチャシフト部
303 オクルージョン補償部
304 ポスト処理部

【特許請求の範囲】
【請求項1】
ズームレンズ、フォーカスレンズ及び絞りを含む光学系を通して撮像素子の撮像面に結像された被写体の光学像を、前記撮像素子により光電変換して得られた非立体画像信号から前記被写体が人物であるとき、その人物の顔の大きさ情報を取得する顔の大きさ情報取得手段と、
前記非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、
前記複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、前記基本奥行きモデル発生手段から供給される前記複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、
前記非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、前記非立体画像信号に対して前記第2の制御信号が示す前記重み付け係数を乗算する重み付け手段と、
前記重み付け手段により重み付けされた前記非立体画像信号と、前記奥行きモデル合成手段により生成された前記奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、
奥行きと輻輳とを示す第3の制御信号により前記奥行きと輻輳とが調整された前記奥行き推定データに基づいて、前記非立体画像信号のテクスチャをシフトして、前記擬似立体画像信号を生成するテクスチャシフト手段と、
前記第1〜第3の制御信号をそれぞれ算出して出力する際に、前記顔の大きさ情報を用いて、算出する前記第1〜第3の制御信号のうちの少なくともいずれか一つの制御信号の値を可変する制御信号算出手段と
を有することを特徴とする擬似立体画像生成装置。
【請求項2】
光学系を構成するズームレンズ及びフォーカスレンズの各位置をそれぞれ取得するレンズ位置取得手段と、
前記レンズ位置取得手段で取得された前記ズームレンズ位置及び前記フォーカスレンズの位置に基づいて、前記フォーカスレンズの位置から前記被写体までの推定距離を算出する被写体推定距離算出手段と、
前記光学系を通して撮像素子の撮像面に結像された被写体の光学像を、前記撮像素子により光電変換して得られた非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、
前記複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、前記基本奥行きモデル発生手段から供給される前記複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、
前記非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、前記非立体画像信号に対して前記第2の制御信号が示す前記重み付け係数を乗算する重み付け手段と、
前記重み付け手段により重み付けされた前記非立体画像信号と、前記奥行きモデル合成手段により生成された前記奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、
奥行きと輻輳とを示す第3の制御信号により前記奥行きと輻輳とが調整された前記奥行き推定データに基づいて、前記非立体画像信号のテクスチャをシフトして、前記擬似立体画像信号を生成するテクスチャシフト手段と、
前記第1乃び第3の制御信号をそれぞれ算出して出力する際に、算出された前記被写体までの推定距離の情報を用いて、算出する前記第1及び第3の制御信号のうちの少なくともいずれか一方の制御信号の値を可変する制御信号算出手段と
を有することを特徴とする擬似立体画像生成装置。
【請求項3】
光学系を構成するズームレンズの位置、フォーカスレンズの位置及び絞りの絞り値をそれぞれ取得する光学系情報取得手段と、
前記光学系情報取得手段で取得された前記絞り値及び前記ズームレンズ位置に基づいて、推定被写界深度を算出する被写界深度算出手段と、
前記光学系を通して撮像素子の撮像面に結像された被写体の光学像を、前記撮像素子により光電変換して得られた非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、
前記複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、前記基本奥行きモデル発生手段から供給される前記複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、
前記非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、前記非立体画像信号に対して前記第2の制御信号が示す前記重み付け係数を乗算する重み付け手段と、
前記重み付け手段により重み付けされた前記非立体画像信号と、前記奥行きモデル合成手段により生成された前記奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、
奥行きと輻輳とを示す第3の制御信号により前記奥行きと輻輳とが調整された前記奥行き推定データに基づいて、前記非立体画像信号のテクスチャをシフトして、前記擬似立体画像信号を生成するテクスチャシフト手段と、
前記第1〜第3の制御信号をそれぞれ算出して出力する際に、算出された前記推定被写界深度の情報を用いて、算出する前記第1〜第3の制御信号のうちの少なくともいずれか一つの制御信号の値を可変する制御信号算出手段と
を有することを特徴とする擬似立体画像生成装置。
【請求項4】
光学系を構成するズームレンズ及びフォーカスレンズの各位置をそれぞれ取得するレンズ位置取得手段と、
前記光学系を通して撮像素子の撮像面に結像された被写体の光学像を、前記撮像素子により光電変換して得られた非立体画像信号のうち、前記撮像素子の撮像画面内の所定の小領域である測距エリア内の前記非立体画像信号の高域成分が最大となる合焦位置を求めるために、前記フォーカスレンズの位置を移動制御する自動焦点調節手段と、
前記撮像画面内の前記測距エリアの位置データを取得する位置データ取得手段と、
前記フォーカスレンズの合焦位置から前記被写体までの推定距離を算出する被写体推定距離算出手段と、
前記非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、
前記複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、前記基本奥行きモデル発生手段から供給される前記複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、
前記非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、前記非立体画像信号に対して前記第2の制御信号が示す前記重み付け係数を乗算する重み付け手段と、
前記重み付け手段により重み付けされた前記非立体画像信号と、前記奥行きモデル合成手段により生成された前記奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、
奥行きと輻輳とを示す第3の制御信号により前記奥行きと輻輳とが調整された前記奥行き推定データに基づいて、前記非立体画像信号のテクスチャをシフトして、前記擬似立体画像信号を生成するテクスチャシフト手段と、
前記第1〜第3の制御信号をそれぞれ算出して出力する際に、前記測距エリアの位置データと前記被写体までの推定距離とに応じて、算出する前記第1及び第3の制御信号のうち少なくともいずれか一方の制御信号を可変する制御信号算出手段と
を有することを特徴とする擬似立体画像生成装置。
【請求項5】
光学系を通して撮像面に結像された被写体の光学像を光電変換して非立体画像信号を得る撮像素子の搖動の大きさ情報と、パンニング、チルティングの大きさ情報とからなる手振れ情報を検出する手振れ検出手段と、
前記撮像素子により得られた前記非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、
前記複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、前記基本奥行きモデル発生手段から供給される前記複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、
前記非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、前記非立体画像信号に対して前記第2の制御信号が示す前記重み付け係数を乗算する重み付け手段と、
前記重み付け手段により重み付けされた前記非立体画像信号と、前記奥行きモデル合成手段により生成された前記奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、
奥行きと輻輳とを示す第3の制御信号により前記奥行きと輻輳とが調整された前記奥行き推定データに基づいて、前記非立体画像信号のテクスチャをシフトして、前記擬似立体画像信号を生成するテクスチャシフト手段と、
前記第1〜第3の制御信号をそれぞれ算出して出力する際に、前記手振れ情報を用いて、算出する前記第1〜第3の制御信号のうちの少なくともいずれか一つの制御信号の値を可変する制御信号算出手段と
を有することを特徴とする擬似立体画像生成装置。
【請求項6】
光学系を通して撮像面に結像された被写体の光学像を光電変換して非立体画像信号を得る撮像素子の光軸周りのロール角度を検出するロール角度検出手段と、
前記撮像素子により得られた前記非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、
前記複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、前記基本奥行きモデル発生手段から供給される前記複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、
前記非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、前記非立体画像信号に対して前記第2の制御信号が示す前記重み付け係数を乗算する重み付け手段と、
前記重み付け手段により重み付けされた前記非立体画像信号と、前記奥行きモデル合成手段により生成された前記奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、
奥行きと輻輳とを示す第3の制御信号により前記奥行きと輻輳とが調整された前記奥行き推定データに基づいて、前記非立体画像信号のテクスチャをシフトして、前記擬似立体画像信号を生成するテクスチャシフト手段と、
前記第1〜第3の制御信号をそれぞれ算出して出力する際に、前記ロール角度検出手段により検出されたロール角度検出情報を用いて、算出する前記第1及び第3の制御信号のうちの少なくともいずれか一方の制御信号の値を可変する制御信号算出手段と
を有することを特徴とする擬似立体画像生成装置。
【請求項7】
光学系を通して撮像面に結像された被写体の光学像を光電変換して、非立体画像信号を得る撮像素子を有するカメラにおいて、
前記カメラから被写体までの推定距離を算出する被写体推定距離算出手段と、
前記光学系を通して撮像面に結像された被写体の光学像を光電変換する撮像素子から出力される非立体画像信号の隣接する2フレーム間の信号変化と前記推定距離とに基づいて、撮影シーン情報を取得する撮影シーン情報取得手段と、
前記撮像素子から出力される前記非立体画像信号から擬似立体画像信号を生成するための基本となるシーンを示す複数の基本奥行きモデルタイプの画像を発生する基本奥行きモデル発生手段と、
前記複数の基本奥行きモデルタイプの画像の合成比率を示す第1の制御信号に基づいて、前記基本奥行きモデル発生手段から供給される前記複数の基本奥行きモデルタイプの画像を合成して奥行きモデルの画像を生成する奥行きモデル合成手段と、
前記非立体画像信号の重み付けをするための重み付け係数を示す第2の制御信号に基づいて、前記非立体画像信号に対して前記第2の制御信号が示す前記重み付け係数を乗算する重み付け手段と、
前記重み付け手段により重み付けされた前記非立体画像信号と、前記奥行きモデル合成手段により生成された前記奥行きモデルの画像とから、奥行き推定データを生成する奥行き推定データ生成手段と、
奥行きと輻輳とを示す第3の制御信号により前記奥行きと輻輳とが調整された前記奥行き推定データに基づいて、前記非立体画像信号のテクスチャをシフトして、前記擬似立体画像信号を生成するテクスチャシフト手段と、
前記第1乃至第3の制御信号をそれぞれ算出して出力する際に、前記撮影シーン情報取得手段により取得された前記撮影シーン情報を用いて、算出する前記第1乃至第3の制御信号のうちの少なくともいずれか一つの制御信号の値を可変する制御信号算出手段と
を有することを特徴とするカメラ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−223284(P2011−223284A)
【公開日】平成23年11月4日(2011.11.4)
【国際特許分類】
【出願番号】特願2010−89977(P2010−89977)
【出願日】平成22年4月9日(2010.4.9)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】