説明

距離情報を決定するための方法、距離マップを決定するための方法、コンピュータ装置、撮影システム、コンピュータプログラム

【課題】撮像して得た2つの画像から、シーンの距離情報を取得する。
【解決手段】シーンの第1,2の画像を取得する。第1の画像は第2の画像の撮影パラメータとは異なる少なくとも1つの撮影パラメータを使用して撮影されている。第1、2の画像から第1、2の画像パッチを選択する。第1、2の画像パッチは第1、2の画像のそれぞれにおいて撮影されたシーンの共通部分に対応している。第1、2の画像パッチのうちのどちらがより焦点が合った画像パッチであるかを決定する。第1、2の画像パッチのそれぞれにおけるデータの組合せに基づいて少なくとも1つの値を計算する。組合せは第1、2の画像パッチのうちのどちらがより焦点が合った画像パッチと決定されるかに依存している。少なくとも1つの計算された値からシーンの共通部分の距離情報を決定する。

【発明の詳細な説明】
【技術分野】
【0001】
関連特許出願の参照
本出願は、米国特許法第119条に基づいて、2011年9月14日に出願したオーストラリア特許出願第2011224051号の出願日の便益を主張するものであり、その全体を参照により本明細書に完全に記載されるものとして組み込む。
【0002】
本発明はデジタル画像処理に関し、より具体的には、シーンの画像からシーン内のオブジェクトへの距離を決定することに関する。
【背景技術】
【0003】
画像撮影の多くのアプリケーションでは、画像撮影装置の視野内の画像撮影装置からオブジェクトへの距離を決定することが好都合な場合がある。画像化されたシーン内のオブジェクトへのこのような距離の集まりは、距離マップ(depth map)と呼ばれることがある。画像化されたシーンの距離マップは画像として表されることがあり、シーンの画像自体とは異なる画素分解能の画像である場合があり、距離マップのそれぞれの画素に対応するオブジェクトへの距離はグレースケールまたは明度によって表される。
【0004】
距離マップによって、写真についてのいくつかの望ましい撮影後画像処理機能が可能になるため、消費者の写真撮影の分野で便利な場合がある。たとえば距離マップは、手動の後処理または創造的な写真効果の自動適用を可能にするために、前景および背景のオブジェクトを分割するために使用できる。距離マップは、より小さくより安価なレンズを使用して、高品質のレンズの芸術的に美しい段階的なぼけ(blur)を画像処理で付与することなどの、距離関連の写真効果を適用するためにも使用できる。
【0005】
写真シーンの距離マップを取得するあらゆる方法において、いくつかの機能が望ましい。距離精密度は重要であり、それがないと結果として得られる距離マップはオブジェクトが本当の距離とは著しく異なる距離にあることを示唆してしまう。距離分解能は、シーン内で相互に空間的に近いオブジェクトを分離できるようにするために、また距離に依存するぼけ付与などの正確な後処理操作を可能にするために重要である。多くのアプリケーションでは距離マップの空間分解能も重要であり、特に写真画像自体の分解能に取り組む距離マップは画素単位の分割にとって有用であり、多くの後処理操作における視覚的に明白なオブジェクト境界エラーを回避する。距離マッピング方法は、理想的には、反射率、色、テクスチャ、および方向などの、シーン内のオブジェクトの物理的性質に依存するべきではない。この特性はしばしばシーン非依存性と呼ばれる。さらに、距離マッピング方法がシーン内のオブジェクトのモーション、および画像撮影装置のモーションに寛容であることが望ましい。さらに距離マッピング方法は、追加のコスト、大きさ、重量、画像撮影および処理時間、ならびに電力消費を最小限に抑えた消費者向けカメラなどの実際の装置で実現できることが望ましい。
【0006】
シーンの画像から距離マップを決定するためのいくつかの方法が知られている。これらの方法は能動的な方法と受動的な方法に分類できる。能動的な距離マッピング方法は、光線または光のパターン、あるいは他の放射物をシーンに投影することを含む。距離は、反射した光線が戻ってくる時間を計ること、またはシーン内の三次元構造から反射する際のパターンの幾何学的な歪みを分析することによって測定できる。能動的な方法には投影光学が必要であり、それによって消費者の写真撮影などのアプリケーションに著しいコスト、重量、および電力問題が生じてしまう。さらに、能動的な方法は範囲が限られている。これらの理由から、写真撮影アプリケーションには能動的な方法よりも受動的な距離マッピング方法の方がより適している。
【0007】
知られているクラスの受動的な距離マッピング方法は、様々な視点からシーンの画像を撮影することを含む。次いでシーンの画像を分析して、立体感によって生じるシーンの画像内のオブジェクトの位置における明白な変化を決定できる。一般に、立体的な方法は複数の視点を必要とするという欠点がある。これは、画像を連続的に撮影することおよびショット間にカメラを移動することか、複数のカメラまたは複数のレンズを有するカメラを使用して画像を撮影することを必要とする。画像を連続的に撮影する場合、特に動いている被写体の場合はカメラの移動にかかる時間が問題となる場合があり、またカメラモーションの正確な位置合わせ(アライメント)または較正が必要である。同時撮影の場合、複数のカメラまたはレンズの必要性によって、撮影装置の構成の費用および困難さが増加する。
【0008】
他のクラスの受動的な距離マッピング方法は、1つの視点から1台のカメラによって撮影された複数のショットを使用する。これらの方法は、Depth from Focus(DFF)、およびDepth from Defocus(DFD)という2つのクラスにさらに分割できる。DFF方法は、広範囲の様々な焦点位置で撮影されたシーンの複数のショットを使用する。次いで、それぞれのショットから画像パッチを分析することによって、どのショットが所与の画像パッチ内に示されるオブジェクトにとっての最良の焦点位置に対応するかを決定でき、次にそのショットを較正された距離に関連付けることができる。DFF方法の主な欠点は、多数の画像を撮影する必要があり、結果として撮影時間が長くなり、動いているシーンについて著しい位置合わせ問題が生じ、また処理時間が長くなることである。
【0009】
DFD方法は、異なるカメラあるいは焦点や口径のような撮影パラメータを使用して少数の画像を撮影し、次いでシーンオブジェクトのぼけの量の差を分析するために画像を比較することによって、シーン内のオブジェクトへの距離を測定しようとする。次いで、既存の方法は、様々な理論的計算または経験的較正によって、このぼけの差のいくつかの測度を画像化されたオブジェクトの距離に関連付けようとする。DFD方法は、わずか2つの画像から距離を推定できる。
【0010】
上述の全ての距離マッピング方法の望ましい特徴、すなわち距離精密度、距離分解能、空間分解能、シーン非依存性、モーション寛容度、ならびにコスト、重量、大きさ、処理時間、および電力消費が低いことに加えて、特にDFD方法はさらに望ましい特徴要件がある。DFD方法はぼけの差の量化に依存して距離を確立する。したがって、実現可能なぼけの差の量がカメラ設計の実際の配慮によって制限されている場合、DFD方法がよく動作することが望ましい。特に、小型カメラは、コストを抑えて便利な大きさの製品を生産するために一般的に小さいレンズおよびセンサを有している。画像化システムのこれらの制約により、小さい光学系の大きな被写界深度のために、ぼけの差は比較的小さくなる(より大きいカメラと比較して)。たとえば、小型カメラで撮影された2つのショット間の実現可能な一般的なぼけの差は、1画素オーダーか、それよりも少ない。DFD方法の他の望ましい特徴は、この方法がカメラ光学系の現実的なモデルに基づくということである。これによって、ぼけの差の測度と画像撮影光学系のパラメータとの間になされるべき明瞭な理論的関係が可能になる。これによって、ぼけの差の測度とオブジェクトの距離との間の接続をさらに完全に理解できるようになり、異なる画像化シナリオまたは困難な画像化条件に適切な考察を与えられるようになる。
【0011】
DFD方法の一例は、1987年7月に発表された、Pentlandによる論文「A New Sense for Depth of Field」、IEEE Transactions on Pattern Analysis and Machine Intelligence,Vol.PAMI−9,No.4,pp.523〜531に記載されており、以下では「Pentland」と呼ぶ。この方法は、対称ガウス点広がり関数(PSF)の仮説(assumption)に基づいて画像ごとにぼけの半径を推定することによって、異なる口径で撮影された2つの画像間のぼけの量における差を計ろうとするものである。この仮定は、一般的なカメラレンズにとっては非現実的であるが、レンズ光学的伝達関数(OTF)が実ガウス関数であると仮定し、したがってこの仮定は距離推定(depth estimate)にエラーを生じさせる。さらに、ぼけの半径を計算するPentland方法はシーンテクスチャおよび画像ノイズの変化に非常に敏感である。この敏感性のため、本方法は自然風景の写真を撮影するカメラでの使用には適していない。
【0012】
DFD方法の他の例は、1993年に付与された米国特許第5,231,443号(Subbarao)に記載されている。この方法は、画像領域内の行または列を合計して、1次元(1D)フーリエ変換を実行して、次いでフーリエ成分の小さいサブセットを調べることによって、異なる撮影パラメータ(カメラパラメータ)で撮影された2つの画像間のぼけの量における差を計ろうとするものである。この方法は、射影切片定理によって画像領域の2次元(2D)フーリエ変換を通じて1D切片を調べることと等しい。通常、自然風景の写真には様々なテクスチャがある。これらのテクスチャの2次元フーリエ変換は、様々な主要な配向(dominant orientations)を有する。一般的なテクスチャは空間周波数軸に沿って低エネルギーを有し、それは、Subbaraoの方法が画像ノイズに敏感であり、距離推定に大きなエラーを生じさせてしまうことを意味する。シーンテクスチャの配向についてのこのエラーの変化は、距離マッピング方法には非常に不適当である。
【0013】
異なる理論的原理を使用するDFD方法の一例は、2006年6月にIEEE Computer Societyによって発表されたMcCloskey他による論文「The Reverse Projection Correlation Principle for Depth from Defocus」、Proceedings of the Third International Symposium on 3D Data Processing,Visualization,and Transmission,pp.607〜614に記載されている。この方法は、画素自己相関に基づく測度を使用してそれぞれの画像内のぼけの量を個々に推定して、次いで画像間のこの測度を比較することによって、2つの画像間のぼけの差を計ろうとするものである。この方法では、相関測度とぼけを生じさせる物理光学的原理との間に明瞭な理論的関係はない。したがって、様々な撮影条件の下で本方法の精密度を確立するのは困難である。この方法から得られるサンプルの距離にはノイズがある。
【0014】
DFD方法の他の例は、2010年6月21日に発表された、Aydin&Akgulによる論文「An occlusion insensitive adaptive focus measurement method」、Optics Express,Vol.18,No.13,pp.14212〜14224に記載されている。この方法は、画像の対応するパッチ間の相互相関を計算することによって2つの画像間のぼけの差を計ろうとするものである。これは画像パッチ間の類似の測度を作り、その測度はオブジェクトの距離と関係がある。ここでの問題点は、コントラストが高くてぼけのレベルが低いオブジェクトよりも、コントラストが低くてぼけの差が高いオブジェクトの方が、より似ているように見えることであり、このことは誤った距離割当てをもたらす。
【0015】
これらの例は、既存のDFD手法の欠点の例である。一般的にDFD方法の短所は、使用されるデータ量が比較的少ないこと、シーンテクスチャ変化および画像ノイズの影響、ならびにカメラまたは被写体のモーションによって生じる画像内のオブジェクト間のあらゆる位置合わせ不良のために距離推定がエラーになりやすいということ、ならびにオブジェクトの距離とぼけとの間の関係が複雑であるということである。多くのDFDアルゴリズムでは、カメラレンズの不正確なモデルを使用するカメラ較正方法、距離推定と物理光学的理論との間に理論的関係が弱いまたはないこと、ならびに1つまたは複数の画像ノイズ、画像位置合わせ不良、露出差、およびシーン内のオブジェクトのテクスチャの変化に対する距離推定感度が高いことのために、画像の分析から抽出される定量的測度とシーン内の実際の距離の間の関連性が乏しい。
【0016】
DFD方法は、小型カメラで撮影された画像に適用される場合に特に問題となる。レンズおよびセンサのサイズが小さいことによって、シーンの2つのショット間で実現できるぼけの差の量が制限されてしまうので、小さいセンサはより大きいセンサよりも画像ノイズになりやすい。これらのことによって、ぼけの差の量を正確に計ることが困難になる。
【発明の概要】
【発明が解決しようとする課題】
【0017】
本発明の目的は、既存の装置の1つまたは複数の欠陥を実質的に克服するか、少なくとも改善することである。
【課題を解決するための手段】
【0018】
本発明の目的を達成するために、たとえば、本発明の第1の様態は、画像撮影装置によって撮影されたシーンの距離情報を決定するための方法であって、前記画像撮影装置によって撮影された前記シーンの第1の画像および第2の画像を取得するステップであって、前記第1の画像は、前記第2の画像の撮影パラメータとは異なる少なくとも1つの撮影パラメータを使用して撮影されており、前記第1の画像から第1の画像パッチを選択し、前記第2の画像から第2の画像パッチを選択するステップであって、前記第1および第2の画像パッチは、前記第1および第2の画像のそれぞれにおいて撮影された前記シーンの共通部分に対応しており、前記第1および第2の画像パッチのうちのどちらの方が、より焦点が合った画像パッチであるかを決定するステップと、前記第1および第2の画像パッチのそれぞれにおけるデータの組合せに基づいて少なくとも1つの値を計算するステップであって、前記組合せは、前記第1および第2の画像パッチのうちのどちらの方が前記より焦点が合った画像パッチと決定されるかに依存しており、前記少なくとも1つの計算された値から、前記シーンの前記共通部分の前記距離情報を決定するステップとを有することを特徴とする。
【発明の効果】
【0019】
本発明の第1の様態の方法によれば、既存の装置の1つまたは複数の欠陥を実質的に克服するか、少なくとも改善することができる。
【0020】
本発明の他の態様も以下で説明する実施の形態で開示される。
【0021】
以下の図面を参照して、本発明の少なくとも1つの実施形態を説明する。
【図面の簡単な説明】
【0022】
【図1】シーン、およびシーンの画像を撮影するために位置する画像撮影装置の概略図である。
【図2】2つの異なる焦点面で2つの異なる画像を形成するレンズの幾何学的配置を示す概略図である。
【図3A】2次元のガウス関数、およびその1次元の断面図である。
【図3B】2次元のピルボックス関数、およびその1次元の断面図である。
【図4】2次元点広がり関数の一般的形態の1次元の断面図である。
【図5】画像ノイズがある状態でデジタル画像から推定された、2次元点広がり関数の一般的形態の1次元の断面図である。
【図6】相対的なぼけの半径に対してプロットされた2つの異なる距離測度の値を示すグラフである。
【図7】相対的なぼけの半径に対してプロットされた2つの異なる距離測度の値を示すグラフである。
【図8】シーンの第1の画像および第2の画像内の画素と画像パッチとの間の対応を示す図である。
【図9】本開示による、シーンの2つの画像から距離マップを決定する例示的方法を示す概略的流れ図である。
【図10】図9の方法で使用される、2つの画像を撮影する方法の一例を示す概略的流れ図である。
【図11】図9の方法で使用される、非対称パッチ選択の方法の一例を示す概略的流れ図である。
【図12】図9の方法で使用される、シーンの2つの画像の2つの対応するパッチから距離推定を決定する方法の一例を示す概略的流れ図である。
【図13】図9の方法で使用される、シーンの2つの画像の2つの対応するパッチから距離推定を決定する方法の他の例を示す概略的流れ図である。
【図14A】図14Bとともに形成する、本発明の実施形態を実施できる汎用コンピュータの概略的ブロック図である。
【図14B】図14Aとともに形成する、本発明の実施形態を実施できる汎用コンピュータの概略的ブロック図である。
【図15A】本開示による距離測定を実行できる例示的画像を示す図である。
【図15B】本開示による距離測定を実行できる例示的画像を示す図である。
【図15C】本開示による距離測定を実行できる例示的画像を示す図である。
【発明を実施するための形態】
【0023】
1.序文
本開示は、異なるカメラ撮影パラメータを有し、実質的に同じ場所に位置する1台のカメラを使用して撮影されたシーンの2つの画像から距離マップを抽出する方法を提供するものである。本方法は、改良された精密度、画像位置合わせ不良に対する一層の寛容性、画像露出に対する一層の寛容性、画像ノイズに対する改良された寛容性、画像内のオブジェクトのテクスチャの差に対する一層の寛容性、およびより速い計算速度のうちの1つまたは複数を提供しようとするものである。
【0024】
2.コンテキスト
2.1 薄レンズ方程式、基礎幾何学
距離推定の技術的詳細は、画像化装置の幾何学および光学の主な態様に依存する。カメラなどの画像化装置を使用して撮影されたほとんどのシーンは、装置のレンズから様々な距離に位置する複数のオブジェクトを含む。一般的に、画像化装置はシーン内の関心のあるオブジェクトに焦点を合わせる。関心のあるオブジェクトはシーンの被写体と呼ばれる。
【0025】
図1は、画像化装置の主な部分と、撮影されるべきシーン内のオブジェクトとの間の幾何学的関係を示す概略図である。図1は、レンズ110およびセンサ115を含む画像化装置(たとえばカメラ)100を示している。図1は、シーンの一部を形成するが、必ずしも撮影されるべきシーンの被写体ではない、直角プリズムに位置する球体で形成されるインフォーカス(in−focus)面130および一般的オブジェクト140も示している。画像化装置100の画像面120(焦点面とも呼ばれる)がセンサ115の位置にあると定義される。レンズ110を通じて投影されると、画像面120はインフォーカス面130を形成し、これはオブジェクト140の幾何学的領域における仮想面と考えられる。レンズ110から画像面120までの距離150は、方程式
【0026】
【数1】

【0027】
による薄レンズの原理によって、レンズ110からインフォーカス面130までの距離160に関連し、上式で、fはレンズ110の焦点距離であり、zはレンズからセンサまでの距離150であり、zはレンズ110からインフォーカス面130までの距離160である。一般的なシーンオブジェクト140は、レンズ110からの距離170およびインフォーカス面130からの距離180に位置する。この距離170はzと呼ばれる。オブジェクト140からインフォーカス面130までの距離180は、z−zで求められ、正数、ゼロ、負数でよい。画像面120上でオブジェクト140に焦点を合わせると、z=zとなり、オブジェクト140はインフォーカス面130に位置付けられる。zがzよりも短い場合はオブジェクト140がインフォーカス面130の背面に位置し、長い場合はオブジェクト140がインフォーカス面130の前面に位置するので、オブジェクト140の画像は画像面120上でぼけて見える。
【0028】
図1は画像化の比較的単純な幾何光学モデルを示している。このモデルは、薄レンズ近似値を含む近似値、近軸画像光線、および収差のないレンズを利用する。これらの近似値は、実際の画像化システムに固有の光学のいくつかの側面を無視するが、当業者には理解されるように、画像化動作の一般的な理解には十分である。
【0029】
ユーザによって手動で、または画像化装置100に内蔵されたオートフォーカスメカニズムを使用して、焦点合わせが実行される。一般的に、焦点合わせは、距離z160が関心のある特定のオブジェクトへの距離z170と等しくなるようにインフォーカス面130を配置するために、すなわちインフォーカス面130内に被写体を配置するために、レンズからセンサへの距離150を操作する。被写体の距離とは異なるレンズ110からの距離zを有するシーン内の他のオブジェクトは、インフォーカス面130の背面または前面に位置している。これらの他のオブジェクトは画像面120上で、然るにセンサ115上で撮影された画像内で、ある程度ぼけて見えることになる。このぼけは、デフォーカスぼけ(defocus blur)と呼ばれる。
【0030】
2.2 デフォーカスぼけ−単一の画像
画像化されたオブジェクト140のデフォーカスぼけの量は、インフォーカス面130からオブジェクト140までの距離180に伴って増加する。所与のパッチまたは撮影された2D画像の一部内にあるデフォーカスぼけの量は、点広がり関数(PSF)によって特徴付けることができる。PSFは点光源に対する画像化システムの反応であり、画像面上のPSFの積分が1と等しいように定義される。一般的に光学系のPSFは、空間的に制限された空間的座標(x、y)の2次元関数であり、起点から一定のラジアル距離を超えてゼロに近づく。ぼけの量は、PSFの形の測度によって特徴付けることができる。ぼけの量の一般的な測度はPSFの半値全幅(FWHM)、またはPSFの標準偏差である。
【0031】
カメラレンズ110のPSFについての数学的に単純なモデルを仮定することによって、DFDの原理の基本的な理解を得ることができる。この単純性を実現するために、従来技術の分析はしばしばPSFを2次元のガウス関数としてモデル化する。この仮定は本明細書において説明の目的のみで続けられ、物理光学系のPSFは一般的にガウスの関数によってあまり近似されない点に言及する。この仮定の下に、ガウスの標準偏差σをぼけの半径と見なすことができ、「ぼけの量」の概念の便利な定量的測度を提供する。ガウスぼけの半径σ、オブジェクト距離z、ならびに焦点距離fおよびレンズ口径Avのカメラ画像撮影パラメータの関係は、
【0032】
【数2】

【0033】
によって求めることができ、上式でAvはレンズ110の口径比(f値としても知られる)である。シーンの撮影された画像内の画素座標(x、y)に位置する点のぼけの半径σを測定できる場合、方程式(2)内の残りの量が分かっていれば、方程式(2)を使用してシーン内の対応する点でのオブジェクトへの距離zを決定できる。
【0034】
しかし、画像化されるシーンの詳細な予備知識なしにシーンの単一の画像からの距離を決定することは、解決不可能な問題として知られている。これは、ぼけのないシーン画像の詳細が知られていない限り、単一の画像からぼけの半径σを決定することが不可能であるためである。たとえば、ぼけたディスクに似た画像特徴は、ある未知量によってぼけたある不定のより小さいサイズのディスクによって、または絞られた焦点の中で表示されたぼけたディスクに似たシーン内のオブジェクトによって、生じる場合がある。この曖昧さのために、ぼけの半径σを決定することができない。したがって、方程式(2)に関して、たとえパラメータz、f、およびAvが知られていても、自然なシーン(unconstrained scene)の単一の画像から距離を決定することは不可能である。
【0035】
ほとんどの状況では、シーン内のオブジェクトの構造についての詳細な知識なしにシーンが画像化される。多くの画像化アプリケーションにとって、自然なシーンを扱うことは一般的要件であり、写真スタジオなどの注意深く制御された画像化環境下でさえ、単一の画像から距離マップを取得するために必要な要求される情報を推定することは非常に困難である。しかし、方程式(2)を参照すると、ぼけの半径σに加えてパラメータのうちの少なくとも1つの値が2つの撮影された画像間で異なるならば、同じシーンの2つの撮影された画像を使用して距離情報を抽出することは理論的に可能である。これはデフォーカスからの距離(DFD)方法を支持する基本原理であり、1つのシーンの2つの画像間の相対的なデフォーカスぼけの計算を使用する。
【0036】
2.3 デフォーカスぼけ−2つの画像−口径差
異なる口径比Avを有するが、他の全てのパラメータが一定のままである、カメラで撮影された同じシーンの2つの画像について考察する。さらに、パッチが一般的に画像化されているシーンの同じ領域を示すように、第1の画像から取られた小さな画像パッチ、および第2の画像から取られた小さな画像パッチを考察する。よく知られているように、画像のパッチ内に存在するデフォーカスぼけの量は、インフォーカス面130からのパッチ内に示されるオブジェクト140の距離z−z180と、レンズ110の口径比Avとの2つのパラメータに依存する。
【0037】
第1に、パッチ内に示されるオブジェクト140がインフォーカス面130内にある場合、オブジェクト140は焦点が合っているように見える。デフォーカスぼけの半径σは、インフォーカス面からのオブジェクトの距離180の絶対値|z−z|の増加に伴って増加する。第2に、デフォーカスぼけの半径σは、口径比Avの減少に伴って増加する。この場合、デフォーカスぼけの半径σが、インフォーカス面130からのオブジェクト140の絶対距離180|z−z|の増加に伴って単調に増加することを示すことができる。これは、第1の画像からのパッチのデフォーカスぼけの半径σおよび第2の画像からのパッチのデフォーカスぼけの半径σが推定できる場合、これらの推定を方程式(2)に使用して、オブジェクト140がインフォーカス面130の前面にあるか背面にあるかは曖昧だが、パッチ内に示されるオブジェクト140のインフォーカス面130からの距離を決定できることを意味する。
【0038】
さらに、2つのぼけの半径における差の絶対値|σ−σ|が、インフォーカス面130からのオブジェクト140の絶対距離180|z−z|の増加に伴って単調に増加することを示すことができる。これは、2つの画像から2つのぼけの半径における差|σ−σ|を推定できる場合、この推定を使用して、オブジェクト140がインフォーカス面130の前面にあるか背面にあるかは曖昧だが、パッチ内に示されるオブジェクト140のインフォーカス面130からの距離を推定できることを意味する。
【0039】
あるいは、2つの画像から、ぼけの量における差の他のいくつかの測度を推定できる。この他の測度はぼけの半径における差ではなく、むしろ「ぼけの差」の概念の他の何らかの量化を推定しようとするものである。この場合、ぼけの差の測度を距離測度に経験的に較正することが必要な場合がある。
【0040】
2.4 デフォーカスぼけ−2つの画像−焦点差
代替で、レンズからセンサまでの距離z150は異なっているが、他の全てのパラメータは一定のままである、1台のカメラで撮影された同じシーンの2つの画像を考察する。さらに、パッチが通常画像化されているシーンの同じ領域を示すように、第1の画像から取られた小さい画像パッチ、および第2の画像から取られた小さい画像パッチを考察する。
【0041】
図2は、2つの異なる焦点位置に設定されたレンズからセンサまでの距離z150で撮影された2つの画像の幾何学的配置を示している。図2は、画像が撮影されるレンズ210に対する位置を示すように描かれている。第1の画像は、レンズ210からの距離zi1225の第1の位置220で、センサで撮影される。第1のインフォーカス面230は、レンズ210からの距離zo1235にある。第2の画像は、レンズ210からの距離zi2245の第2の位置240で、センサで撮影される。第2のインフォーカス面250は、レンズ210からの距離z02255にある。一般性を喪失することなく、z01<z02であり、方程式(1)によりzi1>zi2である。
【0042】
口径差の場合と同様の原理を適用するが、この焦点差の場合、2つの画像は異なるインフォーカス面距離z01235およびz02255を有する。レンズからの距離z170が、第1のインフォーカス面230と第2のインフォーカス面250との間のどこかの、ある特定の距離zs0265内に入る場合、すなわちzo1<zs0<zo2の場合、両方の画像でシーンオブジェクトは等しくぼけて見えることになる。インフォーカス面と平行で、レンズからの距離がzs0である面260は、中間インフォーカス面と呼ばれることになる。
【0043】
中間インフォーカス面260よりもレンズ210からさらに離れたオブジェクトは第1の画像においてよりぼけて見えることになり、中間インフォーカス面260よりもレンズ210に近いオブジェクトは第2の画像においてよりぼけて見えることになる。
【0044】
この場合、(a)2つのぼけの半径の差|σ−σ|は、オブジェクト140と中間インフォーカス面260との間の距離の増加に伴って単調に増加すること、および(b)2つの画像パッチのうちのどちらの方がぼけがより少ないか(すなわち、より焦点が合っているか)を決定することによって、中間インフォーカス面260の前面または背面にあるオブジェクト140の位置を決定できることを示すことができる。これは、2つのぼけの半径の差|σ−σ|が推定でき、2つの画像パッチのうちのどちらの方がぼけがより少ないかを決定できる場合、この情報は、オブジェクトが中間インフォーカス面260の前面にあるか背面にあるかの曖昧性を除去することを含めて、パッチ内に示されるオブジェクトの中間インフォーカス面260からの距離を推定するために使用できることを意味する。
【0045】
あるいは、2つの画像からぼけの量における差の他のいくつかの測度を推定できる。この測度はぼけの半径における差ではなく、むしろ「ぼけの差」の概念の他の何らかの量化を推定しようとするものである。この場合、ぼけの差の測度を距離測度に経験的に較正することが必要な場合がある。
【0046】
2.5 実際の留意点
実際、シーンの画像はいくらかの画像ノイズとともに撮影される。これは画像データを処理することによって行われたあらゆる測定の精密度に影響を及ぼす。多くの従来技術のDFD方法の原理を得るために使用されるガウスPSFなどの単純な光学モデルも現実的ではない。実際のレンズはピンぼけ以外に収差を含み、オブジェクトは広い画角で画像化され、回折効果が重要になり得る。さらに、シーンオブジェクト内の視覚的なテクスチャの量の留意点がある。たとえば、オブジェクトの領域が色と反射性の点で均一の場合、この領域内のいかなるぼけの量を区別することも不可能である。
【0047】
これらの理由の組合せにより、実際にDFD方法は現実的な写真シーンから距離マップを決定することに限定的な成功を示したに過ぎない。報告されたDFD方法の成功の多くは、高度に制約されたテストシーンに限定されている。さらに、ぼけの半径と方程式(2)によって求められたオブジェクト距離との間の関係は精密度が限られており、有益な結果を達成するためにはこの方法を経験的に較正することが必要であることが分かる。
【0048】
3.概要
これから説明する装置は、現実世界の状況のレンズ光学の性質のより現実的な理論的モデリングを利用することによって、およびシーンに依存しない方法で、かつ画像ノイズがある状態で、デフォーカスからの距離を推定するためのより堅牢な手段を提供することによって、従来技術を改善する。
【0049】
図3Aおよび3Bは、一般的にレンズPSFの近似値と仮定される2つの単純な2次元関数を示している。図3Aは2次元ガウス関数300を示しており、その1次元断面図は1次元ガウス関数310である。2次元ガウス関数300は、ディザ式(dithered fashion)で概略的に示されている。図3Bは円形ピルボックス関数320を示しており、その一次元断面図は二乗関数330である。
【0050】
DFDの状況でのレンズの性質の従来技術のモデリングは、一般にデフォーカスぼけのPSFは2次元ガウス関数300によってよくモデル化されると仮定する。通常、これは正しくない。写真用カメラレンズのデフォーカスぼけPSFはしばしば円形ピルボックス320によく似ており、ガウス関数の緩やかな低下と比べると比較的鋭角である。実際には、デフォーカスぼけPSFの形は、これらの近似値のいずれよりも複雑であり、レンズによって、および単一のレンズの異なる撮影パラメータによって著しく変化する。PSFも画角に応じて変化するので、画像面120のある領域内のPSFは、画像面120の他の何らかの領域内のPSFとは異なる場合がある。
【0051】
また特に、DFDの状況でのレンズの性質の従来技術のモデリングは、光学的伝達関数(OTF)の係数である変調伝達関数(MTF)を考慮することは、2つの画像の比較から正確な距離を決定するために適していると仮定する。この仮定は、利用可能なデータの半分を事実上無視して、OTFの位相の大きな貢献を軽視する。位相情報を十分に利用することによって、本明細書に開示した装置は従来技術よりも大いにより正確な距離結果を達成できる。
【0052】
また特に、画像パッチのフーリエ変換の比率に基づく従来技術の距離推定は、画像ノイズによって大きく影響される相対的なPSFの幅の推定に事実上基づく。
【0053】
また特に、パッチ間に相互相関を実行することによって2つの画像パッチ間のぼけの量を比較する従来技術の方法は、異なる目的のために考案された正規化を適用している。この異なる目的は、2つのパッチの両方が同じシーンの信頼できる表現になることを目的としているという仮定の下に、2つのパッチのコントラスト間のあらゆる差を排除することである。この対称的ぼけ仮定は、一方が他方よりもよりぼけているので異なるコントラストがあることが知られている2つの画像パッチを比較する場合、非対称のケースで行われる貧弱な仮定である。
【0054】
本明細書に開示した装置は、(a)ぼけの差の測度を計算する際、非対称パッチ選択の使用を通じて、ぼけのより少ない、およびぼけのより多い画像パッチ間の基本的な非対称を認識して利用することによって、(b)デフォーカスぼけPSFの形についていかなる仮定もせずに、(c)OTFの位相にある情報を捨てずに、(d)従来の方法よりも画像ノイズに対して敏感でない2つの画像パッチ間の相対的なぼけを特徴付ける改善された方法を使用して、(e)理論的に不適切な相互相関正規化技法を使用せずに、異なる撮影パラメータで撮影された同じシーンの1組の画像から距離測定を容易にする。これらの特徴は以下のセクションで詳細に説明する。
【0055】
4.平均スペクトル比
4.1 理論
画像形成の理論を考慮することによって、同じシーンの2つの画像から距離を決定する方法を開発できる。画像化されるべきシーンのパッチfを考察すると、パッチは十分に小さく、したがってオブジェクト距離におけるあらゆる変化、またはパッチ内の画像化システムのPSFが小さいので、無視できる。パッチfの配光分布の画像fの対応するパッチの2次元配光分布は、以下のように空間的畳み込み演算による完全に一般的な点広がり関数(PSF)を使用してモデリングされ得る。
【0056】
【数3】

【0057】
上式で、PSFは、画像パッチf上に投影される際のシーンパッチfのデフォーカスぼけPSFである。方程式(3)の両側をフーリエ変換すると、
F1(u,v)=F0(u,v)OTF1(u,v) (4)
となり、上式で、(u,v)は空間周波数座標であり、Fはfのフーリエ変換であり、Fはfのフーリエ変換であり、OTFはPSFのフーリエ変換である。フーリエ畳み込み定理によって、空間的畳み込み演算が積となる。関数OTFは光学的伝達関数(OTF)として知られている。OTFは複素数値関数であり、係数と位相成分を有する。
【0058】
異なる撮影パラメータで撮影した同じシーンの2つの画像を有するが、画像が相互に合致する(位置が合っている)ようにカメラまたはシーン内のいかなるオブジェクトも動かさないと仮定する。次いで、同じシーンパッチfの第2の画像パッチfを方程式(3)と同じ方法でモデリングでき、下付き文字1を下付き文字2に置換する。2つの画像内の対応するパッチのフーリエ変換の比率は、
【0059】
【数4】

【0060】
となり、上式で、シーンのフーリエ変換F(u,v)は、右側の分子と分母に共通であり、比率から約分されている。この比率はスペクトル比と呼ばれる場合がある。ノイズがない場合、シーンの全ての貢献が相殺されているので、スペクトル比はシーンに依存しない。画像または量子化ノイズがある場合、相殺は完全ではない場合があるが、スペクトル比の基本的性質は依然としてほとんどまたは実質的にシーン非依存である。
【0061】
スペクトル比は、画像パッチの任意の割当てでfおよびfとして形成され得る。しかし、以下でさらに説明するように、2つの画像パッチfおよびfのうちのどちらの方が他の画像パッチよりもぼけが少ないかに基づいて、非対称パッチ選択を使用することが好都合である。このような決定は、たとえば、それぞれの画像パッチ内の画素の明度または輝度の分散を計算することによって行うことができ、分散の高いパッチはぼけが少なく、したがってシーンの最も焦点が合った表現であると考えられる。どちらのパッチがぼけがより少ないかを決定する他の方法も使用でき、たとえば画像が異なる口径および回折で撮影されたかどうかを無視できる場合、より狭い口径で撮影されたパッチはぼけがより少ないと考えられる。
【0062】
どちらのパッチの方がぼけがより少ないかという決定が行われると、ぼけがより少ないパッチはパッチfとして割り当てられ、ぼけがより多いと考えられるパッチはfとして割り当てられる。この割当てによって、スペクトル比
【0063】
【数5】

【0064】
によって求められる相対的な光学的伝達関数OTFに関連して、fをfのぼけがより多いバージョン考えることができると解釈できるようになる。
【0065】
方程式(6)を逆フーリエ変換すると以下の関係が求められる。
【0066】
【数6】

【0067】
上式で、PSFは相対的点広がり関数(相対的PSF)と定義され、画像パッチfに畳み込まれると画像パッチfをもたらす。相対的点広がり関数PSFrは単純にPSFおよびPSFに関連しないが、その2つの非線形結合の結果である。相対的点広がり関数PSFは、焦点および口径などの画像化システムのパラメータ、パッチf内で画像化されたオブジェクトの距離、ならびに画像面120全域の画角によって異なる。
【0068】
4.2 距離マッピングへの適応
図4に相対的PSFの形の説明のための例が示されている。図4は、PSFの形400、PSFの幅410の測度、およびPSFのピーク値420を示している。画像ノイズがない場合、物理光学系の相対的PSFは一般的に、起点420で最大またはほぼ最大である値を有し、基点からゼロに低下する関数である。幅410の測度は、関数の幅のFWHM、標準偏差、または他の何らかの測度でよい。
【0069】
一般的な写真状況では、シーンパッチfのフーリエスペクトルFはシーンパッチ内のテクスチャに依存する。一般的に、Fは低い値を有するFの内の多くの領域とともに、ラジアル空間周波数座標に関してベキ分布(power law distribution)を持つことになる。所与の画像パッチについて著しいデフォーカスがある場合、OTFおよびOTFもしばしば低い値を有する。
【0070】
画像ノイズがある場合、方程式(5)を使用してスペクトル比を決定することは、あらゆる空間周波数座標についてノイズのある推定をもたらすことになり、F、OTF、またはOTFは低い値を有する。スペクトル比推定におけるノイズも相対的PSFのノイズのある推定をもたらす。さらに、2つの画像パッチから計算された相対的PSFは、画像パッチの画素グリッド上でサンプリングされ、パッチのサイズによって窓を掛けられる(be windowed)。窓を掛けること(windowing)によって、パッチのフーリエ変換にアーティファクトがもたらされる。
【0071】
窓を掛けることによってもたらされるアーティファクトは、当業者には知られているように、スクエアパッチウインドウのエッジに向かって減少する窓関数を適用することによって減らすことができる。このような窓関数はDC周波数のエネルギーを他の周波数に広げるので、精密度の損失をもたらす。これを回避するために、対応するパッチからそれぞれのパッチの平均値を引くことによって、画像パッチは窓を掛ける前にDC成分を除去できる。スペクトル比を形成する場合、これはフーリエ変換におけるDC画素でゼロ除算をもたらす。これは特別なケースとして扱うことができ、パッチは輝度または明度の点で等しいという仮定に基づいて、DC画素でスペクトル比に値1を割り当てることができる。あるいは、スペクトル比のDC画素に、DC除去の前に画像パッチの平均の比率と等しい値を割り当てることができる。
【0072】
図5に、2つのノイズのある画像パッチのスペクトル比を使用して取得された相対的PSFの説明のための例を示している。図5は、ノイズのあるサンプリングされたPSFの形500、およびノイズのあるサンプリングされたPSF500の基本的な幅510の推定された測度を示している。この場合、相対的PSFの幅510の経験的測度は、ノイズによってある程度バイアスがかけられている可能性がある。特に、FWHMの推定は一般的に、相対的PSFの基本的な形について関数形式を仮定するステップ、ノイズのあるデータに曲線を適合させるステップ、曲線の最大値を決定するステップ、次いでその値の半分で曲線の幅をとるステップに依存する。これらのそれぞれのステップは測定におけるノイズのためにエラーになりやすい。
【0073】
測定されたスペクトル比から相対的PSFのサイズを推定する際のさらなる考察は、相対的PSFを計算するステップが、まずスペクトル比を計算して、次いで相対的PSFを得るために逆フーリエ変換することを要求するということである。この演算は処理時間の点でコストがかかる。
【0074】
相対的なぼけ幅を含むパラメータを推定するためのより速くより堅牢な方法は、領域全体のスペクトル比の平均値を取ることである。スペクトル比OTFは複素数値関数であるが、比率F/Fによって形成され、FおよびFは両方とも実数値関数のフーリエ変換である。これは、FおよびFはエルミート関数であることを意味し、複素OTF比率であるF/Fもエルミート関数であり、すなわち、
Im[OTF(u,v)]=−Im[OTF(−u,−v)] (8)
であり、上式で、Im()関数は複素数の虚数部をとる。これは、エルミート対称を有する領域内のスペクトル比値の合計が実数であり、したがってこのような領域全体のスペクトル比の平均が実数であることを意味する。フーリエ変換の特性によって、パッチ全体にわたって計算されたスペクトル比の平均は、起点の相対的PSFの値420と等しい。起点の相対的PSFの値420は相対的なぼけの幅の測度なので、ぼけの幅が大きいほど、それだけ起点の相対的PSFの値が低く、逆も同様である。したがって、平均スペクトル比は、2つの画像パッチfとfとの間の相対的デフォーカスぼけの量の測度を与えるので、画像が異なるカメラ口径または焦点セッティングで撮影されたかどうかに応じて、それぞれ画像パッチ内に示されるオブジェクトからインフォーカス面130または中間インフォーカス面260のどちらかへの距離180に関連する測度として使用できる。
【0075】
さらに、非対称パッチ選択決定は、画像パッチ内に示されたオブジェクトがインフォーカス面130または中間インフォーカス面260のどちらかの前面にあるか背面にあるかに直接関連する、どちらの画像パッチの方がより焦点が合っているかのバイナリ弁別子を提供する。この情報を距離決定と結合することにより、画像パッチ内に示されたオブジェクトのカメラから距離を一意に識別できる。
【0076】
周波数ドメインにおける平均化はランダムノイズの影響を相殺し、相対的PSFの形についてのあらゆる仮定またはあらゆる追加パラメータ推定を必要とせずにピークの高さの推定をもたらすので、一般的に相対的PSFの幅の直接推定よりもスペクトル比の平均は相対的なぼけのより堅牢な測度である。一方、ノイズのあるサンプリングされたPSF500から相対的PSFの幅を推定するステップは、相対的PSFの形についての関数形式を仮定するステップ、ノイズのあるデータの形に適合する複数のパラメータを推定するステップ、およびその適合から幅パラメータ510を抽出するステップが必要である。
【0077】
スペクトル比の係数の平均を取ることは、一般的に複素スペクトル比の平均を取るための異なる数をもたらす。特に、三角不等式によって、スペクトル比の係数の平均は複素スペクトル比の平均よりも一般的に大きく、その差はOTFの位相成分によって決定される。一般的に、これは起点の相対的PSFの値420の推定が大きすぎることを意味し、実際に存在するよりも相対的デフォーカスぼけが小さいことを暗示する。これは画像パッチ内の距離推定におけるエラーにつながる場合がある。同様に、OTFの係数の比率の平均を取るステップも、一般的に複素スペクトル比の平均を取るための異なる数をもたらし、やはり距離推定におけるエラーにつながる。これらの理由から、正確な距離推定のために、計算を通じて複素数計算を維持することが重要である。
【0078】
MTFの比率が使用される従来技術の方法よりも平均スペクトル比方法が優れている点のうちのいくつかは、図6に示されている。図6は、写真から得られた8つの異なるテクスチャについて、MTF比率610(実線)の平均のプロット、および相対的なぼけの半径に対してプロットされた平均スペクトル比620(点線)を示している。平均スペクトル比620は、約4画素未満のぼけの半径の差の値について、MTF比率610の平均よりも大きな相対的なぼけの半径の変化を示している。したがって、平均スペクトル比方法は、この小さい相対的なぼけの差の領域内のぼけの半径の差に対して従来技術の方法よりも著しく敏感である。この小さいぼけの差の領域は、小型消費者向けカメラ特有のレンズおよびセンサを使用するDFDが操作する領域である。また、平均スペクトル比620は、画像テクスチャの分散がMTF比率610の平均よりも少ないことを示しており、これは画像ノイズが存在する場合に平均スペクトル比のシーンテクスチャへの依存性がMTF比率の平均よりも少ないことを意味する。
【0079】
多くの従来技術の方法よりも平均スペクトル比方法が優れている他の点は、2つの画像間の相対的OTFが画像間のデフォーカスぼけの量における変化だけに依存するという仮定に依存しない点である。多くの従来技術の方法は他のレンズ収差の影響を無視しており、他のレンズ収差は無視できる、あるいはデフォーカスにおける変化は他のレンズ収差における変化に伴わないと暗に仮定している。これらの仮定は、両方とも光学的瞳孔関数とOTFとの間の関係により、一般的な光学系には誤りである。瞳孔関数は、光学系の瞳孔面を通る光の振幅および位相変調を説明する複素数値関数である。当業者には知られているように、デフォーカスは瞳孔関数のゼルニケ多項式成分として説明できる。球面収差、コマ収差、または他の収差などのレンズ収差は、デフォーカス多項式に直交するゼルニケ多項式として説明できる。これは、瞳孔関数に関して、デフォーカスを他の収差から分離して独自に測定できることを意味する。しかし、OTFは瞳孔関数の自己相関であり、この自己相関は直交多項式を混合するので、もはや分離できない。これは異なる焦点で撮影された2つの画像間の相対的OTFが、相対的デフォーカスぼけと他のレンズ収差によって生じたぼけとの混合であること、および両者は曖昧性を除去できないことを意味する。この影響を無視するDFDモデルは、理論と実験との間でミスマッチになり、誤った距離割当てに潜在的に帰着する傾向がある。これは、一般的に著しい収差のレンズを有する小型カメラの場合に特に重要である。平均スペクトル比方法は、一般にこの仮定を回避するのに十分である。レンズ収差が知られている場合、距離への平均スペクトル比の理論的較正内に含むことができる。経験的較正については、平均スペクトル比から距離までの測定されたマッピングは、レンズ収差のあらゆる影響を自動的に含む。
【0080】
平均スペクトル比の変形は、エルミート対称性を備える領域全体で得られるスペクトル比の実数部の中央値として定義される中央値スペクトル比を計算することである。これにより、ノイズによるバイアスが少ないスペクトル比の平均値の推定がもたらされるので、距離測度としても有用である。
【0081】
平均スペクトル比の他の変形は、逆正接関数に基づく操作によって方程式(5)の複素数除算を置換することによって形成できる。ゼロに近い値の除算は大きな結果を生じさせ、画像パッチのフーリエ変換におけるいくつかの値がゼロに近く、画像ノイズによって影響を受ける場合がある。これは、スペクトル比における任意の大きい誤った値という結果になる場合がある。したがって、有限範囲内の値に任意の大きい値をマッピングする数学関数を使用することが好都合である。適切な関数は逆正接であり、0から無限大への範囲を0からπ/2への範囲にマッピングする。実際には、逆正接関数のよく知られているatan2(y,x)バージョンを使用でき、2つの引数xおよびyをとって比率y/xの逆正接を返す。この関数は、方程式(5)における除算が分母におけるゼロのためにエラーをもたらす場合、有限値π/2を返す。atan2()関数が実数上で演算するので問題が生じるが、フーリエ変換FおよびFにおける値は複素数である。FおよびFの係数の比率の逆正接を単純にとると位相情報を捨てることになり、スペクトル比について上述したように、結果を距離測度として解釈する際のエラーにつながる。atan2()関数の変形atan2complex()は、2つの引数の比率の逆正接の係数がある値、および2つの引数の位相成分における差と等しい位相成分を返すように定義できる。
atan2complex(y,x)=atan2(|y|,|x|)exp(i(arg(y)−arg(x))) (9)
次いで、逆正接スペクトル比と呼ばれる値OTFarctanは、
OTFarctan(u,v)=atan2complex(OTF(u,v),OTF(u,v)) (10)
によって定義できる。
【0082】
次いで、逆正接スペクトル比を、画像パッチ内に示されるオブジェクトの距離に関連する測度を得るために領域全体の値の平均または中央値を取ることを含むさらなる演算におけるスペクトル比と同様に扱うことができる。平均逆正接スペクトル比は、ランダム画像ノイズによる影響が平均スペクトル比よりも少ないので、利点がある。中央値逆正接スペクトル比も同様である。
【0083】
4.3 スペクトルサポートおよびノイズ
平均スペクトル比を計算する際のさらなる考察は、比率についてのスペクトルサポートの量である。写真のシーン内の一般的な画像テクスチャでは、フーリエ変換は低周波数で著しい振幅を示すが、最高周波数ではゼロに近い振幅であり、代わりに信号が画像ノイズによって占められる。画像撮影装置のセンサのナイキスト周波数よりも高い周波数では、信号はゼロであり、見られるもの全てはノイズである。これは、スペクトル比OTFが低周波数領域に集中した重要な信号のほとんどを有し、高周波数の方がよりノイズが多いことを暗示する。ある周波数では、スペクトル比の分母は非常にゼロに近く、周波数のスペクトル比を任意に大きくする。このような値を含むスペクトル比の平均を取ることにより、誤った結果が生じる場合がある。
【0084】
この問題は、スペクトル比を形成する前に画像パッチデータをフィルタリングすることによって、あるいは平均値を取る前にスペクトル比データを重み付けまたはフィルタリングすることによって、あるいはその両方によって対処できる。本開示のこの態様の一実装形態は、フーリエ変換をする前に画像パッチにローパス平滑化フィルタを適用することである。他の実装形態は、フーリエ変換をする前に画像パッチにバンドパスフィルタを適用することである。他の実装形態は、ゼロに近い数による除算によって生じた大きな値を有する画素の影響を減らすためにスペクトル比にウィーナーフィルタまたは同様のノイズ低減フィルタを適用することである。他の実装形態は、スペクトル比画像を1/(u+v)のある累乗に比例する関数などの動径関数で重み付けすることである。
【0085】
画像パッチフィルタリングの他の実装形態は、画像パッチのうちの1つ、好ましくはスペクトル比の分母内のパッチのフーリエスペクトルの信号対ノイズ比のしきい値化によって定義される領域全体の画素の平均を取ることである。画像パッチ内のノイズ振幅がフラットスペクトルを有すると仮定すると、画像パッチ内のそれぞれの画素の信号対ノイズ比を画素内のフーリエ変換の係数に比例するものとして推定できる。次いで、しきい値を適用して、最高推定信号対ノイズ比を有する画素のあらかじめ定められた割合を選択できる。フーリエ変換の特性によって、選択された画素のサブセットはエルミート対称性を有するので、これらの選択された画素にわたって計算された平均スペクトル比は実数である。中央値スペクトル比および逆正接スペクトル比の変形に、同様のフィルタリングも適用できる。
【0086】
平均スペクトル比をデジタルカメラで撮影された画像に適用する際の他の考察は、空間的周波数に生じるレンズの回折限界がセンサのナイキスト周波数よりも少ない場合があることである。この場合、回折限界よりも大きい空間的周波数でシーン情報がなく、回折限界より
【0087】
【数7】

【0088】
分だけ大きい画像パッチfのフーリエ変換F内の画素はノイズだけを含む。この場合、これらの画素を平均スペクトル比の計算から捨てることができる。これは処理時間を節約でき、平均スペクトル比の結果は精密度を損なうことなく、画像ノイズによって受ける影響はより小さい。
【0089】
5.修正された正規化相互相関
5.1 理論
同じシーンの2つの画像から距離を決定する方法は、異なる撮影パラメータを使用して撮影された同じシーンの2つの異なる画像間のぼけの相対量を考察することによって開発できる。
【0090】
他の全ての撮影パラメータは固定されたままである、異なる口径によって撮影された同じシーンの2つの画像を考察する。十分に小さいのでパッチ内のオブジェクト距離におけるあらゆる変化が小さい、画像化されるシーンのパッチf、および第1の画像内の対応する画像パッチfおよび第2の画像内の対応する画像パッチfを考察する。パッチは矩形であり、サイズはm×n画素である。2つのパッチの正規化された相互相関(NCC)の中央値は、
【0091】
【数8】

【0092】
によって定義され、上式で、
【0093】
【数9】

【0094】
は画像パッチf内の画素値の平均であり、
【0095】
【数10】

【0096】
は画像パッチf内の画素値の平均である。2つのパッチfおよびfが同じ量だけぼけていて、画像ノイズおよびオブジェクトまたはカメラのモーションがない場合、この2つは同一である。この場合、NCCの中央値は1である。2つのパッチ間のぼけの差の量が増加するにつれて、NCC中央値は減少する。したがって、NCC中央値は2つの画像パッチ間のぼけの差に関連する。分母上の正規化項は、パッチf内の画素値の標準偏差σf1とパッチf内の画素値の標準偏差σf2の積と等しい。
【0097】
しかし、NCCの正規化は画像パッチに関して対称であり、2つのパッチは同じデータの同一の表現になることを目的としているという仮定の下に適切である。相関パッチが同じシーンの画像であるがぼけの量が異なると知られている場合、この仮定は誤りである。特に、高相関値の意味と解釈は曖昧である。それは、わずかに異なる2つの異なるPSFで画像化されている高テクスチャを有するシーンによって生じる場合もあり、より大きな量だけ異なる2つの異なるPSFで画像化されている低テクスチャを有するシーンによって生じる場合もある。したがって、NCCは画像間の類似性の優れた測度であるが、NCCはシーン依存であり、ぼけの相対量の不十分な測度である。
【0098】
パッチfとfとの間のぼけの量における差の、より特徴的でシーンに依存しない測度は、ぼけの差の物理的原因の非対称性を認識して利用することによって実現できる。相関を、シーンのテクスチャによるバイアスがかかっていないぼけの差の測度にするために、理想的には元のシーン内の画素明度の分散によって正規化するべきである。この情報は利用可能ではないが、画像パッチfおよびfがあれば、ぼけがより少ない画像パッチの輝度または明度の分散によって最も近似される。このような非対称パッチ選択は、たとえばそれぞれの画像パッチ内の画素明度の分散を計算することによって行うことができ、より高い分散があるパッチの方がぼけがより少ないと考えられる。どちらのパッチの方がぼけがより少ないかを決定する他の方法も使用でき、たとえば、画像が異なる口径で撮影され、回折を無視できる場合、より狭い口径で撮影されたパッチの方がぼけがより少ないと考えられる。
【0099】
どちらのパッチの方がぼけがより少ないかという決定が行われると、ぼけがより少ないパッチをfとして割り当て、ぼけがより多いと考えられるパッチをfとして割り当てることができる。修正された正規化相互相関(MNCC)を形成でき、中央値は
【0100】
【数11】

【0101】
によって定義される。
【0102】
方程式(12)によって定義されたMNCC中央値は、2つの画像パッチfとfとの間の相対的デフォーカスぼけの量の測度を与えるので、画像パッチ内に示されるオブジェクトからインフォーカス面130までの距離180に関連する測度として使用できる。MNCC中央値は、従来技術の正規化相互相関測定よりも実質的にシーン非依存であり、したがって画像パッチ内に示されるオブジェクトからインフォーカス面130までの距離180の好都合な測度を提供する。
【0103】
MNCC中央値を2つの画像パッチ間のぼけの量における小さな差に対してより敏感にするために、プリフィルタリングステップを実行できる。ぼけの量についての最も多い情報を伝えるのはエッジなので、画像パッチfおよびfにラプラス演算子などの2次元勾配演算子を適用して、勾配パッチ(ラプラス画像)gおよびgを与えることができる。次いで、gおよびgを使用してMNCC中央値を形成できるが、元の画像パッチfおよびfのうちのどちらの方がぼけがより少ないかの決定を依然として使用して、方程式(12)の分母にgおよびgが使用されるかどうかを決定する。
【0104】
図7に、このラプラスMNCC方法が従来技術のNCC方法よりも優れている利点のうちのいくつかが示されている。図7は、写真から得られた5つの異なるテクスチャについて、NCC中央値710のプロット(実線)、および相対的なぼけの半径に対してプロットされたラプラスMNCC中央値720(点線)を示している。ラプラスMNCC中央値720は、約5画素未満のぼけの半径の差の値について、NCC中央値710よりも大きな相対的なぼけの半径の変化を示している。したがって、ラプラスMNCC方法は、この小さな相対的なぼけの差の領域内のぼけの半径の差に対して従来技術の方法よりも著しく敏感である。この小さなぼけの差の領域は、小型カメラ特有のレンズおよびセンサを使用するDFDが操作する領域である。また、図7のグラフによってカバーされる領域の多くにとって、ラプラスMNCC中央値720は画像テクスチャの分散がNCC中央値710よりも少ないことを示しており、これはラプラスMNCC方法のシーンテクスチャへの依存性がNCC中央値よりも少ないことを意味する。
【0105】
MNCCアルゴリズムの他の変形は、方程式(12)における合計を窓関数によって定義された画素のサブセット上の合計と置換することである。これは、オブジェクト境界、したがって比較的大きな距離の量によって分離されたオブジェクトを含む画像パッチにおける利点を提供する。この窓関数は、当業者に知られているジョイント双方向フィルタリングと類似した方法で、画像パッチの分析に基づいて選択できる。窓関数を適切に選択することによって、他のオブジェクトによってそれぞれのオブジェクトの測定品質を落とさずに、単一の画像パッチ内の2つ以上のオブジェクトへの距離を決定することが可能になる。
【0106】
6.処理の実装、変形、および適用
本明細書に開示した装置は、カメラなどの画像化装置(撮影システム)を含む様々なハードウェアプラットフォーム上、または汎用コンピュータ(PC)上に実装できる。
【0107】
図14Aおよび14Bは、説明した様々な装置を実施できる汎用コンピュータシステム1400を示している。
【0108】
図14Aに示されるように、コンピュータシステム1400は、コンピュータモジュール1401、キーボード1402、マウスポインタデバイス1403、スキャナ1426、カメラ1427、マイク1480などの入力装置、ならびにプリンタ1415、ディスプレイ装置1414、およびラウドスピーカ1417を含む出力装置を含む。外付け変調復調器(Modem)トランシーバ装置1416は、接続1421を介して通信ネットワーク1420との間で通信するために、コンピュータモジュール1401によって使用され得る。通信ネットワーク1420は、インターネットなどのワイドエリアネットワーク(WAN)でもよく、セルラー式遠隔通信ネットワーク、またはプライベートWANでもよい。接続1421が電話回線の場合、モデム1416は従来の「ダイヤルアップ」モデムでよい。あるいは、接続1421が大容量(たとえばケーブル)接続の場合、モデム1416はブロードバンドモデムでよい。通信ネットワーク1420への無線接続に無線モデムを使用することもできる。
【0109】
一般的に、コンピュータモジュール1401は少なくとも1つのプロセッサユニット1405と、メモリユニット1406とを含む。たとえば、メモリユニット1406は半導体ランダムアクセスメモリ(RAM)および半導体読出し専用メモリ(ROM)を有することができる。コンピュータモジュール1401は、ビデオディスプレイ1414、ラウドスピーカ1417、およびマイク1480に接続された音声ビデオインターフェース1407、キーボード1402、マウス1403、スキャナ1426、カメラ1427、および任意でジョイスティックまたは他のヒューマンインターフェースデバイス(図示せず)に接続されたI/Oインターフェース1413、ならびに外付けモデム1416およびプリンタ1415のためのインターフェース1408を含む、いくつかの入力/出力(I/O)インターフェースも含む。いくつかの実装形態では、モデム1416はコンピュータモジュール1401内、たとえばインターフェース1408内に内蔵されてもよい。コンピュータモジュール1401もローカルネットワークインターフェース1411を有し、コンピュータシステム1400が接続1423を介して、ローカルエリアネットワーク(LAN)として知られるローカルエリア通信ネットワーク1422に接続することが可能になる。図14Aに示されるように、ローカル通信ネットワーク1422は、一般的にいわゆる「ファイアウォール」デバイスまたは同様の機能のデバイスを含む接続1424を介して、ワイドネットワーク1420にも接続できる。ローカルネットワークインターフェース1411は、イーサネット(登録商標)回路カード、ブルートゥース(登録商標)無線装置、またはIEEE 802.11無線装置を備えることができるが、インターフェース1411のために他の多くのタイプのインターフェースが実施されても良い。
【0110】
I/Oインターフェース1408および1413は、シリアルおよびパラレル接続のどちらかまたは両方を利用できるようにし、シリアル接続は一般的にユニバーサルシリアルバス(USB)標準によって実装され、対応するUSBコネクタ(図示せず)を有する。一般的にハードディスクドライブ(HDD)1410を含む記憶装置1409が提供される。フロッピーディスクドライブや磁気テープドライブ(図示せず)などの他の記憶装置も使用できる。データの不揮発性ソースの機能を果たすために光ディスクドライブ1412が一般的に提供される。システム1400へのデータの適切なソースとして、たとえば光ディスク(たとえばCD−ROM、DVD、ブルーレイ(登録商標)ディスク)、USB−RAM、ポータブル、外付けハードドライブ、フロッピーディスクなどのポータブルメモリデバイスを使用できる。
【0111】
コンピュータモジュール1401のコンポーネント1405〜1413は、一般的に相互接続されたバス1404を介して、および関連分野の当業者に知られているコンピュータシステム1400の従来の操作モードに帰着する方法で通信する。たとえば、プロセッサ1405は接続1418を使用してシステムバス1404に接続されている。同様に、メモリ1406および光ディスクドライブ1412は、接続1419によってシステムバス1404に接続されている。説明した装置を実施できるコンピュータの例には、IBM−PCおよび互換機、Sun Sparcstations、Apple Mac(登録商標)、または同様のコンピュータシステムがある。
【0112】
画像距離測定の方法はコンピュータシステム1400を使用して実装でき、後述する図8から13のDFD処理を、コンピュータシステム1400内で実行可能な1つまたは複数のソフトウェアアプリケーションプログラム1433として実装できる。特に、距離測定の方法のステップは、コンピュータシステム1400内で実行されるソフトウェア1433内の命令1431(図14B参照)によって達成される。ソフトウェア命令1431は、それぞれが1つまたは複数の特定のタスクを実行するための1つまたは複数のコードモジュールとして形成できる。さらにソフトウェアは2つの別々の部分に分割でき、第1の部分および対応するコードモジュールは距離測定方法を実行し、第2の部分および対応するコードモジュールは第1の部分とユーザとの間のユーザインターフェースを管理する。
【0113】
ソフトウェアは、たとえば以下で説明する記憶装置を含むコンピュータ可読メディアに格納できる。ソフトウェアは、コンピュータ可読メディアからコンピュータシステム1400にロードされ、次いでコンピュータシステム1400によって実行される。このようなソフトウェアまたはコンピュータプログラムをコンピュータ可読メディアに記録したコンピュータ可読メディアは、コンピュータプログラム製品である。コンピュータシステム1400内のコンピュータプログラム製品を使用することにより、画像距離測定のための好都合な装置を達成することが好ましい。
【0114】
ソフトウェア1433は、一般的にHDD1410またはメモリ1406に格納される。ソフトウェアはコンピュータ可読メディアからコンピュータシステム1400にロードされ、コンピュータシステム1400によって実行される。したがって、たとえばソフトウェア1433を光ディスクドライブ1412によって読み出される光学的可読ディスク記憶メディア(たとえばCD−ROM)1425に格納することができる。このようなソフトウェアまたはコンピュータプログラムを記録したコンピュータ可読メディアはコンピュータプログラム製品である。コンピュータシステム1400内のコンピュータプログラム製品を使用することにより、画像化のための距離測定のための装置を達成することが好ましい。
【0115】
いくつかの例では、1つまたは複数のCD−ROM1425上で符号化して、対応するドライブ1412を介して読み出すことによって、ユーザにアプリケーションプログラム1433を供給することもでき、ネットワーク1420または1422からユーザによって読み出すこともできる。さらに、他のコンピュータ可読メディアからコンピュータシステム1400にソフトウェアをロードすることもできる。コンピュータ可読記憶メディアは、実行および/または処理するために、記録された命令および/またはデータをコンピュータシステム1400に提供するあらゆる持続性有形記憶メディアを指す。このような記憶メディアの例には、コンピュータモジュール1401に内蔵されているか、または外付けされているかに関わらず、フロッピーディスク、磁気テープ、CD−ROM、DVD、ブルーレイ(登録商標)ディスク、ハードディスクドライブ、ROMまたは集積回路、USBメモリ、光磁気ディスク、またはPCMCIAカードおよび同様の物などのコンピュータ可読カードがある。コンピュータモジュール1401へのソフトウェア、アプリケーションプログラム、命令および/またはデータの供給に参加できる一時的または非有形コンピュータ可読伝送メディアの例には、無線または赤外線伝送チャネルならびに他のコンピュータまたはネットワーク装置へのネットワーク接続、ならびに電子メール送信およびウェブサイト上に記録された情報などを含むインターネットまたはイントラネットがある。
【0116】
上述のアプリケーションプログラム1433の第2の部分および対応するコードモジュールは、ディスプレイ1414上に描画する若しくは表す1つまたは複数のグラフィカルユーザインターフェース(GUI)を実装するために実行される。一般的にキーボード1402とマウス1403の操作を通じて、コンピュータシステム1400およびアプリケーションのユーザは機能的に適応できる方法でインターフェースを操作して、制御コマンドおよび/または入力をGUIに関連付けられるアプリケーションに提供できる。ラウドスピーカ1417を介するスピーチプロンプト出力、およびマイク1480を介するユーザ音声コマンド入力を利用する音声インターフェースなどの、機能的に適応できる他の形式のユーザインターフェースも実装できる。
【0117】
図14Bは、プロセッサ1405および「メモリ」1434の詳細な概略ブロック図である。メモリ1434は、図14Aにおけるコンピュータモジュール1401によってアクセスされ得る全てのメモリモジュール(HDD1409および半導体メモリ1406を含む)の論理的集合を表す。
【0118】
最初にコンピュータモジュール1401の電源が入ると、パワーオンセルフテスト(POST)プログラム1450を実行する。一般的に、POSTプログラム1450は図14Aの半導体メモリ1406のROM1449に格納される。ソフトウェアを格納するROM1449などのハードウェアデバイスはファームウェアと呼ばれることもある。POSTプログラム1450は適切な機能を保証するためにコンピュータモジュール1401内のハードウェアを検査して、正確な操作のために一般的にやはりROM1449に格納されるプロセッサ1405、メモリ1434(1409、1406)、および基本入出力システムソフトウェア(BIOS)モジュール1451を一般的に調べる。POSTプログラム1450が正常に実行されると、BIOS1451は図14Aのハードディスクドライブ1410を起動する。ハードディスクドライブ1410を起動することにより、プロセッサ1405を介してハードディスクドライブ1410上に常駐するブートストラップローダプログラム1452を実行させる。これにより、オペレーティングシステム1453がRAMメモリ1406にロードされ、オペレーティングシステム1453が動作を開始する。オペレーティングシステム1453は、プロセッサ管理、メモリ管理、デバイス管理、ストレージ管理、ソフトウェアアプリケーションインターフェース、およびジェネリックユーザインターフェースを含む、様々な高レベル機能を発揮するためにプロセッサ1405によって実行可能なシステムレベルのアプリケーションである。
【0119】
オペレーティングシステム1453は、コンピュータモジュール1401上で実行しているそれぞれの処理またはアプリケーションが、他の処理に割り当てられたメモリと衝突せずに実行するために十分なメモリを有することを保証するために、メモリ1434(1409、1406)を管理する。さらに、図14Aのシステム1400内で利用できる異なるタイプのメモリは、それぞれの処理を効率的に実行できるように適切に使用されなければならない。したがって、集約されたメモリ1434は、メモリの特定のセグメントが割り当てられる方法を示すためのものではなく(特に指定のない限り)、コンピュータシステム1400によってアクセスできるメモリの一般的概念およびそれが使用される方法を提供するためのものである。
【0120】
図14Bに示されるように、プロセッサ1405は、制御装置1439、算術論理装置(ALU)1440、およびキャッシュメモリと呼ばれることもあるローカルまたは内部メモリ1448を含むいくつかの機能モジュールを含む。一般的に、キャッシュメモリ1448はレジスタセクションにいくつかの記憶レジスタ1444〜1446を含む。1つまたは複数の内部バス1441はこれらの機能モジュールと機能的に相互接続している。一般的に、プロセッサ1405は、接続1418を使用してシステムバス1404を介して外付けデバイスと通信するための1つまたは複数のインターフェース1442も有する。メモリ1434は接続1419を使用してバス1404に接続されている。
【0121】
アプリケーションプログラム1433は、条件付き分岐およびループ命令を含み得る命令のシーケンス1431を含む。プログラム1433は、プログラム1433を実行する際に使用されるデータ1432も含むことができる。命令1431およびデータ1432は、それぞれ1428、1429、1430、および1435、1436、1437のメモリ位置に格納される。命令1431およびメモリ位置1428〜1430の相対的なサイズに応じて、メモリ位置1430内に示される命令によって表されるように単一のメモリ位置に特定の命令を格納できる。あるいは、メモリ位置1428および1429に示される命令セグメントによって表されるように、別個のメモリ位置に格納されるいくつかの部分に命令を分割できる。
【0122】
一般的にプロセッサ1405は、プロセッサで実行される命令セットを与えられる。プロセッサ1105は後続の入力を待ち、プロセッサ1405は他の命令セットを実行することによってそれに対応する。それぞれの入力は、図14Aに全て記載されている、入力装置1402、1403のうちの1つまたは複数によって生成されたデータ、ネットワーク1420、1422のうちの1つを通じて外部ソースから受信したデータ、記憶装置1406、1409のうちの1つから取り出したデータ、または対応するリーダ1412に挿入された記憶メディア1425から取り出したデータを含む、いくつかのソースのうちの1つまたは複数から提供され得る。場合によっては、命令セットの実行はデータの出力をもたらす場合がある。実行はデータまたは変数をメモリ1434に格納することも含み得る。
【0123】
開示された距離測定装置は入力変数1454を使用し、それらの入力変数は対応するメモリ位置1455、1456、1457内のメモリ1434に格納される。装置は出力変数1461をもたらし、その出力変数は対応するメモリ位置1462、1463、1464内のメモリ1434に格納される。中間変数1458は、メモリ位置1459、1460、1466、および1467に格納され得る。
【0124】
図14Bのプロセッサ1405を参照すると、レジスタ1444、1445、1446、算術論理装置(ALU)1440、および制御装置1439が協働し、プログラム1433を構成する命令セット内の命令ごとに「フェッチ、デコード、および実行」のサイクルを実行するために必要な一連のマイクロ操作を実行する。それぞれのフェッチ、デコード、および実行サイクルは、以下を含む。
(a)メモリ位置1428、1429、1430から命令1431をフェッチするか読み出す、フェッチ操作、
(b)どの命令がフェッチされたかを制御装置1439が決定するデコード操作、および、
(c)制御装置1439および/またはALU1440が命令を実行する実行操作。
【0125】
その後、次の命令のためのさらなるフェッチ、デコード、および実行サイクルを実行できる。同様に、制御装置1439が値をメモリ位置1432に格納するか書き込む、格納サイクルを実行できる。
【0126】
図8から13の処理におけるそれぞれのステップまたはサブプロセスは、プログラム1433の1つまたは複数のセグメントに関連付けられ、プログラム1433の記載した(noted)セグメントについての命令セット内の命令ごとにフェッチ、デコード、および実行サイクルを実行するために協働するレジスタセクション1444、1445、1447、ALU1440、およびプロセッサ1405内の制御装置1439によって実行される。
【0127】
あるいは、DFD方法を組み込む距離測定の方法は、その全体あるいは一部が、後述する機能またはサブ機能を実行する1つまたは複数の集積回路などの専用ハードウェアにおいて実装され得る。このような専用ハードウェアは、グラフィックプロセッサ、デジタル信号プロセッサ、あるいは1つまたは複数のマイクロプロセッサおよび関連メモリを含むことができる。
【0128】
たとえば、カメラは、異なる撮影パラメータで何組かの画像を撮影して、撮影された画像を処理して様々な目的のための距離マップを提供するために、後述するDFDアルゴリズム的処理をハードウェアまたはファームウェア内に実装できる。このような目的は、人物写真の背景を人工的にぼかして芸術的な美しさを実現すること、または様々な後処理操作を可能にするために画像メタデータとして距離情報を添付することを含むことができる。この場合、カメラハードウェアはシーンの複数の画像を撮影でき、画像がDFD処理のアプリケーションに適しているので、カメラの内蔵装置に処理が発生し、結果はカメラのメモリ内に保持されるか、カメラに接続可能なメモリカードまたは他のメモリ記憶装置に書き込まれる。
【0129】
異なる撮影パラメータでのシーンの複数の画像の撮影は、1つの画像を撮影して格納し、パラメータを変更し、次いでさらなる画像を撮影して格納する、単一のユーザ操作(カメラ1427の撮影ボタンを1度押すこと)で複数の画像を撮影することによって実行できる。このような撮影は約0.001〜0.5秒内に発生でき、同一ではないが実質的に同じコンテンツであり、したがって次いで画像距離処理を実行できる実質的に共通の画像コンテンツを両方の画像に含めさせる。
【0130】
他の例では、デスクトップコンピュータなどは、ソフトウェアにDFD処理を実装して、ユーザが画像分割またはさらなる画像処理操作のために使用できる距離マップを生成するために、写真の撮影後の処理を可能にすることができる。この場合、カメラ1427は、シーンの複数の画像を従来の方法で撮影し、画像はDFD処理のアプリケーションに適しており、画像はメモリ内に保持されるか、メモリカードまたは他のメモリ記憶装置に書き込まれる。後に、画像はコンピュータ(たとえば1401)に転送され、そこでDFD処理の後続のステップがそれらの画像を入力として使用する。
【0131】
他の実装形態は、異なる撮影パラメータで2つの画像を撮影でき、様々なパラメータは、焦点、ズーム、口径、または撮影された画像内のぼけの量に影響を及ぼす他の何らかのカメラ設定のうちの1つまたは複数である。特にズーム、ならびに焦点および潜在的には他のパラメータなどのいくつかのパラメータの場合、撮影された画像の倍率は異なる場合がある。この場合、距離を決定するためにDFDアルゴリズムを適用する前に、画像を実質的に登録するために画像のうちの1つまたは複数を変倍できる。
【0132】
図15Aおよび15Bは、それぞれDFD処理を実行できる例示的画像1501および1502の第1のペアを示している。画像1501および1502によって撮影されたシーンコンテンツは同一だが、画像1501の撮影と異なる少なくとも1つの撮影パラメータで画像1502が撮影されているということを考慮すると、画像1501および1502は異なる画像コンテンツを撮影している。たとえば、画像1502は画像1501に比べて焦点が異なる場合がある。
【0133】
図15Aおよび15Cは、それぞれやはりDFD処理を実行できる例示的画像1501および1503の第2のペアを示している。画像1501および1503によって撮影されたシーンコンテンツは全体的なコンテンツにおいて同一ではないが、画像1501および1503は共通のシーンを撮影するか、両方の画像に共通のシーンコンテンツを含む。共通のシーンコンテンツは、それぞれ図15Aおよび15C内の点線で囲んだ長方形1511および1513によって示され、木の隣に立っている人を表している。共通のシーンコンテンツは画像1501および1503内の異なる位置に現れる場合がある。画像1501と1503との間の共通のシーンコンテンツの位置の違いは、たとえば2つの画像を撮影する間のわずかなカメラの動きに起因する場合がある。共通のシーンコンテンツを撮影している領域1511および1513内の画像1501および1503の画像コンテンツは、画像1501の撮影と異なる少なくとも1つの撮影パラメータで画像1503が撮影されているという考慮すると、さらに異なる場合がある。たとえば、画像1503は画像1501と比べて焦点が異なる場合がある。
【0134】
それぞれの図15A〜15Cにおいて、それぞれの画像内でシーンコンテンツの共通部分(木の隣に立っている人)が撮影されていることは重要である。したがって、画像のペアに距離マップ処理を実行して、共通部分の距離マップを決定できる。図15Bおよび15Cも、DFD処理を実行できる画像ペアを表すことができる点に留意されたい。
【0135】
ある実装形態は2つ以上の画像を撮影でき、DFDアルゴリズムを使用して距離を得るために1つまたは複数の画像のペアが使用される。
【0136】
7.デフォーカス処理からの距離
シーンの2つの画像から距離マップを抽出する方法を、図8および図9、ならびにコンピュータ1401内で実質的処理が行われる図14Aおよび図14Bの装置を参照して詳細に説明する。図8は、あるシーンの第1の画像800、および同じシーン(図示せず)の第2の画像810を示している。第1の画像800内の選択された画素820が強調表示され、第2の画像810内の対応する選択された画素830が強調表示されている。このように対応するので、第1の画像800内の選択された画素820および第2の画像810内の選択された画素830は、画像化されているシーン内の同じ点にほとんど対応する。これは、第1の画像800を撮影するために使用される露出と、第2の画像810を撮影するために使用される露出との間の時間にシーン内のどのオブジェクトも動かないこと、ならびに画像800および810を撮影するカメラ1427が露出の間の時間に動かないことを保証すること、ならびに、次いで撮像素子上の同じ(x,y)座標から画素を選択することによって実際に実現できる。また、第1の画像800内のどの画素が第2の画像810内の画素に対応するかを明確に決定する位置合わせ処理によって実現することもできる。この位置合わせは、2つの露出間のシーン内のオブジェクトのモーション、2つの露出間のカメラ1427のモーション、2つの露出間の倍率または歪み、あるいはその両方における変化などの問題に対処できる。位置合わせは画像800および810の全体に及んでもよく、画像800および810のサブ領域内で局所的でもよく、またはその両方でもよい。このような多くの位置合わせ処理は、当業者に知られている。
【0137】
図8には、それぞれの画像内の画素のサブセットである2つの画像パッチも示されている。第1の画像パッチ840は第1の画像800から来ており、fと呼ばれる。第2の画像パッチ850は第2の画像810から来ており、fと呼ばれる。第1のパッチf840は、第1の画像800内の第1の選択された画素820を参照して定義されるので、第1の選択された画素820は、第1のパッチf840の上部左角で画素842に対して座標(x,y)に生じる。第2のパッチf850は、第2の画像810内の選択された画素830を参照して定義されるので、選択された画素830は、第2のパッチf850の上部左角で画素852に対して座標(x,y)に生じ、(x,y)=(x,y)である。代替実施形態では、(x,y)≠(x,y)の場合もある。そこに含まれる画像コンテンツの適切な比較を保証するために、パッチは同じサイズであるべきである。
【0138】
図15Aから15Cに戻ると、パッチは画像または画像の一部を単純にブロックに分割することによって形成され得る。図15Aおよび15Bにそれぞれ示されている画像のペア1501および1502の例では、画像コンテンツが十分に位置合わせされているので、画像を4×4のブロック構成に分割することによってパッチを形成できる。図15Aおよび15C内のそれぞれの画像ペア1501および1503の例では、共通のシーンコンテンツを示している領域1511および1513を同様のブロック化方法(図示せず)でパッチに分割できる。あるいは、画像間でパッチのサイズが異なるような方法でパッチを形成することもできる。
【0139】
図9は、DFD方法を使用して距離マップが決定される、距離マッピング処理900を示している。画像撮影ステップ910では、あるシーンの2つの画像800および810が、カメラ1427などの画像撮影装置100によって撮影される。画像800および810は、シーンコンテンツの共通部分の画像コンテンツを含んでいるはずである。たとえば、図1を参照すると、共通部分はオブジェクト140である。図15Aおよび15Cでは共通部分は木の隣の人だが、図15Aおよび15Bでは共通部分は画像全体である。画像は、焦点、口径、ズームの撮影パラメータ、または画像内のぼけの量に影響を及ぼす他の何らかのパラメータのうちの少なくとも1つで撮影され、それは画像間で異なる。画像は、シーン内のオブジェクトのあらゆるモーション、およびシーンに関するカメラ1427のあらゆる関連モーションが最小化されるように撮影されることが理想的である。たとえば、このような関連モーションを表す図15Aおよび15Cを参照すると、DFD処理の前にそれぞれの画像内で見つけられる共通部分が適切に位置合わせされるように、2つの画像に位置合わせ処理を実行することができる。これは、たとえば長方形1511および1513内の画像データを相互に位置合わせすること、または画像をこれらの長方形にトリミングすることを含むことができる。
【0140】
画像撮影ステップ910の特定の実装形態を、以下で図10を参照してより詳細に説明する。一般的に、画像800および810はカメラ1427によって撮影されて、HDD1410およびメモリ1406のうちの1つまたは両方に格納するために、コンピュータ1401に通信され、またそれによって受信される。カメラ1427内で処理900が実行されると、内蔵プロセッサによる後続の処理のために、画像800および810がカメラ1427のメモリに格納される。
【0141】
この実装形態における処理900のステップ920〜980は、たとえばHDD1410に格納されたソフトウェアで実施され、またそれによって実装されて、メモリ1406と協調してプロセッサ1405によって実行可能であることが好ましい。撮影ステップ910の後の画素選択ステップ920で、2つの画像800および810の対応する画素820および830が選択され、メモリ1406からプロセッサ1405によって受信される。次にパッチ抽出ステップ930が続き、プロセッサ1405の操作によって、第1の画像800から画像パッチf840が、および第2の画像810から対応する画像パッチf850が抽出される。第1の画像パッチf840は、少なくとも第1の画像800内の第1の選択された画素820の位置によって定義される。第2の画像パッチf850は、少なくとも第2の画像810内の第2の選択された画素830の位置によって定義される。第1および第2の選択された画素は、両方の画像によって撮影されたシーンの共通部分を表す画像の一部内にあり、シーンコンテンツ内の同一の点にほとんど対応する。
【0142】
次に非対称パッチ選択ステップ940が続き、2つのパッチのうちfまたはfのどちらの方がぼけがより少ないかに関する決定が行われる。非対称パッチ選択ステップ940の特定の実装形態の詳細は、以下で図11を参照して説明する。
【0143】
次いで距離推定ステップ950が実行され、プロセッサ1405が第1のパッチf840および第2のパッチf850内の画素データを処理することによって、距離推定が決定される。一般的に、距離推定はメモリ1406に格納される。距離推定ステップ950の2つの異なる実装形態の詳細は、以下で図12および図13をそれぞれ参照して説明する。
【0144】
次に画素決定ステップ960が続き、プロセッサ1405によって、画素選択ステップ920においてまだ選択されていない何らかの画素が第1の画像800および第2の画像810内に残っているかどうかの決定が行われる。まだ選択されていない画素が残っている場合、距離マッピング処理900は画素選択ステップ920に戻る。実際には、第1の画像f800の行に沿って列を降りていくことを繰り返すことなどによって、体系的な順序で画素を選択できる。したがって、ステップ920〜960は距離マッピングの目的で処理されることが望まれる全てのパッチの現在のパッチに進む。それぞれの現在のパッチは、画像によって撮影されたシーンの共通部分の現在の部分を表す。ある例では、たとえば図15Aおよび図15Bの画像のペアは全てが共通なので、画像パッチは画像全体に及ぶことができる。代替手法では、たとえば画素座標インデックスが何らかの整数によって割り切れる行および列に生じる画素だけを選択することによってプロセッサ1405が画像をサブサンプリングすることによって、第1の画像f800の画素のサブセットだけが選択されるよう選ぶことができる。他の代替手法では、結果として生じるパッチのいずれも画像の外側の領域をカバーしないようにして、それによってあらゆるエッジ効果を回避するために、第1の画像f800の画素のサブセットが選択されるよう選ぶことができる。他の代替手法では、他の何らかの手段によって第1の画像f800の画素のサブセットが選択されるよう選ぶことができる。全ての必要な画素が選択されると(ステップ960における「いいえ」)、距離マッピング処理900はアセンブリステップ970に進む。
【0145】
アセンブリステップ970で、画像撮影装置100によって撮影されたシーンの距離マップを生成するために、距離推定ステップ950で計算された距離推定がプロセッサ1405によってアセンブルされる。距離推定は、画素選択ステップ920で選択されたそれぞれの画素の画素位置と、距離推定ステップ950で画素から計算された距離推定との間に地理的対応があるように、ある画像にアセンブルされることが望ましい。たとえば、第1の画像800が100×100画素で、行を横切って列を降りていくことを繰り返すことによって全ての画素が選択される場合、行を横切って列を降りていくことを繰り返す後続の画素に距離推定を挿入することによってそれらの画素を100×100画素のサイズの画像に配置することによって連続する距離推定をアセンブルすることができる。これにより、プロセッサ1405によってメモリ1406またはHDD1410に格納できる距離マップ画像が明らかになる。代替実装形態では、アセンブリステップ970をスキップして、メモリ1406に格納された距離推定を、入力として使用するための処理900のストリーム出力としてコンピュータ1401内で実行可能な他の処理に直接渡すことができる。
【0146】
次いで、距離マッピング処理900は終了ステップ980で終了する。
【0147】
7.1 画像撮影
次に、画像撮影ステップ910の一例を、図10を参照して説明する。カメラセットアップステップ1010では、画像撮影装置(カメラ1427)が所望のシーンに向けられる。これは、たとえば手持ちカメラを向けることによって、またはカメラを三脚にセッティングすることによって行われる。
【0148】
カメラセッティングステップ1020で、画像撮影装置に関連付けられる様々なセッティングが設定される。これは、画像内に記録されるぼけの量に何らかの影響を及ぼすセッティングを指し、レンズ焦点位置、ズームができる場合はレンズのズーム位置、レンズの口径をセッティングすることを含む。画像内のぼけの量を変更する他の画像撮影装置セッティングも可能である。これらのセッティングは、オペレータによって手動で、または撮影されるべきシーンに基づいてカメラ内で実行する制御ソフトウェアによって自動的に実行できる。
【0149】
次に第1の画像取得ステップ1030が続き、カメラセッティングステップ1020におけるセッティング設定を使用して、シーンの(第1の)画像が撮影される。
【0150】
次にカメラセッティング変更ステップ1040が続き、カメラセッティングステップ1020で設定された値から画像撮影装置のセッティングが変更される。これは、レンズ焦点位置、レンズズーム位置、レンズ口径セッティング、および画像内に記録されるぼけの量に影響を及ぼす他の何らかのセッティングのうちの1つまたは複数を変更することを含んでよい。この変更は、手動で実行されてもよく、カメラ制御ソフトウェアによって実行されてもよい。
【0151】
第2の画像取得ステップ1050で、カメラセッティング変更ステップ1040におけるセッティング設定を使用して、シーンの(第2の)画像が撮影される。次いで、画像撮影処理910が終了ステップ1070で終了する。
【0152】
一実装形態では、第1の画像取得ステップ1030、カメラセッティング変更ステップ1040、および第2の画像取得ステップ1050は、画像撮影装置100の画像撮影機能の単一の起動に応じて、たとえばカメラのシャッターボタンを押すことによって、画像撮影装置100によって自動的に実行される。
【0153】
7.2 非対称パッチ選択
次に、図11を参照して非対称パッチ選択ステップ940の一実装形態を説明する。非対称パッチ選択処理940は、データ入力として第1の画像パッチf840および第2の画像パッチf850から開始する。
【0154】
第1の分散計算ステップ1110で、よく知られている分散の定義を使用して、パッチf840内の画素値の分散σが計算される。第2の分散計算ステップ1120で、パッチf850内の画素値の分散σが計算される。
【0155】
分散比較ステップ1130で、パッチf840内の画素値の分散σがパッチf850内の画素値の分散σと比較される。パッチf840内の画素値の分散σがパッチf850内の画素値の分散σよりも大きいかそれと等しい場合、処理は第1のパッチ選択ステップ1140に続く。一方、パッチf840内の画素値の分散σがパッチf850内の画素値の分散σよりも小さい場合、処理は第2のパッチ選択ステップ1145に続く。
【0156】
第1のパッチ選択ステップ1140で、ぼけがより少ないパッチとしてパッチfが選択される。第2のパッチ選択ステップ1145では、ぼけがより少ないパッチとしてパッチfが選択される。次いで、非対称パッチ選択処理940が終了ステップ1150で終了する。
【0157】
非対称パッチ選択ステップ940を実行するための他の手法も可能である。たとえば、画像ノイズによって生じる中心から離れた画素値の影響を減らすために、フィルタを使用してまずパッチを平滑にすることができる。次いでフィルタリングされたパッチの分散を計算して、フィルタリング後に最も高い分散があるパッチをぼけがより少ないパッチとして選択できる。他の例では、ラプラス演算子などの2次元勾配演算子をパッチに適用して、次いでラプラス勾配画像(ラプラス画像)における画素値の範囲(すなわち、最大画素値−最小画素値)が最も大きいパッチをぼけがより少ないパッチとして選択できる。他の例では、2つの画像800および810は、撮影間で変化する唯一のパラメータである口径値で撮影されることが知られており、この場合、単により狭い口径で撮影された画像からのパッチをぼけがより少ないパッチとして選択できる。
【0158】
7.3 平均スペクトル比を使用する距離推定
次に、図12を参照して距離推定ステップ950の一実装形態950aを説明する。距離推定処理950aは、データ入力として画像パッチf840および画像パッチf850から開始する。第1のゼロ平均ステップ1210で、第1のパッチfの画素値の平均値が計算され、次いでこの平均値が第1のパッチf内の全ての画素の画素値から引かれる。この計算の結果は第1のゼロ平均パッチであり、指定されたf’である。
【0159】
第2のゼロ平均ステップ1220で、第2のパッチfの画素値の平均値が計算され、次いでこの平均値が第2のパッチf内の全ての画素の画素値から引かれる。この計算の結果は第2のゼロ平均パッチであり、指定されたf’である。
【0160】
窓を掛けるステップ1230で、ゼロ、またはパッチのエッジの近くの何らかの小さい値に落ちる窓関数を使用してパッチf’およびf’が窓を掛けられる。例示的な窓関数には、ハン窓、ハミング窓、および当業者に知られている類似の関数がある。
【0161】
フーリエ変換ステップ1240が続き、フーリエ変換された画像パッチFおよびFをそれぞれ形成するために、たとえば高速フーリエ変換(FFT)アルゴリズムを使用して、窓を掛けられたパッチf’およびf’がそれぞれフーリエ変換される。フーリエ変換された画像パッチFおよびFは、それぞれの画素で複素数値を含む。
【0162】
ぼけ決定ステップ1250が続き、非対称パッチ選択ステップ940においてパッチfまたはfのうちのどちらの方がぼけがより少ないパッチとして選択されたかが参照される。ぼけがより少ないパッチとして画像パッチf840が選択された場合、距離推定処理950aは第1のスペクトル比ステップ1260aに進む。一方、ぼけがより少ないパッチとして画像パッチf850が選択された場合、距離推定処理950aは第2のスペクトル比ステップ1260bに進む。
【0163】
第1のスペクトル比ステップ1260aで、複素数除算を使用して、フーリエ変換されたパッチFおよびFが画素単位で除算されてスペクトル比画像パッチF/Fを形成する。第2のスペクトル比ステップ1260bで、複素数除算を使用して、フーリエ変換されたパッチFおよびFが画素単位で除算されてスペクトル比画像パッチF/Fを形成する。スペクトル比ステップ1260aおよび1260bの両方において、スペクトル比におけるDC画素は特別なケースであり、1に設定される。スペクトル比ステップ1260aおよび1260bの両方において、形成された比率の分母におけるフーリエ変換されたパッチは、最もぼけが少ないと決定された画像パッチのフーリエ変換されたパッチである。このように、少なくとも1つのフーリエ変換値を計算するために、第1および第2パッチからのデータの組合せが使用され、それは、どちらのパッチの方がより焦点があった画像パッチかという非対称パッチ選択ステップ940における決定に基づく。
【0164】
第1のスペクトル比ステップ1260aの変形で、フーリエ変換されたパッチFおよびFの係数が画素単位で除算されて、逆正接スペクトル比の係数成分|F|/|F|を形成し、フーリエ変換されたパッチFおよびFの位相が画素単位で引かれて逆正接スペクトル比の位相成分arg(F)−arg(F)を形成し、次いで係数成分および位相成分が結合されて複素値逆正接スペクトル比画像パッチ|F|/|F|exp(i(arg(F)−arg(F)))を形成する。第1のスペクトル比ステップ1260bの変形では、フーリエ変換されたパッチFおよびFの係数が画素単位で除算されて、逆正接スペクトル比の係数成分|F|/|F|を形成し、フーリエ変換されたパッチFおよびFの位相が画素単位で引かれて逆正接スペクトル比の位相成分arg(F)−arg(F)を形成し、次いで係数成分および位相成分が結合されて複素値逆正接スペクトル比画像パッチ|F|/|F|exp(i(arg(F)−arg(F)))を形成する。変形スペクトル比ステップ1260aおよび1260bの両方において、スペクトル比におけるDC画素は特別なケースであり、1に設定される。
【0165】
次いで平均計算ステップ1270が実行され、第1および第2の画像パッチのそれぞれにおけるデータの組合せから生じるステップ1250、1260a、および1260bから得られる結果から、スペクトル比画像パッチ内の全ての画素の平均値が計算される。エルミート対称によって、DC画素を中心とする対称の正方形領域内の全ての画素の虚数成分の平均値がゼロであり、したがって平均値は実数である。実際には、平均スペクトル比のバイアスがかかっていない推定を保証するためにDCおよびナイキスト周波数成分を表すある個々の画素の二重計算の考察があり、このような考察は離散フーリエ変換の当業者には知られている。これらの考察は、平均スペクトル比のバイアスがかかっていない推定を保証するために適用されてもよく、スペクトル比画像パッチ内の全ての画素の平均を単純に計算するために部分的または全体的に無視されてもよい。これらの考察を部分的または全体的に無視することによって、計算時間はより速くなるが、平均スペクトル比推定におけるランダムな誤差がわずかに増加するという代償を払うことになる。
【0166】
平均計算ステップ1270の変形で、スペクトル比画像パッチ内の画素の実成分の平均値ではなく中央値が計算される。これによって中央スペクトル比値が生じ、これは後に平均スペクトル比値の代替推定として扱うことができる。
【0167】
平均計算ステップ1270の他の変形で、パッチ内の画素のサブセットにわたってスペクトル比が計算される。以下の考察のうちの1つまたは複数によってサブセットを決定できる:(1)撮像素子のナイキスト周波数外の画素を除去すること、(2)画像撮影光学の回折限界周波数外の画素を除去すること、(3)入力画像パッチのうちの1つのフーリエ変換の係数から推定された、最高信号対ノイズ比を有するあらかじめ定められたわずかな画素だけを含むこと。
【0168】
距離決定ステップ1280で、画像パッチfおよびfについての距離推定を決定するために、非対称パッチ選択ステップ940で決定されたどちらのパッチがぼけがより少ないかという決定と結合して、平均計算ステップ1270で計算された平均スペクトル比が使用される。これは、画像を撮影するために使用される撮影パラメータのセットを使用して、および撮影パラメータのために画像パッチ内に示されたシーン内のオブジェクトの距離に対する平均スペクトル比に関する理論的モデルを使用して、または撮影パラメータの距離対平均スペクトル比を記載する較正ルックアップテーブルを参照することによって行うことができる。較正ルックアップテーブルは理論的または経験的結果を使用してアセンブルできる。たとえば、オブジェクト距離の範囲および撮影パラメータについてのOTFをシミュレートして、オブジェクト距離の範囲および撮影パラメータについての結果として得られる平均スペクトル比を計算して、シミュレートされた平均スペクトル比をルックアップテーブルに格納することによって理論的較正をコンパイルできる。次いで、ルックアップテーブル値と2つの画像パッチから計算された平均スペクトル比との間の最も近い一致を、画像パッチ内に示されるオブジェクトへの距離の推定として使用できる。
【0169】
ステップ1280の他の例では、カメラから異なる距離の範囲にオブジェクトを配置して、それぞれの位置で異なる撮影パラメータでオブジェクトの写真を2枚撮り、オブジェクトを示している画像パッチの平均スペクトル比を計算し、オブジェクトへの距離によって参照されるルックアップテーブルに平均スペクトル比を格納することによって、経験的較正をコンパイルできる。
【0170】
次いで、距離推定処理950aは終了ステップ1290で終了する。
【0171】
7.4 修正された正規化相互相関を使用する距離推定
次に、図13を参照して距離推定ステップ950の他の実装形態950bを説明する。距離推定処理950bは、データ入力として画像パッチf840および画像パッチf850から開始する。
【0172】
第1のゼロ平均ステップ1310で、第1のパッチf内の画素値の平均値が計算され、次いでこの平均値が第1のパッチf内の全ての画素の画素値から引かれる。この計算の結果は第1のゼロ平均パッチであり、指定されたf’である。
【0173】
第2のゼロ平均ステップ1320で、第2のパッチf内の画素値の平均値が計算され、次いでこの平均値が第2のパッチf内の全ての画素の画素値から引かれる。この計算の結果は第2のゼロ平均パッチであり、指定されたf’である。
【0174】
積ステップ1330が続き、第1のゼロ平均パッチf’および第2のゼロ平均パッチf’が画素単位で掛けられて、積パッチf’f’をもたらす。
【0175】
次いで分子ステップ1340が実行されて、積パッチf’f’内の全ての画素の画素値が合計されて、分子値Nをもたらす。ステップ1340の代替実装形態では、積パッチf’f’内の窓関数によって定義された画素のサブセットが合計されて、分子値Nをもたらす。
【0176】
ぼけ決定ステップ1350が続き、非対称パッチ選択ステップ940においてパッチfまたはfのうちのどちらの方がぼけがより少ないパッチとして選択されたかが参照される。ぼけがより少ないパッチとして画像パッチf840が選択された場合、距離推定処理950bは第1の分母ステップ1360に進む。一方、ぼけがより少ないパッチとして画像パッチf850が選択された場合、距離推定処理950bは第2の分母ステップ1365に進む。
【0177】
第1の分母ステップ1360で、第1のゼロ平均パッチf’がそれ自身によって画素単位で掛けられて第1の正規化パッチf’f’をもたらし、次いで第1の正規化パッチf’f’内の全ての画素の画素値が合計されて、分母値Dをもたらす。代替実装形態では、第1の正規化パッチf’f’内で窓関数によって定義される画素のサブセットが合計されて、分母値Dをもたらす。
【0178】
第2の分母ステップ1365で、第2のゼロ平均パッチf’がそれ自身によって画素単位で掛けられて第2の正規化パッチf’f’をもたらし、次いで第2の正規化パッチf’f’内の全ての画素の画素値が合計されて、分母値Dをもたらす。代替実装形態では、第2の正規化パッチf’f’内で窓関数によって定義された画素のサブセットが合計されて、分母値Dをもたらす。
【0179】
ステップ1360および1365のそれぞれの後に正規化ステップ1370が続き、分子値Nが分母値Dによって除算されて、修正された正規化相互相関中央値N/Dをもたらす。ステップ1370は、第1および第2パッチのそれぞれから取得された結合データに行われる。
【0180】
最後に、距離決定ステップ1380で、非対称パッチ選択ステップ940においてどちらのパッチの方がぼけがより少ないと決定されたかという決定と結合して、正規化ステップ1370で計算された、修正された正規化相互相関中央値N/Dを使用して画像パッチfおよびfについての距離推定を決定する。これは、画像を撮影するために使用される撮影パラメータのセットについての画像パッチ内に示されたシーン内のオブジェクトの距離への修正された正規化相互相関値N/Dに関する理論的モデルを使用して、または距離対画像を撮影するために使用される撮影パラメータのセットについての修正された正規化相互相関値N/Dを記載する較正ルックアップテーブルを参照することによって、行うことができる。
【0181】
次いで、距離推定処理950bは終了ステップ1390で終了する。
【0182】
距離推定ステップ950のさらなる代替実装形態(図示せず)は、図13に示した距離推定処理950bにおいて概ね上述のように進行するが、第1のゼロ平均ステップ1310の前にパッチfおよびパッチfのラプラス勾配画像が計算される追加ステップを含む。パッチfのラプラス演算子はgと呼ばれ、パッチfのラプラス演算子はgと呼ばれる。図13に示される距離推定処理950bは、入力としてfおよびfではなくパッチgおよびgを与えられ、次いで上述のように進行する(fの代わりにgを、およびfの代わりにgを代用して)。
【0183】
7.5 変形
図12および13の処理の多くの変形を実行できる。たとえば、入力画像パッチの異なる色チャネルに処理を適用して、それによって画像パッチごとに様々な値を計算できる。
【0184】
他の変形では、異なる窓関数を使用することによって、入力画像パッチのそれぞれのペアから複数の値を計算しても良い。
【0185】
さらなる変形では、たとえば2つの値を与えるために、図12および13の処理のそれぞれを同時に実行しても良い。
【0186】
これらのそれぞれの変形では、複数の値から対応する距離推定を取得して、他の何らかの方法で平均化または結合することもでき、ある選択基準を使用して選択して、対象としているパッチについての距離推定を与えることもできる。
【0187】
8.要約
処理900、および処理900を実装できる様々な代替によって、当分野で広く知られているが、従来の処理と比較して著しくより効率的な方法で処理900を介して得られた方法で実用性を提供する距離マップ画像または距離マップ値のストリームがもたらされる。
【産業上の利用可能性】
【0188】
上述の装置は、コンピュータおよびデータ処理産業に適用でき、特にカメラおよび同様の撮影装置を使用して撮影された画像から距離マップデータを形成することに適用できる。
【0189】
上記は本発明のいくつかの実施形態を説明しているに過ぎず、本発明の範囲および趣旨から逸脱することなくこの実施形態に修正形態および/または変更が行われてよく、実施形態は説明のためのものであり、限定的なものではない。

【特許請求の範囲】
【請求項1】
画像撮影装置によって撮影されたシーンの距離情報を決定するための方法であって、
前記画像撮影装置によって撮影された前記シーンの第1の画像および第2の画像を取得するステップであって、前記第1の画像は、前記第2の画像の撮影パラメータとは異なる少なくとも1つの撮影パラメータを使用して撮影されており、
前記第1の画像から第1の画像パッチを選択し、前記第2の画像から第2の画像パッチを選択するステップであって、前記第1および第2の画像パッチは、前記第1および第2の画像のそれぞれにおいて撮影された前記シーンの共通部分に対応しており、
前記第1および第2の画像パッチのうちのどちらの方が、より焦点が合った画像パッチであるかを決定するステップと、
前記第1および第2の画像パッチのそれぞれにおけるデータの組合せに基づいて少なくとも1つの値を計算するステップであって、前記組合せは、前記第1および第2の画像パッチのうちのどちらの方が前記より焦点が合った画像パッチと決定されるかに依存しており、
前記少なくとも1つの計算された値から、前記シーンの前記共通部分の前記距離情報を決定するステップと
を有することを特徴とする方法。
【請求項2】
前記計算された値が、前記第1の画像パッチと前記第2の画像パッチとの間の相関に基づく相関値であって、前記相関値が、前記共通部分の輝度における分散の少なくとも1つの推定によって正規化されていることを特徴とする請求項1に記載の方法。
【請求項3】
前記輝度における前記分散の前記推定が、前記より焦点が合った画像パッチから決定されることを特徴とする請求項2に記載の方法。
【請求項4】
窓関数を使用することで前記相関値が計算されることを特徴とする請求項2または3に記載の方法。
【請求項5】
前記計算された値が、前記第1の画像パッチのラプラス画像と、前記第2の画像パッチのラプラス画像との間の相関に基づく相関値であって、前記相関値が、前記共通部分の輝度における分散の少なくとも1つの推定によって正規化されることを特徴とする請求項1に記載の方法。
【請求項6】
前記計算された値が、前記第1および第2の画像に対応する複素OTFの比(複素OTF比率)の少なくとも1つの推定であり、前記複素OTF比率が、前記共通部分の中のオブジェクトへの距離の関数であることを特徴とする請求項1に記載の方法。
【請求項7】
前記複素OTF比率が、
前記パッチごとにフーリエ変換を計算するステップと、
前記フーリエ変換の比率を計算して前記複素OTF比率の推定をもたらすステップであって、前記より焦点が合った画像パッチの前記複素OTFが前記複素OTF比率の分母であるステップによって決定されることを特徴とする請求項6に記載の方法。
【請求項8】
前記計算された値が領域全体の前記複素OTF比率の平均であることを特徴とする請求項6または7に記載の方法。
【請求項9】
前記計算された値が領域全体の前記複素OTF比率の中央値であることを特徴とする請求項6または7に記載の方法。
【請求項10】
前記計算された値が、重み関数によって定義された領域全体の前記複素OTF比率の重み付けされた平均であることを特徴とする請求項6または7に記載の方法。
【請求項11】
前記重み関数が前記画像撮影装置のセンサのナイキスト周波数よりも高い空間周波数でゼロであることを特徴とする請求項10に記載の方法。
【請求項12】
前記重み関数が、前記第1または第2の画像パッチのフーリエ変換の係数に基づいて画素のあらかじめ定められた割合を選択することによって決定された空間周波数でゼロであることを特徴とする請求項10に記載の方法。
【請求項13】
前記複素OTF比率が、
前記パッチごとにフーリエ変換を計算するステップと、
前記フーリエ変換の係数の比率の逆正接を計算して、前記フーリエ変換の位相の差と等しい位相を掛けて、前記複素OTF比率の推定をもたらすステップであって、前記より焦点が合った画像パッチの前記複素OTFが前記複素OTF比率の分母であるステップによって決定されることを特徴とする請求項6に記載の方法。
【請求項14】
前記第1および第2の画像パッチのうちのどちらの方が、より焦点が合った画像パッチであるかを決定するステップが、前記第1および第2の画像パッチの分散を計算するステップおよび前記第1および第2の画像パッチのうち分散の大きい画像パッチを選択するステップによって行われることを特徴とする請求項1ないし13のいずれか1項に記載の方法。
【請求項15】
前記第1および第2の画像パッチを選択するステップが、前記第1および第2の画像のコンテンツに基づいて前記第1の画像と前記第2の画像とを位置合わせするステップを有することを特徴とする請求項1ないし14のいずれか1項に記載の方法。
【請求項16】
画像撮影装置によって撮影されたシーンの距離情報を決定するための方法であって、
前記画像撮影装置によって撮影された前記シーンの第1の画像および第2の画像を取得するステップであって、前記第1の画像は、前記第2の画像の撮影パラメータとは異なる少なくとも1つの撮影パラメータを使用して撮影されており、
前記第1の画像から第1の画像パッチを選択し、前記第2の画像から第2の画像パッチを選択するステップであって、前記第1および第2の画像パッチは、前記第1および第2の画像のそれぞれにおいて撮影された前記シーンの共通部分に対応しており、
前記第1および第2の画像パッチのそれぞれにおけるデータの組合せに基づいて少なくとも1つの値を計算するステップであって、前記少なくとも1つの値は、前記第1および第2の画像に対応する複素OTFの比(複素OTF比率)の少なくとも1つの推定であり、前記複素OTF比率は、前記共通部分の中のオブジェクトへの前記距離の関数であり、
前記少なくとも1つの計算された値から、前記シーンの前記共通部分の前記距離情報を決定するステップと
を有することを特徴とする方法。
【請求項17】
画像撮影装置によって撮影されたシーンの距離マップを決定するための方法であって、
請求項1ないし16のいずれか1項に記載の方法を使用して、前記シーンの複数の部分の距離情報を決定するステップと、
前記決定された距離情報を、前記シーンの距離マップにアセンブルするステップと、
有することを特徴とする方法。
【請求項18】
請求項1ないし17のいずれか1項に記載の方法の各ステップをコンピュータに実行させるためのコンピュータプログラム。
【請求項19】
画像撮影装置によって撮影されたシーンの距離情報を決定するためのコンピュータ装置であって、
前記画像撮影装置によって撮影された前記シーンの第1の画像および第2の画像を取得する手段であって、前記第1の画像は、前記第2の画像の撮影パラメータとは異なる少なくとも1つの撮影パラメータを使用して撮影されており、
前記第1の画像から第1の画像パッチを選択し、前記第2の画像から第2の画像パッチを選択する手段であって、前記第1および第2の画像パッチは、前記第1および第2の画像のそれぞれにおいて撮影された前記シーンの共通部分に対応しており、
前記第1および第2の画像パッチのうちのどちらの方が、より焦点が合った画像パッチであるかを決定する手段と、
前記第1および第2の画像パッチのそれぞれにおけるデータの組合せに基づいて、少なくとも1つの値を計算する手段であって、前記組合せは、前記第1および第2の画像パッチのうちのどちらの方が前記より焦点が合った画像パッチと決定されるかに依存しており、
前記少なくとも1つの計算された値から、前記シーンの前記共通部分の前記距離情報を決定する手段と
を備えることを特徴とするコンピュータ装置。
【請求項20】
画像撮影装置によって撮影されたシーンの距離情報を決定するためのコンピュータ装置であって、
前記画像撮影装置によって撮影された前記シーンの第1の画像および第2の画像を取得する手段であって、前記第1の画像は、前記第2の画像の撮影パラメータとは異なる少なくとも1つの撮影パラメータを使用して撮影されており、
前記第1の画像から第1の画像パッチを選択し、前記第2の画像から第2の画像パッチを選択する手段であって、前記第1および第2の画像パッチは、前記第1および第2の画像のそれぞれにおいて撮影された前記シーンの共通部分に対応しており、
前記第1および第2の画像パッチのそれぞれにおけるデータの組合せに基づいて少なくとも1つの値を計算する手段であって、前記少なくとも1つの値は、前記第1および第2の画像に対応する複素OTFの比(複素OTF比率)の少なくとも1つの推定であり、前記複素OTF比率は、前記共通部分の中のオブジェクトへの距離の関数であり、
前記少なくとも1つの計算された値から、前記シーンの前記共通部分の前記距離情報を決定する手段と
を備えることを特徴とするコンピュータ装置。
【請求項21】
シーンの第1の画像および第2の画像を撮影する画像撮影装置と、
前記第1の画像および前記第2の画像が格納されるメモリと、
前記第1の画像および前記第2の画像に基づいてシーンの距離情報を決定するように構成されたプロセッサとを備え、
前記第1の画像が、前記第2の画像の撮影パラメータとは異なる少なくとも1つの撮影パラメータを使用して撮影されており、
前記プロセッサが、
前記第1の画像から第1の画像パッチを選択し、前記第2の画像から第2の画像パッチを選択し、前記第1および第2の画像パッチは、前記第1および第2の画像のそれぞれにおいて撮影された前記シーンの共通部分に対応しており、
前記第1および第2の画像パッチのうちのどちらの方が、より焦点が合った画像パッチであるかを決定し、
前記第1および第2の画像パッチのそれぞれにおけるデータの組合せに基づいて、少なくとも1つの値を計算し、前記組合せは、前記第1および第2の画像パッチのうちのどちらの方が前記より焦点が合った画像パッチと決定されるかに依存しており、
前記少なくとも1つの計算された値から、前記シーンの前記共通部分の前記距離情報を決定するように構成されていることを特徴とする撮影システム。
【請求項22】
シーンの第1の画像および第2の画像を撮影する画像撮影装置と、
前記第1の画像および前記第2の画像が格納されるメモリと、
前記第1の画像および前記第2の画像に基づいてシーンの距離情報を決定するように構成されたプロセッサとを備え、
前記第1の画像は、前記第2の画像の撮影パラメータとは異なる少なくとも1つの撮影パラメータを使用して撮影されており、
前記プロセッサが、
前記第1の画像から第1の画像パッチを選択し、前記第2の画像から第2の画像パッチを選択し、前記第1および第2の画像パッチは、前記第1および第2の画像のそれぞれにおいて撮影された前記シーンの共通部分に対応しており、
前記第1および第2の画像パッチのそれぞれにおけるデータの組合せに基づいて少なくとも1つの値を計算し、前記少なくとも1つの値は、前記第1および第2の画像に対応する複素OTFの比(複素OTF比率)の少なくとも1つの推定であり、前記複素OTF比率は、前記共通部分の中のオブジェクトへの距離の関数であり、
前記少なくとも1つの計算された値から、前記シーンの前記共通部分の前記距離情報を決定するように構成されていることを特徴とする撮影システム。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14A】
image rotate

【図14B】
image rotate

【図15A】
image rotate

【図15B】
image rotate

【図15C】
image rotate


【公開番号】特開2013−62803(P2013−62803A)
【公開日】平成25年4月4日(2013.4.4)
【国際特許分類】
【出願番号】特願2012−203523(P2012−203523)
【出願日】平成24年9月14日(2012.9.14)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】