画像処理方法及び装置
【課題】原稿画像に複数種類の画像が存在する場合であっても、それぞれの画像の境界線を抽出することによって領域判別を正確に行い、各領域に対して属性に応じた適切な画像処理を行うことのできる画像処理方法及び装置を提供することを目的とする。
【解決手段】入力された画像について画素毎に特徴量を抽出し、特徴量に基づき画素毎に属性を判別して画素属性情報を生成し、画素属性情報に基づいて、ハフ変換を適用して画像を辺の長さが所定の範囲内である矩形の局所領域に分割する処理を再帰的に行い、且つ分割した局所領域について属性を判別することによって画素属性情報を補正し、補正された属性情報に基づいて局所領域に対し属性に対応した画像処理を行う。
【解決手段】入力された画像について画素毎に特徴量を抽出し、特徴量に基づき画素毎に属性を判別して画素属性情報を生成し、画素属性情報に基づいて、ハフ変換を適用して画像を辺の長さが所定の範囲内である矩形の局所領域に分割する処理を再帰的に行い、且つ分割した局所領域について属性を判別することによって画素属性情報を補正し、補正された属性情報に基づいて局所領域に対し属性に対応した画像処理を行う。
【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字画像、網点画像、又は濃淡画像(写真画像)など、種々の属性の画像が混在する原稿画像に対し、その属性に応じた適切な画像処理を行うことのできる画像処理方法及び装置に関し、例えばデジタル複写機などに利用される。
【0002】
【従来の技術】複写機などで使用される原稿には、文字画像のみの原稿、写真画像のみの原稿、網点画像のみの原稿の他、それらが混在している原稿がしばしば用いられる。これら種々の画像に対する画像処理は,それぞれの特性に適応した処理が望ましい。
【0003】そのためには、原稿画像を、文字/写真/網点などの属性に応じた領域に分割する領域判別を正確に行う必要がある。従来の領域判別においては、原稿画像内の画素毎に、注目画素とその周辺画素との間の濃度差、注目画素を含む領域内の最大値と最小値との差、又はヒストグラムなどの濃度情報に基づいて、注目画素の属性を判定する方法がしばしば用いられている。また、注目画素を含む領域内の周波数成分からその領域内の属性を判別する方法も知られている。これらの領域判別のために、ニューラルネットがしばしば用いられる。
【0004】
【発明が解決しようとする課題】ところが、上述した従来の領域判別方法では、原稿画像内の画素毎の属性、又は周辺画素を含めた狭い領域の属性を判別するものであるため、各領域における属性に誤判別がしばしば発生する。
【0005】そのため、原稿画像における実際の1つの属性の領域内に、異なる属性であると誤判別された複数の属性の領域が点在することとなる可能性がある。そうすると、実際には同一の属性の領域であるにも係わらず、誤判別された属性に対応する内容の複数種類の画像処理が実行されることとなり、誤判別による画質劣化が生じるという問題があった。
【0006】本発明は、上述の問題に鑑みてなされたもので、原稿画像に複数種類の画像が存在する場合であっても、それぞれの画像の境界線を抽出することによって領域判別を正確に行い、各領域に対して属性に応じた適切な画像処理を行うことのできる画像処理方法及び装置を提供することを目的とする。
【0007】
【課題を解決するための手段】請求項1の発明に係る方法は、入力された画像について画素毎に特徴量を抽出し、前記特徴量に基づき画素毎に属性を判別して画素属性情報を生成し、前記画素属性情報に基づいて、ハフ変換を適用して前記画像を辺の長さが所定の範囲内である矩形の局所領域に分割する処理を再帰的に行い、且つ分割した局所領域について属性を判別することによって前記画素属性情報を補正し、補正された属性情報に基づいて前記局所領域に対し属性に対応した画像処理を行う。
【0008】請求項2の発明に係る装置は、入力された画像について画素毎に特徴量を抽出する特徴量抽出手段と、前記特徴量に基づき画素毎に属性を判別して画素属性情報を生成する画素属性判別手段と、前記画素属性情報に基づいて、ハフ変換を適用して前記画像を辺の長さが所定の範囲内である局所領域に分割する第1の局所領域抽出手段と、前記局所領域内においてハフ変換を適用し辺の長さが所定の範囲内である局所領域に再分割する処理を再帰的に行う第2の局所領域抽出手段と、分割した各局所領域について属性を判別する局所領域属性判別手段と、前記局所領域毎にその属性に対応した画像処理を行う手段と、を有して構成される。
【0009】請求項3の発明に係る装置では、前記第1の局所領域抽出手段における所定の範囲は、所定の長さLG1以上であり、前記第2の局所領域抽出手段における所定の範囲は、所定の長さLG2(LG2<LG1)以上であり且つ分割しようとする局所領域の辺の長さに対して所定割合の長さ以上である。
【0010】請求項4の発明に係る装置では、前記第1の局所領域抽出手段及び前記第2の局所領域抽出手段は、画素毎に判別された属性に基づいて境界に位置する画素である境界点を抽出する手段と、直交座標平面における前記各境界点に対しハフ変換を適用して極座標平面上の曲線に変換する手段と、極座標平面に変換された各曲線の交点を検出する手段と、検出された交点の極座標を直交座標平面上の直線に逆変換することによって境界線を生成する手段と、前記境界線によって囲まれた領域を局所領域として抽出する手段と、を有してなる。
【0011】本発明による処理を図7及び図8を参照して説明する。図7(A)に概念的に示す原画像RFに対し画素毎に属性判別を行うと、図7(B)に示すように、領域A1であると判別された画素GA1と領域A2であると判別された画素GA2とが混在した属性マップMP1が得られる。
【0012】図7(B)に示す属性マップMP1に対し雑音除去を施すことによって、図7(C)に示す属性マップMP2が得られる。図8(D)は、図7(C)に示す属性マップMP2に対して、領域A2と非領域A2との境界点GBを抽出した結果を示す境界マップMP3である。
【0013】境界点GBに対しハフ変換を適用して所定の長さLG1以上の線分LB3,LB4を検出した結果が、図8(E)に示されている。線分LB3,LB4を境界線として、4つの局所領域AL1〜4に分割されている。
【0014】これらの各局所領域AL1〜4に対して、同様に再度ハフ変換を適用した局所領域ALへの分割が再帰的に行われる。その場合に、所定の長さLG2(LG2<LG1)以上であり且つ分割しようとする局所領域ALの辺の長さに対して所定割合の長さ以上の線分が検出された場合にのみ再分割を行う。再分割の結果得られた局所領域ALのそれぞれにおいて、属性の判別が行われる。
【0015】図8(F)は、各局所領域AL1〜4において、画素GA1の数と画素GA2の数との多い方の画素GAの属性を採用した結果を示す。すなわち、局所領域AL1及び2は領域A1、局所領域AL3及び4は領域A2となっており、これは原画像RFの実際の領域A1,A2に近い。
【0016】本発明の方法を実行するために、又は本発明の各手段を実現するために、所定のプログラムを実行するMPU又はCPU、半導体メモリ又は他の記憶媒体、ニューラルネットワーク、ハードウエア回路などが適宜用いられる。
【0017】本発明によると、画素毎の領域判別結果に対してハフ変換を適用し、画像を複数の局所領域に再帰的に分割してそれぞれの局所領域について属性を決定するので、局所領域内においては同一の属性となって均一な画像処理が可能となり、誤判別による画質劣化が防止される。
【0018】
【発明の実施の形態】図1は本発明に係る画像処理部23を内蔵した画像読取り装置1の全体の構成を示す図である。
【0019】図1において、画像読取り装置1は、本体10、原稿カバー11、原稿載置ガラス12、露光ランプ13、ミラー14a,b,c、レンズ15、CCDセンサ16、スライダー駆動部17、操作パネル部21、制御部22、及び画像処理部23などから構成されている。
【0020】原稿載置ガラス12の上に載置された原稿DRは、露光ランプ13によって照射される。原稿DRからの反射光は、ミラー14a,b,cによってレンズ15に導かれ、原稿DRの画像がCCDセンサ16上で結像する。
【0021】露光ランプ13及びミラー14a,b,cは、スライダー駆動部17によって倍率に応じた速度で移動され、原稿載置ガラス12の上に載置された原稿DRをその全面にわたって走査する。
【0022】CCDセンサ16に入射した原稿DRの反射光は、CCDセンサ16によって電気信号である画像信号SPに変換され、画像処理部23に入力される。画像処理部23において、画像信号SPに対し、種々のアナログ信号処理、A/D変換、及びデジタル画像処理が順次行われる。画像処理が行われた画像データDOは、外部機器24、例えば画像メモリ又はプリンタ部へ出力される。
【0023】図2は画像処理部23の構成を示すブロック図である。画像処理部23は、A/D変換部31、シェーディング補正部32、LOG補正部33、画像格納部34、領域判別部35、及び画像補正部36から構成されている。
【0024】CCDセンサ16から出力された画像信号SPは、A/D変換部31によってデジタル信号である画像データD1に変換され、シェーディング補正部32及びLOG補正部33を経て画像格納部34に格納される。画像格納部34に格納された画像データD3に基づいて、領域判別部35によって局所領域毎の属性が判別され、属性情報DA2が出力される。画像補正部36においては、領域判別部35における判別結果に応じてパラメータが切り換えられ、画像データD3に対し局所領域毎にその属性に対応した画像処理が行われる。
【0025】図3は領域判別部35の構成を示すブロック図である。領域判別部35は、特徴量抽出部41、属性判別部42、演算部43、属性格納部44、及び局所領域属性格納部45から構成される。
【0026】特徴量抽出部41は、入力された画像データD3について画素毎に特徴量DCを抽出する。特徴量抽出部41として、例えばラプラシアンフィルタが用いられる。属性判別部42は、特徴量DCに基づいて画素毎に属性を判別し、属性情報DA1を出力する。属性情報DA1は、本発明における画素属性情報である。属性情報DA1は属性格納部44に格納される。
【0027】演算部43は、属性情報DA1に基づいて、局所領域毎の属性を判別する演算を行って補正された属性情報DA2を出力する。すなわち、演算部43は、属性情報DA1に基づいて、属性の境界に位置する画素に対しハフ変換を適用して画像を辺の長さが所定の範囲内である矩形の局所領域に分割する処理を再帰的に行い、且つ分割した局所領域について属性を判別することによって属性情報DA1を補正し、補正された属性情報である属性情報DA2を出力する。
【0028】局所領域への分割又は抽出に当たっては、ハフ変換を適用して所定の長さLG1以上の線分を検出し、検出した線分によって囲まれる矩形の領域を局所領域とする。次に、抽出された局所領域に対して、ハフ変換を再度適用して所定の長さLG2(LG2<LG1)以上であり且つ当該局所領域の縦又は横のそれぞれの辺の長さに対して所定割合の長さ以上の線分を検出し、線分が検出された場合にその線分によって囲まれる矩形の領域を局所領域とする。このように、ハフ変換を適用した局所領域の抽出を線分が検出されなくなるまで再帰的に行う。
【0029】したがって、画像格納部34から読み出された画像データD3は、特徴量抽出部41において画素毎の特徴量DCが抽出され,属性判別部42において画素毎の属性が判別され、得られた属性情報DA1が属性格納部44に格納される。属性格納部44に格納された属性情報DA1は演算部43により読み出され、ハフ変換を適用して局所領域ALの抽出及びその属性の判別が行われる。判別結果である属性情報DA2は局所領域属性格納部45に格納される。
【0030】演算部43及び属性格納部44によって、属性補正部AMが構成されている。属性補正部AMは、本発明における第1の局所領域抽出手段、第2の局所領域抽出手段、及び局所領域属性判別手段に相当する。次に、属性補正部AMにおける第1の局所領域抽出手段に相当する部分である第1の局所領域抽出部AME1の機能的な構成について説明する。第2の局所領域抽出手段の機能的な構成は、第1の局所領域抽出手段と同一であるので、説明を省略する。局所領域属性判別手段については、図示は省略したが、属性判別部57として以下に説明する。
【0031】図4は第1の局所領域抽出部AME1の構成を機能的に示すブロック図である。第1の局所領域抽出部AME1は、ノイズ除去処理部51、境界点抽出部52、ハフ変換部53、交点検出部54、逆変換部55、及び局所領域抽出部56から構成されている。
【0032】ノイズ除去処理部51は、属性情報DA1に含まれるノイズを除去するための処理を行う。ノイズ除去処理部51では、ある画像の領域に含まれる小さな面積の他の画像の領域を削除する。例えば、写真画像及び網点画像の候補領域に含まれる14ポイントの文字サイズ以下の面積領域を除去する。これによって属性情報DA1aが得られる。
【0033】境界点抽出部52は、画素毎に判別された属性の情報である属性情報DA1aに基づいて、境界に位置する画素である境界点PBを抽出する。ハフ変換部53は、直交座標平面における各境界点PBに対し、ハフ変換(Hough変換)を適用して極座標平面上の曲線に変換する。交点検出部54は、極座標平面に変換された各曲線の交点PCを検出する。逆変換部55は、検出された交点PCの極座標を直交座標平面上の直線に逆変換することによって境界線LBを生成する。局所領域抽出部56は、境界線LBによって囲まれた領域を局所領域ALとして抽出する。
【0034】属性判別部57は、局所領域AL毎の属性を判別し、その判別結果である属性情報DA2を出力する。局所領域AL毎の属性の判別に当たっては、画素毎に判別された属性が用いられる。例えば、1つの局所領域AL内において、特定の属性の画素が50パーセント以上あれば、その画素の属性を局所領域ALの属性とする。また、局所領域AL内に3種類以上の属性の画素が混在する場合には、それらのうちの画素数の最も多い属性を局所領域ALの属性とする。
【0035】図5は画像補正部36の構成を示すブロック図である。図5において、画像補正部36は、変倍/移動処理部61、MTF補正部62、濃度補正部63、及び2値化処理部64から構成される。これらの各部において、それぞれの処理のためのパラメータが、領域判別部35から出力される属性情報DA2に基づいて設定される。これによって、局所領域AL毎に、その属性に対応した画像処理が行われる。例えば、文字領域に対してはエッジ強調処理、写真画像に対しては平滑化処理、網点画像に対してはフィルタリング処理などが行われる。
【0036】次に、領域判別部35の処理動作、特に属性情報DAの処理動作についてさらに詳しく説明する。まず、ハフ変換について簡単に説明する。図6はハフ変換の概念を示す図である。このうち、図6(A)はx−y空間(直交座標平面)における各点A〜Gの位置を示し、図6(B)は各点A〜Gをハフ変換によってρ−θ空間(極座標平面)上に表した曲線を示す。
【0037】ハフ変換は、画像の中から、直線、円、楕円などの図形を検出するための方法である。特に、Duda and Hartの方法による直線検出方法がよく用いられており、本実施形態においてもこの方法を用いる。この方法においては、直線を、ρ=xcosθ+ysinθ ……(1)
で表現する。ここで、ρは原点から直線へ下ろした垂線の長さ、θは垂線とx軸のなす角度である。
【0038】図6(A)に示すx−y空間上の点、例えばA点(x0 ,y0 )は、(1)式によると、図6(B)に示すρーθ空間においては、1本の正弦曲線の軌跡ρ=x0 cosθ+y0 sinθに対応する。
【0039】これとは逆に、ρ−θ空間における1本の正弦曲線の軌跡は、x−y空間において(x0 ,y0 )を通る総ての直線群を表している。したがって、x−y空間における1本の直線上の各点をそれぞれρ−θ空間に変換した場合、これらの点からρ−θ空間上に作られる各正弦曲線の軌跡は一点で交わることとなる。軌跡の交わった点を逆変換することによって、x−y空間に1本の直線が得られる。つまり、この方法によれば、離散的な点に基づいて、換言すれば直線にとぎれのある場合であっても、1本の直線を検出することができる。
【0040】図6(A)において、x−y空間上の点A,B,C,Dは1本の直線LB1上の点である。直線LB1において、θはπ/4である。これらの各点をハフ変換によりρ−θ空間上に変換すると、図6(B)に示すように、それぞれ正弦曲線の軌跡となり、それぞれの軌跡は交点αで交わる。
【0041】同様に、x−y空間上の点E,B,F,Gは1本の直線LB2上の点である。直線LB2において、θはπ/2である。これらの各点をハフ変換によりρ−θ空間上に変換すると、図6(B)に示すような正弦曲線の軌跡となり、それぞれの軌跡は交点βで交わる。
【0042】このように、x−y空間において軸に平行又は垂直な直線は、ρ−θ空間においてはθ=0、π/2、πの位置に交点がある。したがって、θ=0、π/2、πの位置に交点があった場合に、その交点をx−y空間上に逆変換することによって、直線(線分)を求めることができる。
【0043】直線を求めるための具体的な手法としては、原画像から直線の要素候補となる画素位置を検出し、その画素位置に対応するρ−θ空間上の軌跡の各点を求める。得られた各点によって、ρ−θ空間における座標位置に対しカウントアップする。ある閾値以上のカウント値をもつ点(極大値点)が交点であるから、その極大値点に対し(1)式を用いて逆変換を施すことによって、x−y平面上の直線が抽出される。
【0044】また、その極大値点を通る軌跡に対応するx−y平面上の座標位置に基づいて、直線(線分)の長さが検出される。例えば、図6において、A,B,C,Dの各点が直線上にあることが検出された場合に、これら4点の中の端の点E及びGを検出し、これら2点間の距離を測定すればよい。したがって、所定の長さ以上の線分のみを抽出することが可能である。
【0045】次に、画像読取り装置1における属性補正処理の動作を説明する。図7及び図8は属性補正処理の動作を概念的に説明するための図である。図7(A)には、原稿DRの画像である原画像RFについて、属性の異なる2つの領域A1及び領域A2の境界部が示されている。なお、領域A1は、領域A2でない領域、つまり非領域A2である。原画像RFに対し、画素毎に属性判別を行うと、図7(B)に示すように、領域A1であると判別された画素GA1と領域A2であると判別された画素GA2とが混在した属性マップMP1が得られる。各画素GA1は白色で、各画素GA2は灰色で、それぞれ示されている。
【0046】図7(B)に示す属性マップMP1によると、一方の領域が他方の領域に入り込んだ状態となっており、雑音の混じった状態である。属性マップMP1に対し雑音除去を施すことによって、図7(C)に示す属性マップMP2が得られる。雑音除去を施すことによって、境界点の個数が減少して演算時間が低減し、且つ誤判別も減少する。なお、雑音除去処理の方法として、ある所定サイズ以下の面積領域を削除する方法、ある所定サイズのマトリクス内の属性カウント値に応じて属性マップを補正する方法などがある。
【0047】図8(D)は、図7(C)に示す属性マップMP2に対して、領域A2と非領域A2との境界点GBを抽出した結果を示す境界マップMP3である。なお境界点GBは画素GA2について検出されており、画素GA2について、画素GA1との境界部分が境界点GBとして抽出されている。各境界点GBは黒色で示されている。
【0048】境界点GBに対しハフ変換を適用して所定の長さ以上の線分LB3,LB4を検出した結果が、図8(E)に示されている。線分LB3,LB4を境界線として、4つの局所領域AL1〜4に分割されている。これらの局所領域AL1〜4のそれぞれにおいて、属性の判別が行われる。
【0049】図8(F)は、各局所領域AL1〜4において、画素GA1の数と画素GA2の数との多い方の画素GAの属性を採用した結果を示す。すなわち、局所領域AL1及び2は領域A1、局所領域AL3及び4は領域A2となっており、これは原画像RFの実際の領域A1,A2に近い。なお、各局所領域ALの属性を判別するに当たって、各局所領域AL内において、それぞれの画素GA1,GA2の数をカウントし、カウント値の大きい画素GAの属性を採用すればよい。
【0050】なお、図8における説明では、局所領域ALへの分割を1回のみ行うように説明したが、画像読取り装置1においては、誤判別をできるだけ低減するため、分割された局所領域ALに対し、所定の長さLG2以上の線分が検出されなくなるまで、局所領域ALへの分割を再帰的に行う。
【0051】次に、属性補正処理における局所領域ALの分割方法について詳しく説明する。図9は局所領域ALへの分割の方法を概念的に示す図、図10は局所領域AL内における再度の分割を示す図である。
【0052】図9(A)に示す原画像RF1は、文字画像領域A3及び写真画像領域A4を有している。原画像RF1に対して、先に説明したようにハフ変換を適用して境界線LBを引き、図9(B)に示すように境界線LBで囲まれた複数の局所領域ALに分割する。ここで、境界線LBは、所定の長さLG1以上の線分を検出した場合に、その線分を画像全体に延長したものである。さらに、分割された局所領域AL内において、上述と同様に再度ハフ変換を適用し、所定の長さLG2以上の線分を抽出する。抽出された線分を境界線LBとし、その局所領域ALを再分割する。
【0053】図10(A)には、図9(B)に示された1つの局所領域AL0が示されている。局所領域AL0は、境界線LB5〜8によって囲まれた領域である。局所領域AL0内において再分割を行うことによって、2つの境界線LB9,LB10が抽出され、これによって図10(B)に示すように4つの局所領域AL00、AL01、AL10、AL11に分割される。
【0054】ここで、ハフ変換の適用により抽出される線分の長さについて具体例を挙げると、1回目の分割においては、所定の長さLG1を例えば1cmとする。これは、400dpiの密度において約150dotに相当する。その場合に、2回目以降の分割においては、所定の長さLG2を1cmよりも小さくし、且つ局所領域ALの縦及び横の長さについてそれぞれ30%以上とする。なお、所定の長さLG1を、数mm乃至数cmの範囲の適当な値に設定してもよい。但し、所定の長さLGが小さくなると精度はよいが演算に時間がかかる。大きくなると演算速度は速いが誤判別の生じる率が高くなる。
【0055】分割されたそれぞれの局所領域ALにおいて、その属性が判別される。図10(B)で明らかなように、局所領域AL0内において抽出された境界線LB9,LB10によって分割されるのは、局所領域AL0の内部のみである。したがって、分割する必要のない局所領域ALについては無駄な分割が行われないので、演算に要する時間が短縮される。
【0056】上述の実施形態によると、原画像RFに文字/写真/網点などの複数種類の画像が存在する場合であっても、ハフ変換を適用してそれぞれの画像の境界線LBを抽出することによって領域判別を正確に行い、各局所領域ALに対して属性に応じた適切な画像処理を行うことができる。
【0057】次に、属性補正処理についてフローチャートを参照して説明する。図11は属性補正処理の全体を示すフローチャート、図12はハフ変換による属性判別処理を示すフローチャート、図13は局所領域分割処理を示すフローチャートである。
【0058】図11において、各画素毎に属性を判別し(#11)、属性マップMPを作成し(#12)、ハフ変換による属性判別処理を行う(#13)。図12において、孤立点を除去することにより雑音を取り除いた後(#21)、境界点GBを検出する(#22)。そして局所領域分割処理を行い(#23)、属性を決定する(#24)。
【0059】図13において、ハフ変換を行い(#31)、一辺の長さが所定の長さLG1以上である局所領域ALに分割する(#32)。次に、局所領域内においてハフ変換を行い(#33)、一辺の長さが所定の長さLG2以上であり且つ当該局所領域ALの縦及び横の長さについてそれぞれ所定の割合以上である局所領域ALに分割する(#34、36)。局所領域ALの再分割ができなくなれば(#35でイエス)、リターンする。
【0060】図14は属性補正処理の他の例を示すフローチャートである。図14に示すフローチャートにおいては、文字画像の領域と写真/網点画像の領域とで属性情報DAの補正処理の内容が異なる。
【0061】各画素毎に属性を判別し(#41)、属性毎に属性マップMPを作成する(#42)。つまり、文字、写真、及び網点の各画像の候補領域毎に属性マップMPを作成する。
【0062】写真又は網点の候補領域に対しては(#43でノー)、それぞれの属性マップMPについてノイズ除去処理が行われる(#44)。ここでは、候補領域に含まれる最大文字サイズ(14ポイント)よりも小さい面積領域を除去する。これによってノイズの大半が除去される。そして、境界点抽出処理が行われ(#45)、局所領域分割処理が行われ(#46)、属性の決定が行われる(#47)。
【0063】文字画像の候補領域に対しては(#43でイエス)、写真又は網点の領域と重なる部分を削除する(#48)。ここでの処理は、写真及び網点の領域をステップ#47で決定した後に行われる。残った文字画像の領域について、モホロジー処理の1種であるクロージング(Closing)処理を行う(#49)。クロージング処理では、最大文字サイズ(14ポイント)相当のディスクフィルタを用い、画像を一旦太らせた後に縮める処理を行う。
【0064】その後、文字、写真及び網点の各画像の領域を合成する(#50)。ここでは、画素毎の属性の判別の精度のよい順、例えば、網点、写真、文字の順に優先して合成する。つまり、領域が互いに重複する場合には、網点、写真、文字の順に優先して領域を確保する。
【0065】写真画像に含まれる髪の毛の画像は、画素毎の属性判別において文字画像又は網点画像であると誤判別されることがしばしばあるが、図14のフローチャートによると、それらの領域に対してハフ変換を適用することにより、そのような誤判別が補正され、正しく写真画像であると判別される。また、文字画像は、その中に網点画像が含まれていると誤判別されることがあるが、文字画像に対してクロージング処理を行うことにより、及び網点画像に対してハフ変換による属性判別処理を行うことにより、領域が正しく判別される。
【0066】すなわち、図14のフローチャートによると、まず、原画像RFに対して、写真、網点、文字のそれぞれの属性を画素毎に判別して属性マップをそれぞれ生成する。次に、それぞれの属性マップに対して、ハフ変換による属性補正処理(#46)、ハフ変換以外の処理による属性補正処理(#49)を行い、これによってそれぞれ補正された属性マップを得る。そして、補正された属性マップを合成する。
【0067】上述の実施形態において、画像補正部36、属性補正部AM、第1の局所領域抽出部AME1、属性判別部57、又は局所領域属性格納部45の構成、処理内容、処理順序、処理タイミング、その他、画像読取り装置1の全体又は各部の構成などは、本発明の主旨に沿って適宜変更することができる。
【0068】
【発明の効果】請求項1乃至請求項4の発明によると、原稿画像に複数種類の画像が存在する場合であっても、それぞれの画像の境界線を抽出することによって領域判別を正確に行い、各領域に対して属性に応じた適切な画像処理を行うことができる。
【0069】特に、局所領域に分割する処理を再帰的に行うので、所定の範囲内において細かく分割して精度の高い領域分割を行うことができ、しかも分割する必要のない局所領域については無駄な分割が行われないので、演算に要する時間が短縮され処理速度が向上する。
【図面の簡単な説明】
【図1】本発明に係る画像処理部を内蔵した画像読取り装置の全体の構成を示す図である。
【図2】画像処理部の構成を示すブロック図である。
【図3】領域判別部の構成を示すブロック図である。
【図4】第1の局所領域抽出部の構成を機能的に示すブロック図である。
【図5】画像補正部の構成を示すブロック図である。
【図6】ハフ変換の概念を示す図である。
【図7】属性補正処理の動作を概念的に説明するための図である。
【図8】属性補正処理の動作を概念的に説明するための図である。
【図9】局所領域への分割の方法を概念的に示す図である。
【図10】局所領域内における再度の分割を示す図である。
【図11】属性補正処理の全体を示すフローチャートである。
【図12】ハフ変換による属性判別処理を示すフローチャートである。
【図13】局所領域分割処理を示すフローチャートである。
【図14】属性補正処理の他の例を示すフローチャートである。
【符号の説明】
36 画像補正部(画像処理を行う手段)
41 特徴量抽出部(特徴量抽出手段)
42 属性判別部(画素属性判別手段)
52 境界点抽出部(境界点を抽出する手段)
53 ハフ変換部(極座標平面上の曲線に変換する手段)
54 交点検出部(交点を検出する手段)
55 逆変換部(境界線を生成する手段)
56 局所領域抽出部(局所領域として抽出する手段)
57 属性判別部(局所領域属性判別手段)
AM 属性補正部(第1の局所領域抽出手段、第2の局所領域抽出手段、局所領域属性判別手段)
AME1 第1の局所領域抽出部(第1の局所領域抽出手段)
【0001】
【発明の属する技術分野】本発明は、文字画像、網点画像、又は濃淡画像(写真画像)など、種々の属性の画像が混在する原稿画像に対し、その属性に応じた適切な画像処理を行うことのできる画像処理方法及び装置に関し、例えばデジタル複写機などに利用される。
【0002】
【従来の技術】複写機などで使用される原稿には、文字画像のみの原稿、写真画像のみの原稿、網点画像のみの原稿の他、それらが混在している原稿がしばしば用いられる。これら種々の画像に対する画像処理は,それぞれの特性に適応した処理が望ましい。
【0003】そのためには、原稿画像を、文字/写真/網点などの属性に応じた領域に分割する領域判別を正確に行う必要がある。従来の領域判別においては、原稿画像内の画素毎に、注目画素とその周辺画素との間の濃度差、注目画素を含む領域内の最大値と最小値との差、又はヒストグラムなどの濃度情報に基づいて、注目画素の属性を判定する方法がしばしば用いられている。また、注目画素を含む領域内の周波数成分からその領域内の属性を判別する方法も知られている。これらの領域判別のために、ニューラルネットがしばしば用いられる。
【0004】
【発明が解決しようとする課題】ところが、上述した従来の領域判別方法では、原稿画像内の画素毎の属性、又は周辺画素を含めた狭い領域の属性を判別するものであるため、各領域における属性に誤判別がしばしば発生する。
【0005】そのため、原稿画像における実際の1つの属性の領域内に、異なる属性であると誤判別された複数の属性の領域が点在することとなる可能性がある。そうすると、実際には同一の属性の領域であるにも係わらず、誤判別された属性に対応する内容の複数種類の画像処理が実行されることとなり、誤判別による画質劣化が生じるという問題があった。
【0006】本発明は、上述の問題に鑑みてなされたもので、原稿画像に複数種類の画像が存在する場合であっても、それぞれの画像の境界線を抽出することによって領域判別を正確に行い、各領域に対して属性に応じた適切な画像処理を行うことのできる画像処理方法及び装置を提供することを目的とする。
【0007】
【課題を解決するための手段】請求項1の発明に係る方法は、入力された画像について画素毎に特徴量を抽出し、前記特徴量に基づき画素毎に属性を判別して画素属性情報を生成し、前記画素属性情報に基づいて、ハフ変換を適用して前記画像を辺の長さが所定の範囲内である矩形の局所領域に分割する処理を再帰的に行い、且つ分割した局所領域について属性を判別することによって前記画素属性情報を補正し、補正された属性情報に基づいて前記局所領域に対し属性に対応した画像処理を行う。
【0008】請求項2の発明に係る装置は、入力された画像について画素毎に特徴量を抽出する特徴量抽出手段と、前記特徴量に基づき画素毎に属性を判別して画素属性情報を生成する画素属性判別手段と、前記画素属性情報に基づいて、ハフ変換を適用して前記画像を辺の長さが所定の範囲内である局所領域に分割する第1の局所領域抽出手段と、前記局所領域内においてハフ変換を適用し辺の長さが所定の範囲内である局所領域に再分割する処理を再帰的に行う第2の局所領域抽出手段と、分割した各局所領域について属性を判別する局所領域属性判別手段と、前記局所領域毎にその属性に対応した画像処理を行う手段と、を有して構成される。
【0009】請求項3の発明に係る装置では、前記第1の局所領域抽出手段における所定の範囲は、所定の長さLG1以上であり、前記第2の局所領域抽出手段における所定の範囲は、所定の長さLG2(LG2<LG1)以上であり且つ分割しようとする局所領域の辺の長さに対して所定割合の長さ以上である。
【0010】請求項4の発明に係る装置では、前記第1の局所領域抽出手段及び前記第2の局所領域抽出手段は、画素毎に判別された属性に基づいて境界に位置する画素である境界点を抽出する手段と、直交座標平面における前記各境界点に対しハフ変換を適用して極座標平面上の曲線に変換する手段と、極座標平面に変換された各曲線の交点を検出する手段と、検出された交点の極座標を直交座標平面上の直線に逆変換することによって境界線を生成する手段と、前記境界線によって囲まれた領域を局所領域として抽出する手段と、を有してなる。
【0011】本発明による処理を図7及び図8を参照して説明する。図7(A)に概念的に示す原画像RFに対し画素毎に属性判別を行うと、図7(B)に示すように、領域A1であると判別された画素GA1と領域A2であると判別された画素GA2とが混在した属性マップMP1が得られる。
【0012】図7(B)に示す属性マップMP1に対し雑音除去を施すことによって、図7(C)に示す属性マップMP2が得られる。図8(D)は、図7(C)に示す属性マップMP2に対して、領域A2と非領域A2との境界点GBを抽出した結果を示す境界マップMP3である。
【0013】境界点GBに対しハフ変換を適用して所定の長さLG1以上の線分LB3,LB4を検出した結果が、図8(E)に示されている。線分LB3,LB4を境界線として、4つの局所領域AL1〜4に分割されている。
【0014】これらの各局所領域AL1〜4に対して、同様に再度ハフ変換を適用した局所領域ALへの分割が再帰的に行われる。その場合に、所定の長さLG2(LG2<LG1)以上であり且つ分割しようとする局所領域ALの辺の長さに対して所定割合の長さ以上の線分が検出された場合にのみ再分割を行う。再分割の結果得られた局所領域ALのそれぞれにおいて、属性の判別が行われる。
【0015】図8(F)は、各局所領域AL1〜4において、画素GA1の数と画素GA2の数との多い方の画素GAの属性を採用した結果を示す。すなわち、局所領域AL1及び2は領域A1、局所領域AL3及び4は領域A2となっており、これは原画像RFの実際の領域A1,A2に近い。
【0016】本発明の方法を実行するために、又は本発明の各手段を実現するために、所定のプログラムを実行するMPU又はCPU、半導体メモリ又は他の記憶媒体、ニューラルネットワーク、ハードウエア回路などが適宜用いられる。
【0017】本発明によると、画素毎の領域判別結果に対してハフ変換を適用し、画像を複数の局所領域に再帰的に分割してそれぞれの局所領域について属性を決定するので、局所領域内においては同一の属性となって均一な画像処理が可能となり、誤判別による画質劣化が防止される。
【0018】
【発明の実施の形態】図1は本発明に係る画像処理部23を内蔵した画像読取り装置1の全体の構成を示す図である。
【0019】図1において、画像読取り装置1は、本体10、原稿カバー11、原稿載置ガラス12、露光ランプ13、ミラー14a,b,c、レンズ15、CCDセンサ16、スライダー駆動部17、操作パネル部21、制御部22、及び画像処理部23などから構成されている。
【0020】原稿載置ガラス12の上に載置された原稿DRは、露光ランプ13によって照射される。原稿DRからの反射光は、ミラー14a,b,cによってレンズ15に導かれ、原稿DRの画像がCCDセンサ16上で結像する。
【0021】露光ランプ13及びミラー14a,b,cは、スライダー駆動部17によって倍率に応じた速度で移動され、原稿載置ガラス12の上に載置された原稿DRをその全面にわたって走査する。
【0022】CCDセンサ16に入射した原稿DRの反射光は、CCDセンサ16によって電気信号である画像信号SPに変換され、画像処理部23に入力される。画像処理部23において、画像信号SPに対し、種々のアナログ信号処理、A/D変換、及びデジタル画像処理が順次行われる。画像処理が行われた画像データDOは、外部機器24、例えば画像メモリ又はプリンタ部へ出力される。
【0023】図2は画像処理部23の構成を示すブロック図である。画像処理部23は、A/D変換部31、シェーディング補正部32、LOG補正部33、画像格納部34、領域判別部35、及び画像補正部36から構成されている。
【0024】CCDセンサ16から出力された画像信号SPは、A/D変換部31によってデジタル信号である画像データD1に変換され、シェーディング補正部32及びLOG補正部33を経て画像格納部34に格納される。画像格納部34に格納された画像データD3に基づいて、領域判別部35によって局所領域毎の属性が判別され、属性情報DA2が出力される。画像補正部36においては、領域判別部35における判別結果に応じてパラメータが切り換えられ、画像データD3に対し局所領域毎にその属性に対応した画像処理が行われる。
【0025】図3は領域判別部35の構成を示すブロック図である。領域判別部35は、特徴量抽出部41、属性判別部42、演算部43、属性格納部44、及び局所領域属性格納部45から構成される。
【0026】特徴量抽出部41は、入力された画像データD3について画素毎に特徴量DCを抽出する。特徴量抽出部41として、例えばラプラシアンフィルタが用いられる。属性判別部42は、特徴量DCに基づいて画素毎に属性を判別し、属性情報DA1を出力する。属性情報DA1は、本発明における画素属性情報である。属性情報DA1は属性格納部44に格納される。
【0027】演算部43は、属性情報DA1に基づいて、局所領域毎の属性を判別する演算を行って補正された属性情報DA2を出力する。すなわち、演算部43は、属性情報DA1に基づいて、属性の境界に位置する画素に対しハフ変換を適用して画像を辺の長さが所定の範囲内である矩形の局所領域に分割する処理を再帰的に行い、且つ分割した局所領域について属性を判別することによって属性情報DA1を補正し、補正された属性情報である属性情報DA2を出力する。
【0028】局所領域への分割又は抽出に当たっては、ハフ変換を適用して所定の長さLG1以上の線分を検出し、検出した線分によって囲まれる矩形の領域を局所領域とする。次に、抽出された局所領域に対して、ハフ変換を再度適用して所定の長さLG2(LG2<LG1)以上であり且つ当該局所領域の縦又は横のそれぞれの辺の長さに対して所定割合の長さ以上の線分を検出し、線分が検出された場合にその線分によって囲まれる矩形の領域を局所領域とする。このように、ハフ変換を適用した局所領域の抽出を線分が検出されなくなるまで再帰的に行う。
【0029】したがって、画像格納部34から読み出された画像データD3は、特徴量抽出部41において画素毎の特徴量DCが抽出され,属性判別部42において画素毎の属性が判別され、得られた属性情報DA1が属性格納部44に格納される。属性格納部44に格納された属性情報DA1は演算部43により読み出され、ハフ変換を適用して局所領域ALの抽出及びその属性の判別が行われる。判別結果である属性情報DA2は局所領域属性格納部45に格納される。
【0030】演算部43及び属性格納部44によって、属性補正部AMが構成されている。属性補正部AMは、本発明における第1の局所領域抽出手段、第2の局所領域抽出手段、及び局所領域属性判別手段に相当する。次に、属性補正部AMにおける第1の局所領域抽出手段に相当する部分である第1の局所領域抽出部AME1の機能的な構成について説明する。第2の局所領域抽出手段の機能的な構成は、第1の局所領域抽出手段と同一であるので、説明を省略する。局所領域属性判別手段については、図示は省略したが、属性判別部57として以下に説明する。
【0031】図4は第1の局所領域抽出部AME1の構成を機能的に示すブロック図である。第1の局所領域抽出部AME1は、ノイズ除去処理部51、境界点抽出部52、ハフ変換部53、交点検出部54、逆変換部55、及び局所領域抽出部56から構成されている。
【0032】ノイズ除去処理部51は、属性情報DA1に含まれるノイズを除去するための処理を行う。ノイズ除去処理部51では、ある画像の領域に含まれる小さな面積の他の画像の領域を削除する。例えば、写真画像及び網点画像の候補領域に含まれる14ポイントの文字サイズ以下の面積領域を除去する。これによって属性情報DA1aが得られる。
【0033】境界点抽出部52は、画素毎に判別された属性の情報である属性情報DA1aに基づいて、境界に位置する画素である境界点PBを抽出する。ハフ変換部53は、直交座標平面における各境界点PBに対し、ハフ変換(Hough変換)を適用して極座標平面上の曲線に変換する。交点検出部54は、極座標平面に変換された各曲線の交点PCを検出する。逆変換部55は、検出された交点PCの極座標を直交座標平面上の直線に逆変換することによって境界線LBを生成する。局所領域抽出部56は、境界線LBによって囲まれた領域を局所領域ALとして抽出する。
【0034】属性判別部57は、局所領域AL毎の属性を判別し、その判別結果である属性情報DA2を出力する。局所領域AL毎の属性の判別に当たっては、画素毎に判別された属性が用いられる。例えば、1つの局所領域AL内において、特定の属性の画素が50パーセント以上あれば、その画素の属性を局所領域ALの属性とする。また、局所領域AL内に3種類以上の属性の画素が混在する場合には、それらのうちの画素数の最も多い属性を局所領域ALの属性とする。
【0035】図5は画像補正部36の構成を示すブロック図である。図5において、画像補正部36は、変倍/移動処理部61、MTF補正部62、濃度補正部63、及び2値化処理部64から構成される。これらの各部において、それぞれの処理のためのパラメータが、領域判別部35から出力される属性情報DA2に基づいて設定される。これによって、局所領域AL毎に、その属性に対応した画像処理が行われる。例えば、文字領域に対してはエッジ強調処理、写真画像に対しては平滑化処理、網点画像に対してはフィルタリング処理などが行われる。
【0036】次に、領域判別部35の処理動作、特に属性情報DAの処理動作についてさらに詳しく説明する。まず、ハフ変換について簡単に説明する。図6はハフ変換の概念を示す図である。このうち、図6(A)はx−y空間(直交座標平面)における各点A〜Gの位置を示し、図6(B)は各点A〜Gをハフ変換によってρ−θ空間(極座標平面)上に表した曲線を示す。
【0037】ハフ変換は、画像の中から、直線、円、楕円などの図形を検出するための方法である。特に、Duda and Hartの方法による直線検出方法がよく用いられており、本実施形態においてもこの方法を用いる。この方法においては、直線を、ρ=xcosθ+ysinθ ……(1)
で表現する。ここで、ρは原点から直線へ下ろした垂線の長さ、θは垂線とx軸のなす角度である。
【0038】図6(A)に示すx−y空間上の点、例えばA点(x0 ,y0 )は、(1)式によると、図6(B)に示すρーθ空間においては、1本の正弦曲線の軌跡ρ=x0 cosθ+y0 sinθに対応する。
【0039】これとは逆に、ρ−θ空間における1本の正弦曲線の軌跡は、x−y空間において(x0 ,y0 )を通る総ての直線群を表している。したがって、x−y空間における1本の直線上の各点をそれぞれρ−θ空間に変換した場合、これらの点からρ−θ空間上に作られる各正弦曲線の軌跡は一点で交わることとなる。軌跡の交わった点を逆変換することによって、x−y空間に1本の直線が得られる。つまり、この方法によれば、離散的な点に基づいて、換言すれば直線にとぎれのある場合であっても、1本の直線を検出することができる。
【0040】図6(A)において、x−y空間上の点A,B,C,Dは1本の直線LB1上の点である。直線LB1において、θはπ/4である。これらの各点をハフ変換によりρ−θ空間上に変換すると、図6(B)に示すように、それぞれ正弦曲線の軌跡となり、それぞれの軌跡は交点αで交わる。
【0041】同様に、x−y空間上の点E,B,F,Gは1本の直線LB2上の点である。直線LB2において、θはπ/2である。これらの各点をハフ変換によりρ−θ空間上に変換すると、図6(B)に示すような正弦曲線の軌跡となり、それぞれの軌跡は交点βで交わる。
【0042】このように、x−y空間において軸に平行又は垂直な直線は、ρ−θ空間においてはθ=0、π/2、πの位置に交点がある。したがって、θ=0、π/2、πの位置に交点があった場合に、その交点をx−y空間上に逆変換することによって、直線(線分)を求めることができる。
【0043】直線を求めるための具体的な手法としては、原画像から直線の要素候補となる画素位置を検出し、その画素位置に対応するρ−θ空間上の軌跡の各点を求める。得られた各点によって、ρ−θ空間における座標位置に対しカウントアップする。ある閾値以上のカウント値をもつ点(極大値点)が交点であるから、その極大値点に対し(1)式を用いて逆変換を施すことによって、x−y平面上の直線が抽出される。
【0044】また、その極大値点を通る軌跡に対応するx−y平面上の座標位置に基づいて、直線(線分)の長さが検出される。例えば、図6において、A,B,C,Dの各点が直線上にあることが検出された場合に、これら4点の中の端の点E及びGを検出し、これら2点間の距離を測定すればよい。したがって、所定の長さ以上の線分のみを抽出することが可能である。
【0045】次に、画像読取り装置1における属性補正処理の動作を説明する。図7及び図8は属性補正処理の動作を概念的に説明するための図である。図7(A)には、原稿DRの画像である原画像RFについて、属性の異なる2つの領域A1及び領域A2の境界部が示されている。なお、領域A1は、領域A2でない領域、つまり非領域A2である。原画像RFに対し、画素毎に属性判別を行うと、図7(B)に示すように、領域A1であると判別された画素GA1と領域A2であると判別された画素GA2とが混在した属性マップMP1が得られる。各画素GA1は白色で、各画素GA2は灰色で、それぞれ示されている。
【0046】図7(B)に示す属性マップMP1によると、一方の領域が他方の領域に入り込んだ状態となっており、雑音の混じった状態である。属性マップMP1に対し雑音除去を施すことによって、図7(C)に示す属性マップMP2が得られる。雑音除去を施すことによって、境界点の個数が減少して演算時間が低減し、且つ誤判別も減少する。なお、雑音除去処理の方法として、ある所定サイズ以下の面積領域を削除する方法、ある所定サイズのマトリクス内の属性カウント値に応じて属性マップを補正する方法などがある。
【0047】図8(D)は、図7(C)に示す属性マップMP2に対して、領域A2と非領域A2との境界点GBを抽出した結果を示す境界マップMP3である。なお境界点GBは画素GA2について検出されており、画素GA2について、画素GA1との境界部分が境界点GBとして抽出されている。各境界点GBは黒色で示されている。
【0048】境界点GBに対しハフ変換を適用して所定の長さ以上の線分LB3,LB4を検出した結果が、図8(E)に示されている。線分LB3,LB4を境界線として、4つの局所領域AL1〜4に分割されている。これらの局所領域AL1〜4のそれぞれにおいて、属性の判別が行われる。
【0049】図8(F)は、各局所領域AL1〜4において、画素GA1の数と画素GA2の数との多い方の画素GAの属性を採用した結果を示す。すなわち、局所領域AL1及び2は領域A1、局所領域AL3及び4は領域A2となっており、これは原画像RFの実際の領域A1,A2に近い。なお、各局所領域ALの属性を判別するに当たって、各局所領域AL内において、それぞれの画素GA1,GA2の数をカウントし、カウント値の大きい画素GAの属性を採用すればよい。
【0050】なお、図8における説明では、局所領域ALへの分割を1回のみ行うように説明したが、画像読取り装置1においては、誤判別をできるだけ低減するため、分割された局所領域ALに対し、所定の長さLG2以上の線分が検出されなくなるまで、局所領域ALへの分割を再帰的に行う。
【0051】次に、属性補正処理における局所領域ALの分割方法について詳しく説明する。図9は局所領域ALへの分割の方法を概念的に示す図、図10は局所領域AL内における再度の分割を示す図である。
【0052】図9(A)に示す原画像RF1は、文字画像領域A3及び写真画像領域A4を有している。原画像RF1に対して、先に説明したようにハフ変換を適用して境界線LBを引き、図9(B)に示すように境界線LBで囲まれた複数の局所領域ALに分割する。ここで、境界線LBは、所定の長さLG1以上の線分を検出した場合に、その線分を画像全体に延長したものである。さらに、分割された局所領域AL内において、上述と同様に再度ハフ変換を適用し、所定の長さLG2以上の線分を抽出する。抽出された線分を境界線LBとし、その局所領域ALを再分割する。
【0053】図10(A)には、図9(B)に示された1つの局所領域AL0が示されている。局所領域AL0は、境界線LB5〜8によって囲まれた領域である。局所領域AL0内において再分割を行うことによって、2つの境界線LB9,LB10が抽出され、これによって図10(B)に示すように4つの局所領域AL00、AL01、AL10、AL11に分割される。
【0054】ここで、ハフ変換の適用により抽出される線分の長さについて具体例を挙げると、1回目の分割においては、所定の長さLG1を例えば1cmとする。これは、400dpiの密度において約150dotに相当する。その場合に、2回目以降の分割においては、所定の長さLG2を1cmよりも小さくし、且つ局所領域ALの縦及び横の長さについてそれぞれ30%以上とする。なお、所定の長さLG1を、数mm乃至数cmの範囲の適当な値に設定してもよい。但し、所定の長さLGが小さくなると精度はよいが演算に時間がかかる。大きくなると演算速度は速いが誤判別の生じる率が高くなる。
【0055】分割されたそれぞれの局所領域ALにおいて、その属性が判別される。図10(B)で明らかなように、局所領域AL0内において抽出された境界線LB9,LB10によって分割されるのは、局所領域AL0の内部のみである。したがって、分割する必要のない局所領域ALについては無駄な分割が行われないので、演算に要する時間が短縮される。
【0056】上述の実施形態によると、原画像RFに文字/写真/網点などの複数種類の画像が存在する場合であっても、ハフ変換を適用してそれぞれの画像の境界線LBを抽出することによって領域判別を正確に行い、各局所領域ALに対して属性に応じた適切な画像処理を行うことができる。
【0057】次に、属性補正処理についてフローチャートを参照して説明する。図11は属性補正処理の全体を示すフローチャート、図12はハフ変換による属性判別処理を示すフローチャート、図13は局所領域分割処理を示すフローチャートである。
【0058】図11において、各画素毎に属性を判別し(#11)、属性マップMPを作成し(#12)、ハフ変換による属性判別処理を行う(#13)。図12において、孤立点を除去することにより雑音を取り除いた後(#21)、境界点GBを検出する(#22)。そして局所領域分割処理を行い(#23)、属性を決定する(#24)。
【0059】図13において、ハフ変換を行い(#31)、一辺の長さが所定の長さLG1以上である局所領域ALに分割する(#32)。次に、局所領域内においてハフ変換を行い(#33)、一辺の長さが所定の長さLG2以上であり且つ当該局所領域ALの縦及び横の長さについてそれぞれ所定の割合以上である局所領域ALに分割する(#34、36)。局所領域ALの再分割ができなくなれば(#35でイエス)、リターンする。
【0060】図14は属性補正処理の他の例を示すフローチャートである。図14に示すフローチャートにおいては、文字画像の領域と写真/網点画像の領域とで属性情報DAの補正処理の内容が異なる。
【0061】各画素毎に属性を判別し(#41)、属性毎に属性マップMPを作成する(#42)。つまり、文字、写真、及び網点の各画像の候補領域毎に属性マップMPを作成する。
【0062】写真又は網点の候補領域に対しては(#43でノー)、それぞれの属性マップMPについてノイズ除去処理が行われる(#44)。ここでは、候補領域に含まれる最大文字サイズ(14ポイント)よりも小さい面積領域を除去する。これによってノイズの大半が除去される。そして、境界点抽出処理が行われ(#45)、局所領域分割処理が行われ(#46)、属性の決定が行われる(#47)。
【0063】文字画像の候補領域に対しては(#43でイエス)、写真又は網点の領域と重なる部分を削除する(#48)。ここでの処理は、写真及び網点の領域をステップ#47で決定した後に行われる。残った文字画像の領域について、モホロジー処理の1種であるクロージング(Closing)処理を行う(#49)。クロージング処理では、最大文字サイズ(14ポイント)相当のディスクフィルタを用い、画像を一旦太らせた後に縮める処理を行う。
【0064】その後、文字、写真及び網点の各画像の領域を合成する(#50)。ここでは、画素毎の属性の判別の精度のよい順、例えば、網点、写真、文字の順に優先して合成する。つまり、領域が互いに重複する場合には、網点、写真、文字の順に優先して領域を確保する。
【0065】写真画像に含まれる髪の毛の画像は、画素毎の属性判別において文字画像又は網点画像であると誤判別されることがしばしばあるが、図14のフローチャートによると、それらの領域に対してハフ変換を適用することにより、そのような誤判別が補正され、正しく写真画像であると判別される。また、文字画像は、その中に網点画像が含まれていると誤判別されることがあるが、文字画像に対してクロージング処理を行うことにより、及び網点画像に対してハフ変換による属性判別処理を行うことにより、領域が正しく判別される。
【0066】すなわち、図14のフローチャートによると、まず、原画像RFに対して、写真、網点、文字のそれぞれの属性を画素毎に判別して属性マップをそれぞれ生成する。次に、それぞれの属性マップに対して、ハフ変換による属性補正処理(#46)、ハフ変換以外の処理による属性補正処理(#49)を行い、これによってそれぞれ補正された属性マップを得る。そして、補正された属性マップを合成する。
【0067】上述の実施形態において、画像補正部36、属性補正部AM、第1の局所領域抽出部AME1、属性判別部57、又は局所領域属性格納部45の構成、処理内容、処理順序、処理タイミング、その他、画像読取り装置1の全体又は各部の構成などは、本発明の主旨に沿って適宜変更することができる。
【0068】
【発明の効果】請求項1乃至請求項4の発明によると、原稿画像に複数種類の画像が存在する場合であっても、それぞれの画像の境界線を抽出することによって領域判別を正確に行い、各領域に対して属性に応じた適切な画像処理を行うことができる。
【0069】特に、局所領域に分割する処理を再帰的に行うので、所定の範囲内において細かく分割して精度の高い領域分割を行うことができ、しかも分割する必要のない局所領域については無駄な分割が行われないので、演算に要する時間が短縮され処理速度が向上する。
【図面の簡単な説明】
【図1】本発明に係る画像処理部を内蔵した画像読取り装置の全体の構成を示す図である。
【図2】画像処理部の構成を示すブロック図である。
【図3】領域判別部の構成を示すブロック図である。
【図4】第1の局所領域抽出部の構成を機能的に示すブロック図である。
【図5】画像補正部の構成を示すブロック図である。
【図6】ハフ変換の概念を示す図である。
【図7】属性補正処理の動作を概念的に説明するための図である。
【図8】属性補正処理の動作を概念的に説明するための図である。
【図9】局所領域への分割の方法を概念的に示す図である。
【図10】局所領域内における再度の分割を示す図である。
【図11】属性補正処理の全体を示すフローチャートである。
【図12】ハフ変換による属性判別処理を示すフローチャートである。
【図13】局所領域分割処理を示すフローチャートである。
【図14】属性補正処理の他の例を示すフローチャートである。
【符号の説明】
36 画像補正部(画像処理を行う手段)
41 特徴量抽出部(特徴量抽出手段)
42 属性判別部(画素属性判別手段)
52 境界点抽出部(境界点を抽出する手段)
53 ハフ変換部(極座標平面上の曲線に変換する手段)
54 交点検出部(交点を検出する手段)
55 逆変換部(境界線を生成する手段)
56 局所領域抽出部(局所領域として抽出する手段)
57 属性判別部(局所領域属性判別手段)
AM 属性補正部(第1の局所領域抽出手段、第2の局所領域抽出手段、局所領域属性判別手段)
AME1 第1の局所領域抽出部(第1の局所領域抽出手段)
【特許請求の範囲】
【請求項1】入力された画像について画素毎に特徴量を抽出し、前記特徴量に基づき画素毎に属性を判別して画素属性情報を生成し、前記画素属性情報に基づいて、ハフ変換を適用して前記画像を辺の長さが所定の範囲内である矩形の局所領域に分割する処理を再帰的に行い、且つ分割した局所領域について属性を判別することによって前記画素属性情報を補正し、補正された属性情報に基づいて前記局所領域に対し属性に対応した画像処理を行う、ことを特徴とする画像処理方法。
【請求項2】入力された画像について画素毎に特徴量を抽出する特徴量抽出手段と、前記特徴量に基づき画素毎に属性を判別して画素属性情報を生成する画素属性判別手段と、前記画素属性情報に基づいて、ハフ変換を適用して前記画像を辺の長さが所定の範囲内である局所領域に分割する第1の局所領域抽出手段と、前記局所領域内においてハフ変換を適用し辺の長さが所定の範囲内である局所領域に再分割する処理を再帰的に行う第2の局所領域抽出手段と、分割した各局所領域について属性を判別する局所領域属性判別手段と、前記局所領域毎にその属性に対応した画像処理を行う手段と、を有してなることを特徴とする画像処理装置。
【請求項3】前記第1の局所領域抽出手段における所定の範囲は、所定の長さLG1以上であり、前記第2の局所領域抽出手段における所定の範囲は、所定の長さLG2(LG2<LG1)以上であり且つ分割しようとする局所領域の辺の長さに対して所定割合の長さ以上である、請求項2記載の画像処理装置。
【請求項4】前記第1の局所領域抽出手段及び前記第2の局所領域抽出手段は、画素毎に判別された属性に基づいて境界に位置する画素である境界点を抽出する手段と、直交座標平面における前記各境界点に対しハフ変換を適用して極座標平面上の曲線に変換する手段と、極座標平面に変換された各曲線の交点を検出する手段と、検出された交点の極座標を直交座標平面上の直線に逆変換することによって境界線を生成する手段と、前記境界線によって囲まれた領域を局所領域として抽出する手段と、を有してなる請求項2又は請求項3記載の画像処理装置。
【請求項1】入力された画像について画素毎に特徴量を抽出し、前記特徴量に基づき画素毎に属性を判別して画素属性情報を生成し、前記画素属性情報に基づいて、ハフ変換を適用して前記画像を辺の長さが所定の範囲内である矩形の局所領域に分割する処理を再帰的に行い、且つ分割した局所領域について属性を判別することによって前記画素属性情報を補正し、補正された属性情報に基づいて前記局所領域に対し属性に対応した画像処理を行う、ことを特徴とする画像処理方法。
【請求項2】入力された画像について画素毎に特徴量を抽出する特徴量抽出手段と、前記特徴量に基づき画素毎に属性を判別して画素属性情報を生成する画素属性判別手段と、前記画素属性情報に基づいて、ハフ変換を適用して前記画像を辺の長さが所定の範囲内である局所領域に分割する第1の局所領域抽出手段と、前記局所領域内においてハフ変換を適用し辺の長さが所定の範囲内である局所領域に再分割する処理を再帰的に行う第2の局所領域抽出手段と、分割した各局所領域について属性を判別する局所領域属性判別手段と、前記局所領域毎にその属性に対応した画像処理を行う手段と、を有してなることを特徴とする画像処理装置。
【請求項3】前記第1の局所領域抽出手段における所定の範囲は、所定の長さLG1以上であり、前記第2の局所領域抽出手段における所定の範囲は、所定の長さLG2(LG2<LG1)以上であり且つ分割しようとする局所領域の辺の長さに対して所定割合の長さ以上である、請求項2記載の画像処理装置。
【請求項4】前記第1の局所領域抽出手段及び前記第2の局所領域抽出手段は、画素毎に判別された属性に基づいて境界に位置する画素である境界点を抽出する手段と、直交座標平面における前記各境界点に対しハフ変換を適用して極座標平面上の曲線に変換する手段と、極座標平面に変換された各曲線の交点を検出する手段と、検出された交点の極座標を直交座標平面上の直線に逆変換することによって境界線を生成する手段と、前記境界線によって囲まれた領域を局所領域として抽出する手段と、を有してなる請求項2又は請求項3記載の画像処理装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図11】
【図8】
【図9】
【図10】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図11】
【図8】
【図9】
【図10】
【図12】
【図13】
【図14】
【公開番号】特開平10−283476
【公開日】平成10年(1998)10月23日
【国際特許分類】
【出願番号】特願平9−86159
【出願日】平成9年(1997)4月4日
【出願人】(000006079)ミノルタ株式会社 (155)
【公開日】平成10年(1998)10月23日
【国際特許分類】
【出願日】平成9年(1997)4月4日
【出願人】(000006079)ミノルタ株式会社 (155)
[ Back to top ]