フアジイパターン認識装置
【目的】 手書き文字のような変形パターン専用の照合用パターンを別途作成することなく、当該変形パターンの認識の確信度を向上することができるファジィパターン認識装置を提供する。
【構成】 3次元メンバシップ発生装置6から発生したファジィ集合を示すメンバシップ関数を記憶装置5で組み合わせることにより、活字体のような基本パターンを認識するための照合用パターンを生成する。手書き文字テンプレート変換アルゴリズム記憶部7では、この照合用パターンを手書き文字認識のための照合用変形パターンに変換する。メインプロセッサ3は、画像読取装置1からの読み取り画像を、活字体のための照合用パターン又はこれから変換された手書き文字のための照合用変形パターンと選択的に比較することにより、認識対象の評価値である確信度を算出し、更に境界があいまいな他のパターンと比較して最も確信度が高いパターンに分類し、認識結果を出力する。
【構成】 3次元メンバシップ発生装置6から発生したファジィ集合を示すメンバシップ関数を記憶装置5で組み合わせることにより、活字体のような基本パターンを認識するための照合用パターンを生成する。手書き文字テンプレート変換アルゴリズム記憶部7では、この照合用パターンを手書き文字認識のための照合用変形パターンに変換する。メインプロセッサ3は、画像読取装置1からの読み取り画像を、活字体のための照合用パターン又はこれから変換された手書き文字のための照合用変形パターンと選択的に比較することにより、認識対象の評価値である確信度を算出し、更に境界があいまいな他のパターンと比較して最も確信度が高いパターンに分類し、認識結果を出力する。
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ファジィ理論を利用して、例えば活字体に対する手書き文字のように基本パターンから変形されたパターンについても的確に認識する機能を備えたファジィパターン認識装置に関する。
【0002】
【従来の技術】従来のパターン認識装置は、一般に形状が厳密に定められたパターンを認識するものであるが、手書き文字のように一定の形状に限定されない曖昧なパターンでも認識するための手段としてニューラルネットワークを用いる方法が知られている。これは、予め認識対象のパターンについて学習をすることによりニューラルネットワークを形成し、それによって入力パターンを認識するものである。
【0003】しかし、このニューラルネットワークを用いる方法は、学習という作業を必要とし、識別すべきパターンの候補が増えるたびに再学習が必要である。また、ニューラルネットがブラックボックスであって、認識対象のパターン信号を取り込む入力装置の経年変化等により、識別すべきパターンの候補の特徴に変化が認められた場合、それを装置の動作に反映することが難しく、誤認識が発生することもある等の問題点がある。
【0004】これに対し、近年ファジィ理論を用いて曖昧なパターンを認識する方法が提案されている。この方法は、例えば「この部分の近傍に縦の線がある」のように、パターンの特徴に関する知識を複数個持っていてそれらを一つ一つチェックすることを基本としている。しかしながら、ファジィ理論による従来のパターン認識方法では、ソフトウエアを含むシステム開発に際してパターンの特徴に関する知識を獲得する作業(ルール作成作業)が必要であり、実際のパターン認識を行う際にパターンの特徴抽出アルゴリズムが必要となる。そのため、多くのルールとファジィ集合のメンバシップ関数を必要とし、処理が複雑になるという問題点があった。
【0005】
【発明が解決しようとする課題】そこで、本願の発明者は、従来のファジィ理論によるパターン認識の問題点を解決するものとして、予め設定したファジィ集合のメンバシップ関数を組み合わせることにより、認識対象と照合すべき基本的なパターンを用意しておき、これと認識対象のパターンを比較することにより、当該パターンを評価するための指標である確信度を算出するようにしたパターン認識方法を先に提案した(特願平2−274355号)。この方法によれば、任意の形状(例えば楕円)の境界を有するファジィ領域を示すメンバシップ関数を組み合わせることで、認識対象と照合されるパターンが形成されるので、学習のように手間のかかる作業に要せずに効率よく文字や図形等のパターンを認識することができる。なお、この方法でメンバシップ関数を組み合わせることによって形成される照合用のパターンを「ファジィテンプレート」と呼ぶこととし、本明細書でも、この「ファジイテンプレート」を用いる。
【0006】ところで、認識対象として文字を取り扱う場合には、活字体が基本となるが、手書き文字を認識することも必要である。しかしながら、手書き文字は個々に活字体と異なる形状をとることが多いので、上記のパターン認識方法で文字を的確に認識するためには、活字体を対象とするファジィテンプレートだけでは不十分である。すなわち、文字パターンの認識のために活字体用のファジィテンプレートが既に用意されている場合でも、手書き文字に対しては、それ専用のファジィテンプレートを別途作成することが必要となる。ところが、個々の手書き文字に対してファジィテンプレートを作成することは煩雑で手間ががかる一方、これを省略して活字体用のファジィプレートによって手書き文字を認識するならば、確信度が全体的に低下し、場合によっては誤認識が発生する恐れがある。
【0007】故に、本発明者は、手書き文字用のファジィテンプレートを別途作成することなく、手書き文字の認識の確信度を向上するため、活字体に対する手書き文字の特徴を見出し、それに基づいて活字体用のファジィテンプレートを手書き文字用に変換することを着想した。すなわち、一般に、数字やアルファベットの手書き文字は、図13に示すように活字体より右に傾く傾向があり、平仮名、片仮名、漢字の手書き文字は活字体より右上がりの傾向があるので、これを利用することとした。
【0008】従って、本発明の目的は、活字体に対する手書き文字のように基本パターンから変形されたパターンについて専用のファジィテンプレートを作成する必要なく、そのような変形パターンの認識の確信度を向上することができるファジィパターン認識装置を提供することにある。
【0009】
【課題を解決するための手段】本発明は、ファジィ集合を表わすメンバシップ関数に基づいてパターン認識を行うパターン認識装置において、認識対象のパターンを入力するパターン入力部と、前記メンバシップ関数を1以上発生し、該メンバシップ関数を組み合わせることにより、前記パターン入力部から入力される認識対象の基本パターンを認識するための照合用パターンを形成する照合パターン形成手段と、前記照合パターン形成手段で形成された照合用パターンを、前記基本パターンから変形したパターンを認識するための照合用変形パターンに変換する照合パターン変換手段と、前記基本パターンを認識するときは前記パターン入力部から入力されたパターンを前記照合パターン形成手段で形成された照合用パターンと比較することにより認識の確信度を算出し、前記基本形から変形したパターンを認識するときは前記照合パターン変換手段で変換された照合用変形パターンと比較することにより認識の確信度を算出する演算処理手段とを備えたことを特徴とする。
【0010】本発明により文字を認識する場合、認識対象の基本パターンは活字体、基本パターンから変形したパターンは手書き文字とし、照合パターン変換手段は、パターン入力部から手書き文字の数字又は欧文字が入力される場合には、照合用パターンを右傾斜の照合用変形パターンに変換することを特徴とする。また、パターン入力部から手書き文字の仮名又は漢字が入力される場合には、照合用パターンを右上がりの照合用変形パターンに変換することを特徴とする。
【0011】
【作用】本発明によれば、照合パターン形成手段においてファジィ集合を表わすメンバシップ関数を発生してそれを組み合わせることにより、認識対象の基本パターンを認識するための照合用パターンが形成される。例えば、文字認識の場合、活字体の画像の2次元平面の座標軸にファジィ集合に対する適合度を示す座標軸を加えた3次元空間において、基本パターンである活字体の照合用パターン(ファジィテンプレート)を形成する3次元メンバシップ関数が設定される。そして、照合パターン変換手段では、上記の照合用パターンを前記基本パターンから変形したパターンを認識するための照合用変形パターンに変換する。例えば、手書き文字の数字や欧文字を認識する場合には、上記のファジィテンプレートを右傾斜の照合用変形パターンに変換し、手書き文字の平仮名、片仮名又は漢字を認識する場合には、右上がりの照合用変形パターンに変換することにより、手書き文字認識用のファジィテンプレートを発生する。従って、手書き文字を認識する場合、演算処理手段は、パターン入力部から入力されたパターンを、照合用変形パターンすなわち手書き文字認識用のファジィテンプレートと比較することにより、認識の確信度を算出する。かくして、手書き文字専用のファジィテンプレートを別途作成することなく、手書き文字の認識の確信度を向上することができる。
【0012】
【実施例】図1は、本発明に係るファジィパターン認識装置の一実施例を示すブロック図である。この装置は、文字を認識するように構成されたもので、以下の構成要素から成る。
【0013】画像読取装置1は、活字体又は手書き文字の画像を読み取るために、認識対象を照明する光源と、画像の反射光により画像を読み取って電気信号に変換する光電変換器とを含む。或は、感圧式の手書き文字入力装置を用いてもよい。
【0014】信号変換部2は、画像読取装置1により読み取られた画像信号を、例えば「0」(=「白」)又は「1」(=「黒」)の2値信号に変換し、また、読み取り画像の大きさを補正するように構成されている。この補正は、例えば文字が上下につぶれた形状である場合には、その形状を上下に引き延ばすことになる。
【0015】上記の画像読取装置1と信号変換部2とで、認識対象のパターンを入力するためのパターン入力部を構成する。
【0016】メインプロセッサ3は、信号変換部2により2値化され且つ形状が補正された読み取り画像を認識する。すなわち、入力されたパターンを後述のように照合用パターン(ファジィテンプレート)と比較することにより、認識の確信度を算出する演算処理手段を構成する。
【0017】記憶装置5は、活字体を認識するために基準となるファジィテンプレートを記憶する。この記憶装置5に記憶されたファジィテンプレートの形状は、コンピュータの端末装置として用いられるCRTとキーボードのようなマンマシンインタフェース4を介して調整及び変更可能である。
【0018】3次元メンバシップ発生装置6は、上記のファジィテンプレートを形成するために必要なメンバシップ関数を発生する。
【0019】上記の3次元メンバシップ発生装置6と記憶装置5とマンマシンインタフェース4とで照合パターン形成手段を構成している。
【0020】手書き文字テンプレート変換アルゴリズム記憶部7は、記憶装置5から選択スイッチ8を介して送られる活字体認識用のファジィテンプレートを手書き文字認識用のテンプレートに変換するものであり、照合パターン変換手段を構成している。
【0021】選択スイッチ8は、記憶装置5に記憶された活字体認識用のファジィテンプレートを手書き文字認識用のファジィテンプレートに変換するためにアルゴリズム記憶部7に送るか、又は活字体認識用のファジィテンプレートをそのままメインプロセッサ3に送るかを、手動或は自動的に選択するために設けられている。
【0022】従って、メインプロセッサ3は、信号変換部2からの読み取り画像(入力パターン)を、記憶装置5に記憶された活字体認識用のファジィテンプレート又はアルゴリズム記憶部7で変換された手書き文字認識用のテンプレートと選択的に比較することにより、認識対象の評価値である確信度を算出する。更に、境界が曖昧な他のパターンと比較して最も確信度が高いパターンに分類し、認識結果を出力する。
【0023】このメインプロセッサ3による認識結果を示すパターンは、信号変換部9により2値化信号からアナログ信号に変換され、CRT等の出力装置9により出力される。
【0024】次に、実施例によるパターン認識の原理と方法を説明する。
【0025】まず、1個以上の3次元メンバシップ関数を組み合わせて、認識すべき基本パターンの活字体に対応するファジィテンプレートを作成する。このために用いられる3次元メンバシップ関数を、図2及び図3を参照して説明する。
【0026】(A) メンバシップ関数の設定例えば、x-y 直交座標及び適合度から成る3次元空間内に、図2に示すような楕円形の等適合度線を有するメンバシップ関数を考える。ここで図中の記号を以下のように定義する。なお、簡単のため、原点を基準点(3次元メンバシップ関数を最も簡単に記述するための中心点)とする。
【0027】
F(x,y,Rx,Ry) =0 : 等適合度線の楕円形状を与える関数tx = f(x) : x-tx面におけるつり鐘型メンバシップ関数ty = g(y) : y-ty面におけるつり鐘型メンバシップ関数Rx : 適合度1の楕円形の等適合度線のx軸方向の半径Ry : 適合度1の楕円形の等適合度線のy軸方向の半径ax : xについてのファジィ・エントロピーに比例するパラメータay : yについてのファジィ・エントロピーに比例するパラメータrx : 任意の点(x,y) を含む等適合度線と適合度1の等適合度線との、x-tx断面上での距離ry : 任意の点(x,y) を含む等適合度線と適合度1の等適合度線との、y-ty断面上での距離t : 3次元メンバシップ関数によって与えられる点(x,y) の適合度説明の便宜上、適合度tをtx、tyに分けて記述するが、t、tx、tyは事実上同一の座標軸である。
【0028】このとき、任意の点(x,y) を含む等適合度線は次のようになる。
【0029】
【数1】
【0030】また、tx,tyについてのメンバシップ関数は
【0031】
【数2】
【0032】
【数3】
【0033】と表わされる。ここで、複号の−はx,yが正側の部分、+はx,yが負側の部分を表わす。
【0034】x-tx断面上およびy-ty断面上では、着目する等適合度線と基準点の距離は、それぞれ Rx+rx,Ry+r になるので、
【0035】
【数4】
【0036】
【数5】
【0037】従って、これらより
【0038】
【数6】
【0039】このとき、第1項と第2項の分母の ( )内が同じ形でないと、tについての陽関数には変形できない。そこで、
【0040】
【数7】min(Rx/ax,Ry/ay)=sk ・・・・(7)を求め、 0<s<sk の範囲から適当なsの値を選び、
【0041】
【数8】
【0042】となるdx,dyを求める。すなわち
【0043】
【数9】dx=Rx−axs ・・・・(9)dy=Ry−ays ・・・(10)を求め、等適合度線の関数を次式のように変形する。
【0044】
【数10】
【0045】ここで、複号の−はx,yが正側の部分、+はx,yが負側の部分を表わす。
【0046】
【数11】
【0047】この式の幾何学的な意味は、図3に示すように、本来の楕円形に対し直線部分を付け加えて近似した形状であることを表している。この式より
【0048】
【数12】
【0049】但し、 |x|<dx のとき x=dx, |y|<dyのときy =dyとして計算する。また、第2図のように、着目する等適合度線が適合度1の楕円の外側にある場合、{ }内は正の値になる。
【0050】同様にして、着目する等適合度線が適合度1の楕円の内側にある場合にも、全く同じ式が得られる。但し、この場合、任意の点(x,y) が近似した等適合度線の直線部分に存在するときは、|x|<dx且つ|y|<dy となって { }内は正の値になり、楕円部分にあるときは { }内は負の値になる。
【0051】適合度1の楕円の内側(あるいは外側)が一様に適合度1の領域になる場合は、上記の条件によって判断し、値を与える。
【0052】例として、図4(a) に示すような「8」の文字図形に対する3次元メンバシップ関数で表わされるファジィテンプレートは、(14)式より次のようになる。
【0053】■中心点が (6, 14)で半径が 3.5の円を適合度1とする3次元楕円メンバシップ関数の適合度の範囲を[-1, 1] に拡張した場合(図5)
【0054】
【数13】
【0055】■中心点が(6, 6)で半径が 4.5の円を適合度1とする3次元楕円メンバシップ関数の適合度の範囲を[-1, 1] に拡張した場合(図6)
【0056】
【数14】
【0057】図7(c) に示すように、上記■■の2つの3次元楕円メンバシップ関数の組合わせによって作られる次の関数を、上記の文字図形「8」に対するファジィテンプレートの3次元メンバシップ関数とする。
【0058】
【数15】
t = max(t1, t2) ・・・(17)ここで、適合度の範囲を[-1, 1] に拡張した理由は、不適当な入力座標値に対しては−(マイナス)の評価値を与えるためで、例えば真っ黒な画像信号が入力された時、後述の適合度の総和が小さい値になるようにするためである。
【0059】(B) 画像入力の変換画像読取装置1で入力画像を読み取り、信号変換部2で大きさの補正を含む2値信号への変換を行う。
【0060】図4(a) に示す例により説明すると、この場合、図4(b) に示すように、「8」の文字を包含する領域をx軸方向に12個、y軸方向に19個の領域に分割し、各領域を文字の形に対応した2値信号に変換する。ここで、空白の領域は2値信号の0に変換し、黒の領域は2値信号の1に変換する。大きさの補正としては、上下左右それぞれの端から2つ目の黒領域が上下左右それぞれの端から2列目に入るようにする。
【0061】このとき、図7(b) に示すように、12×19=228 個の領域のうちn=35個の領域に2値信号の1(黒)が与えられる。
【0062】(C) 入力画像の適合度の演算(A) で設定したメンバシップ関数tに対し、(B) で得られたn個の黒領域(2値信号(0,1)のうち1の値を持つドット)の適合度の総和T1 と領域1個当りの平均適合度S1 =T1/nとを求める。
【0063】上記の例では、図7(b)(c)に示すように、n=35個の黒領域の座標値によって算出される適合度の総和T1 =28、領域1個当りの平均適合度S1 =28/35=0.8 となる。
【0064】(D) 理想的な形状の適合度の演算(C) と同様に、最も理想的な形状の図形が入力された場合の適合度の総和T2と平均適合度S2 を求める。
【0065】最も理想的な「8」の場合は、第7図(d)(c)に示すように、40個の黒領域の適合度の総和T2 =38、領域1個当りの平均適合度S2 =38/40=0.95となる。
【0066】(E) 確信度の算出(C) と(D) の結果から、適合度の総和の比率T1/T2 と平均適合度の比率S1/S2 を加算して2で割ることにより、確信度を算出する。
【0067】上記の例では、確信度は
【0068】
【数16】
【0069】となる。
【0070】なお、適合度の総和の比率T1/T2 は、場合によっては1を越えてしまうが、その場合は無条件に1とする。すなわち、min(T1/T2,1) とする。
【0071】上記のように3次元メンバシップ関数発生装置6により発生した3次元メンバシップ関数を組み合わせて形成された活字体認識用のファジィテンプレートは、記憶装置5に格納され、認識動作を行うとき選択的に切り替えられるスイッチ8を介して取り出される。すなわち、活字体を認識する場合には直接メインプロセッサ3に送られる一方、手書き文字を認識する場合にはアルゴリズム記憶部7に送られて手書き文字認識用のファジィテンプレートに変換され、メインプロセッサ3に供給される。以下、この動作を図8及び図9を参照して説明する。
【0072】前述したように、手書き文字の数字やアルファベット等の欧文字は活字体より右に傾く傾向があり、また、手書き文字の平仮名、片仮名、漢字は活字体より右上がりの傾向がある。そこで、本実施例では、手書き文字の数字やアルファベットを認識する場合には、図8(a)に示すように活字体の矩形[0〜xd ,0〜yd ]のファジィテンプレートを、図8(b)に示すように角度ψだけ右傾斜のファジィテンプレートに変換し、次いで、図8(c)に示すように矩形領域[0〜xd ,0〜yd ]内に納まるように横(x)方向のスケーリング(縮小)を行う。
【0073】この動作を数式で説明すると、活字体のファジィテンプレートを式(19)で表わした場合、角度ψだけ右傾斜のファジィテンプレートは式(20)で表わすことができ、横方向にスケーリング(中心位置の補正を含む)されたファジィテンプレートは式(21)で表わすことができる。
【0074】
【数17】t=f(x,y) ・・・(19)t=f(x’,y) ・・・(20)但し、x’=x−ytan ψ
【0075】
【数18】
【0076】また、手書き文字の平仮名、片仮名、漢字を認識する場合には、図9(a)に示すように活字体の矩形[0〜xd ,0〜yd ]のファジィテンプレートを図9(b)に示すように角度ψだけ右上がりのファジィテンプレートに変換し、次いで、図9(c)に示すように矩形領域[0〜xd ,0〜yd ]内に納まるように縦(y)方向のスケーリング(縮小)を行う。
【0077】この動作を数式で説明すると、活字体のファジィテンプレートを式(22)で表わした場合、角度ψだけ右上がりのファジィテンプレートは式(23)により表わすことができ、縦方向にスケーリング(中心位置の補正を含む。)されたファジィテンプレートは式(24)により表わすことができる。
【0078】
【数19】t=f(x,y) ・・・(22)t=f(x,y’) ・・・(23)但し、y’=y−xtan ψ
【0079】
【数20】
【0080】図10(b)は、図10(a)に示す活字体「8」のファジィテンプレートを手書き数字認識用ファジィテンプレートに変換した場合を示し、図11(b)は、図11(a)に示す活字体「カ」の認識用ファジィテンプレートを手書き数字認識用ファジィテンプレートに変換した場合を示す。
【0081】メインプロセッサ3は、活字体を認識する場合には記憶装置5から読み出された活字体認識用のファジィテンプレートと比較することにより、活字体の評価値として確信度を演算して出力し、手書き文字を認識する場合にはアルゴリズム記憶部7により変換された手書き文字認識用のファジィテンプレートと比較することにより、手書き文字の評価値として確信度を演算して出力する。
【0082】図12は、このようにアルゴリズム記憶部7により変換された手書き文字認識用のファジィテンプレートによる手書き数字「8」の認識結果を示す。実験例では、活字体認識用のファジィテンプレートにより手書き文字を認識した場合には認識の確信度が 0.6〜0.7 程度であったが、アルゴリズム記憶部7により変換された手書き文字認識用のファジィテンプレートにより手書き文字を認識したところ、0.9 以上の確信度を実現することができた。したがって、上記実施例によれば、手書き文字専用のファジィテンプレートを別途作成することなく、手書き文字の認識の確信度を向上することができる。
【0083】以上、実施例について説明したが、本発明は文字を認識する場合に限らず、活字体に対する手書き文字のように基本パターンから変形されて一定の特徴を持つ変形パターンの認識に適用し得るものである。
【0084】
【発明の効果】以上説明したように、本発明によれば、手書き文字のように基本パターンから変形したパターンを認識する場合に、既に作成された基本パターン認識用のファジィテンプレートを変形パターン認識用のファジィテンプレートに変換するので、変形パターン専用のファジィテンプレートを別途作成することなく、手書き文字などの認識の確信度を向上することができる。
【図面の簡単な説明】
【図1】本発明に係るファジィパターン認識装置の一実施例を示すブロック図。
【図2】図1のファジィパターン認識装置において用いられる3次元メンバシップ関数の一例を示す図。
【図3】図2の3次元メンバシップ関数に対して直線を付加した場合を示す図。
【図4】本発明の実施例で識別する文字図形の一例とその形状に対応した2値信号を示す図。
【図5】実施例で用いる3次元メンバシップ関数の形状を示す図。
【図6】実施例で用いる別の3次元メンバシップ関数の形状を示す図。
【図7】図4の文字図形を識別する手順の説明図。
【図8】手書き文字を数字や欧文字を認識する場合に活字体のファジィテンプレートを手書き文字認識用のファジィテンプレートに変換する動作を示す図。
【図9】手書き文字の仮名や漢字を認識する場合に活字体のファジィテンプレートを手書き文字認識用のファジィテンプレートに変換する動作を示す図。
【図10】手書き数字「8」の認識用ファジィテンプレートへの変換例を示す図。
【図11】手書き文字「カ」の認識用ファジィテンプレートへの変換例を示す図。
【図12】手書き数字「8」の認識結果を示す図。
【図13】活字体と手書き文字の関係を示す図。
【符号の説明】
1…画像読取装置、2…信号変換部、3…メインプロセッサ、4…マンマシンインタフェース、5…記憶装置、6…3次元メンバシップ関数発生装置、7…テンプレート変換アルゴリズム記憶部、8…選択スイッチ。
【0001】
【産業上の利用分野】本発明は、ファジィ理論を利用して、例えば活字体に対する手書き文字のように基本パターンから変形されたパターンについても的確に認識する機能を備えたファジィパターン認識装置に関する。
【0002】
【従来の技術】従来のパターン認識装置は、一般に形状が厳密に定められたパターンを認識するものであるが、手書き文字のように一定の形状に限定されない曖昧なパターンでも認識するための手段としてニューラルネットワークを用いる方法が知られている。これは、予め認識対象のパターンについて学習をすることによりニューラルネットワークを形成し、それによって入力パターンを認識するものである。
【0003】しかし、このニューラルネットワークを用いる方法は、学習という作業を必要とし、識別すべきパターンの候補が増えるたびに再学習が必要である。また、ニューラルネットがブラックボックスであって、認識対象のパターン信号を取り込む入力装置の経年変化等により、識別すべきパターンの候補の特徴に変化が認められた場合、それを装置の動作に反映することが難しく、誤認識が発生することもある等の問題点がある。
【0004】これに対し、近年ファジィ理論を用いて曖昧なパターンを認識する方法が提案されている。この方法は、例えば「この部分の近傍に縦の線がある」のように、パターンの特徴に関する知識を複数個持っていてそれらを一つ一つチェックすることを基本としている。しかしながら、ファジィ理論による従来のパターン認識方法では、ソフトウエアを含むシステム開発に際してパターンの特徴に関する知識を獲得する作業(ルール作成作業)が必要であり、実際のパターン認識を行う際にパターンの特徴抽出アルゴリズムが必要となる。そのため、多くのルールとファジィ集合のメンバシップ関数を必要とし、処理が複雑になるという問題点があった。
【0005】
【発明が解決しようとする課題】そこで、本願の発明者は、従来のファジィ理論によるパターン認識の問題点を解決するものとして、予め設定したファジィ集合のメンバシップ関数を組み合わせることにより、認識対象と照合すべき基本的なパターンを用意しておき、これと認識対象のパターンを比較することにより、当該パターンを評価するための指標である確信度を算出するようにしたパターン認識方法を先に提案した(特願平2−274355号)。この方法によれば、任意の形状(例えば楕円)の境界を有するファジィ領域を示すメンバシップ関数を組み合わせることで、認識対象と照合されるパターンが形成されるので、学習のように手間のかかる作業に要せずに効率よく文字や図形等のパターンを認識することができる。なお、この方法でメンバシップ関数を組み合わせることによって形成される照合用のパターンを「ファジィテンプレート」と呼ぶこととし、本明細書でも、この「ファジイテンプレート」を用いる。
【0006】ところで、認識対象として文字を取り扱う場合には、活字体が基本となるが、手書き文字を認識することも必要である。しかしながら、手書き文字は個々に活字体と異なる形状をとることが多いので、上記のパターン認識方法で文字を的確に認識するためには、活字体を対象とするファジィテンプレートだけでは不十分である。すなわち、文字パターンの認識のために活字体用のファジィテンプレートが既に用意されている場合でも、手書き文字に対しては、それ専用のファジィテンプレートを別途作成することが必要となる。ところが、個々の手書き文字に対してファジィテンプレートを作成することは煩雑で手間ががかる一方、これを省略して活字体用のファジィプレートによって手書き文字を認識するならば、確信度が全体的に低下し、場合によっては誤認識が発生する恐れがある。
【0007】故に、本発明者は、手書き文字用のファジィテンプレートを別途作成することなく、手書き文字の認識の確信度を向上するため、活字体に対する手書き文字の特徴を見出し、それに基づいて活字体用のファジィテンプレートを手書き文字用に変換することを着想した。すなわち、一般に、数字やアルファベットの手書き文字は、図13に示すように活字体より右に傾く傾向があり、平仮名、片仮名、漢字の手書き文字は活字体より右上がりの傾向があるので、これを利用することとした。
【0008】従って、本発明の目的は、活字体に対する手書き文字のように基本パターンから変形されたパターンについて専用のファジィテンプレートを作成する必要なく、そのような変形パターンの認識の確信度を向上することができるファジィパターン認識装置を提供することにある。
【0009】
【課題を解決するための手段】本発明は、ファジィ集合を表わすメンバシップ関数に基づいてパターン認識を行うパターン認識装置において、認識対象のパターンを入力するパターン入力部と、前記メンバシップ関数を1以上発生し、該メンバシップ関数を組み合わせることにより、前記パターン入力部から入力される認識対象の基本パターンを認識するための照合用パターンを形成する照合パターン形成手段と、前記照合パターン形成手段で形成された照合用パターンを、前記基本パターンから変形したパターンを認識するための照合用変形パターンに変換する照合パターン変換手段と、前記基本パターンを認識するときは前記パターン入力部から入力されたパターンを前記照合パターン形成手段で形成された照合用パターンと比較することにより認識の確信度を算出し、前記基本形から変形したパターンを認識するときは前記照合パターン変換手段で変換された照合用変形パターンと比較することにより認識の確信度を算出する演算処理手段とを備えたことを特徴とする。
【0010】本発明により文字を認識する場合、認識対象の基本パターンは活字体、基本パターンから変形したパターンは手書き文字とし、照合パターン変換手段は、パターン入力部から手書き文字の数字又は欧文字が入力される場合には、照合用パターンを右傾斜の照合用変形パターンに変換することを特徴とする。また、パターン入力部から手書き文字の仮名又は漢字が入力される場合には、照合用パターンを右上がりの照合用変形パターンに変換することを特徴とする。
【0011】
【作用】本発明によれば、照合パターン形成手段においてファジィ集合を表わすメンバシップ関数を発生してそれを組み合わせることにより、認識対象の基本パターンを認識するための照合用パターンが形成される。例えば、文字認識の場合、活字体の画像の2次元平面の座標軸にファジィ集合に対する適合度を示す座標軸を加えた3次元空間において、基本パターンである活字体の照合用パターン(ファジィテンプレート)を形成する3次元メンバシップ関数が設定される。そして、照合パターン変換手段では、上記の照合用パターンを前記基本パターンから変形したパターンを認識するための照合用変形パターンに変換する。例えば、手書き文字の数字や欧文字を認識する場合には、上記のファジィテンプレートを右傾斜の照合用変形パターンに変換し、手書き文字の平仮名、片仮名又は漢字を認識する場合には、右上がりの照合用変形パターンに変換することにより、手書き文字認識用のファジィテンプレートを発生する。従って、手書き文字を認識する場合、演算処理手段は、パターン入力部から入力されたパターンを、照合用変形パターンすなわち手書き文字認識用のファジィテンプレートと比較することにより、認識の確信度を算出する。かくして、手書き文字専用のファジィテンプレートを別途作成することなく、手書き文字の認識の確信度を向上することができる。
【0012】
【実施例】図1は、本発明に係るファジィパターン認識装置の一実施例を示すブロック図である。この装置は、文字を認識するように構成されたもので、以下の構成要素から成る。
【0013】画像読取装置1は、活字体又は手書き文字の画像を読み取るために、認識対象を照明する光源と、画像の反射光により画像を読み取って電気信号に変換する光電変換器とを含む。或は、感圧式の手書き文字入力装置を用いてもよい。
【0014】信号変換部2は、画像読取装置1により読み取られた画像信号を、例えば「0」(=「白」)又は「1」(=「黒」)の2値信号に変換し、また、読み取り画像の大きさを補正するように構成されている。この補正は、例えば文字が上下につぶれた形状である場合には、その形状を上下に引き延ばすことになる。
【0015】上記の画像読取装置1と信号変換部2とで、認識対象のパターンを入力するためのパターン入力部を構成する。
【0016】メインプロセッサ3は、信号変換部2により2値化され且つ形状が補正された読み取り画像を認識する。すなわち、入力されたパターンを後述のように照合用パターン(ファジィテンプレート)と比較することにより、認識の確信度を算出する演算処理手段を構成する。
【0017】記憶装置5は、活字体を認識するために基準となるファジィテンプレートを記憶する。この記憶装置5に記憶されたファジィテンプレートの形状は、コンピュータの端末装置として用いられるCRTとキーボードのようなマンマシンインタフェース4を介して調整及び変更可能である。
【0018】3次元メンバシップ発生装置6は、上記のファジィテンプレートを形成するために必要なメンバシップ関数を発生する。
【0019】上記の3次元メンバシップ発生装置6と記憶装置5とマンマシンインタフェース4とで照合パターン形成手段を構成している。
【0020】手書き文字テンプレート変換アルゴリズム記憶部7は、記憶装置5から選択スイッチ8を介して送られる活字体認識用のファジィテンプレートを手書き文字認識用のテンプレートに変換するものであり、照合パターン変換手段を構成している。
【0021】選択スイッチ8は、記憶装置5に記憶された活字体認識用のファジィテンプレートを手書き文字認識用のファジィテンプレートに変換するためにアルゴリズム記憶部7に送るか、又は活字体認識用のファジィテンプレートをそのままメインプロセッサ3に送るかを、手動或は自動的に選択するために設けられている。
【0022】従って、メインプロセッサ3は、信号変換部2からの読み取り画像(入力パターン)を、記憶装置5に記憶された活字体認識用のファジィテンプレート又はアルゴリズム記憶部7で変換された手書き文字認識用のテンプレートと選択的に比較することにより、認識対象の評価値である確信度を算出する。更に、境界が曖昧な他のパターンと比較して最も確信度が高いパターンに分類し、認識結果を出力する。
【0023】このメインプロセッサ3による認識結果を示すパターンは、信号変換部9により2値化信号からアナログ信号に変換され、CRT等の出力装置9により出力される。
【0024】次に、実施例によるパターン認識の原理と方法を説明する。
【0025】まず、1個以上の3次元メンバシップ関数を組み合わせて、認識すべき基本パターンの活字体に対応するファジィテンプレートを作成する。このために用いられる3次元メンバシップ関数を、図2及び図3を参照して説明する。
【0026】(A) メンバシップ関数の設定例えば、x-y 直交座標及び適合度から成る3次元空間内に、図2に示すような楕円形の等適合度線を有するメンバシップ関数を考える。ここで図中の記号を以下のように定義する。なお、簡単のため、原点を基準点(3次元メンバシップ関数を最も簡単に記述するための中心点)とする。
【0027】
F(x,y,Rx,Ry) =0 : 等適合度線の楕円形状を与える関数tx = f(x) : x-tx面におけるつり鐘型メンバシップ関数ty = g(y) : y-ty面におけるつり鐘型メンバシップ関数Rx : 適合度1の楕円形の等適合度線のx軸方向の半径Ry : 適合度1の楕円形の等適合度線のy軸方向の半径ax : xについてのファジィ・エントロピーに比例するパラメータay : yについてのファジィ・エントロピーに比例するパラメータrx : 任意の点(x,y) を含む等適合度線と適合度1の等適合度線との、x-tx断面上での距離ry : 任意の点(x,y) を含む等適合度線と適合度1の等適合度線との、y-ty断面上での距離t : 3次元メンバシップ関数によって与えられる点(x,y) の適合度説明の便宜上、適合度tをtx、tyに分けて記述するが、t、tx、tyは事実上同一の座標軸である。
【0028】このとき、任意の点(x,y) を含む等適合度線は次のようになる。
【0029】
【数1】
【0030】また、tx,tyについてのメンバシップ関数は
【0031】
【数2】
【0032】
【数3】
【0033】と表わされる。ここで、複号の−はx,yが正側の部分、+はx,yが負側の部分を表わす。
【0034】x-tx断面上およびy-ty断面上では、着目する等適合度線と基準点の距離は、それぞれ Rx+rx,Ry+r になるので、
【0035】
【数4】
【0036】
【数5】
【0037】従って、これらより
【0038】
【数6】
【0039】このとき、第1項と第2項の分母の ( )内が同じ形でないと、tについての陽関数には変形できない。そこで、
【0040】
【数7】min(Rx/ax,Ry/ay)=sk ・・・・(7)を求め、 0<s<sk の範囲から適当なsの値を選び、
【0041】
【数8】
【0042】となるdx,dyを求める。すなわち
【0043】
【数9】dx=Rx−axs ・・・・(9)dy=Ry−ays ・・・(10)を求め、等適合度線の関数を次式のように変形する。
【0044】
【数10】
【0045】ここで、複号の−はx,yが正側の部分、+はx,yが負側の部分を表わす。
【0046】
【数11】
【0047】この式の幾何学的な意味は、図3に示すように、本来の楕円形に対し直線部分を付け加えて近似した形状であることを表している。この式より
【0048】
【数12】
【0049】但し、 |x|<dx のとき x=dx, |y|<dyのときy =dyとして計算する。また、第2図のように、着目する等適合度線が適合度1の楕円の外側にある場合、{ }内は正の値になる。
【0050】同様にして、着目する等適合度線が適合度1の楕円の内側にある場合にも、全く同じ式が得られる。但し、この場合、任意の点(x,y) が近似した等適合度線の直線部分に存在するときは、|x|<dx且つ|y|<dy となって { }内は正の値になり、楕円部分にあるときは { }内は負の値になる。
【0051】適合度1の楕円の内側(あるいは外側)が一様に適合度1の領域になる場合は、上記の条件によって判断し、値を与える。
【0052】例として、図4(a) に示すような「8」の文字図形に対する3次元メンバシップ関数で表わされるファジィテンプレートは、(14)式より次のようになる。
【0053】
【0054】
【数13】
【0055】
【0056】
【数14】
【0057】図7(c) に示すように、上記
【0058】
【数15】
t = max(t1, t2) ・・・(17)ここで、適合度の範囲を[-1, 1] に拡張した理由は、不適当な入力座標値に対しては−(マイナス)の評価値を与えるためで、例えば真っ黒な画像信号が入力された時、後述の適合度の総和が小さい値になるようにするためである。
【0059】(B) 画像入力の変換画像読取装置1で入力画像を読み取り、信号変換部2で大きさの補正を含む2値信号への変換を行う。
【0060】図4(a) に示す例により説明すると、この場合、図4(b) に示すように、「8」の文字を包含する領域をx軸方向に12個、y軸方向に19個の領域に分割し、各領域を文字の形に対応した2値信号に変換する。ここで、空白の領域は2値信号の0に変換し、黒の領域は2値信号の1に変換する。大きさの補正としては、上下左右それぞれの端から2つ目の黒領域が上下左右それぞれの端から2列目に入るようにする。
【0061】このとき、図7(b) に示すように、12×19=228 個の領域のうちn=35個の領域に2値信号の1(黒)が与えられる。
【0062】(C) 入力画像の適合度の演算(A) で設定したメンバシップ関数tに対し、(B) で得られたn個の黒領域(2値信号(0,1)のうち1の値を持つドット)の適合度の総和T1 と領域1個当りの平均適合度S1 =T1/nとを求める。
【0063】上記の例では、図7(b)(c)に示すように、n=35個の黒領域の座標値によって算出される適合度の総和T1 =28、領域1個当りの平均適合度S1 =28/35=0.8 となる。
【0064】(D) 理想的な形状の適合度の演算(C) と同様に、最も理想的な形状の図形が入力された場合の適合度の総和T2と平均適合度S2 を求める。
【0065】最も理想的な「8」の場合は、第7図(d)(c)に示すように、40個の黒領域の適合度の総和T2 =38、領域1個当りの平均適合度S2 =38/40=0.95となる。
【0066】(E) 確信度の算出(C) と(D) の結果から、適合度の総和の比率T1/T2 と平均適合度の比率S1/S2 を加算して2で割ることにより、確信度を算出する。
【0067】上記の例では、確信度は
【0068】
【数16】
【0069】となる。
【0070】なお、適合度の総和の比率T1/T2 は、場合によっては1を越えてしまうが、その場合は無条件に1とする。すなわち、min(T1/T2,1) とする。
【0071】上記のように3次元メンバシップ関数発生装置6により発生した3次元メンバシップ関数を組み合わせて形成された活字体認識用のファジィテンプレートは、記憶装置5に格納され、認識動作を行うとき選択的に切り替えられるスイッチ8を介して取り出される。すなわち、活字体を認識する場合には直接メインプロセッサ3に送られる一方、手書き文字を認識する場合にはアルゴリズム記憶部7に送られて手書き文字認識用のファジィテンプレートに変換され、メインプロセッサ3に供給される。以下、この動作を図8及び図9を参照して説明する。
【0072】前述したように、手書き文字の数字やアルファベット等の欧文字は活字体より右に傾く傾向があり、また、手書き文字の平仮名、片仮名、漢字は活字体より右上がりの傾向がある。そこで、本実施例では、手書き文字の数字やアルファベットを認識する場合には、図8(a)に示すように活字体の矩形[0〜xd ,0〜yd ]のファジィテンプレートを、図8(b)に示すように角度ψだけ右傾斜のファジィテンプレートに変換し、次いで、図8(c)に示すように矩形領域[0〜xd ,0〜yd ]内に納まるように横(x)方向のスケーリング(縮小)を行う。
【0073】この動作を数式で説明すると、活字体のファジィテンプレートを式(19)で表わした場合、角度ψだけ右傾斜のファジィテンプレートは式(20)で表わすことができ、横方向にスケーリング(中心位置の補正を含む)されたファジィテンプレートは式(21)で表わすことができる。
【0074】
【数17】t=f(x,y) ・・・(19)t=f(x’,y) ・・・(20)但し、x’=x−ytan ψ
【0075】
【数18】
【0076】また、手書き文字の平仮名、片仮名、漢字を認識する場合には、図9(a)に示すように活字体の矩形[0〜xd ,0〜yd ]のファジィテンプレートを図9(b)に示すように角度ψだけ右上がりのファジィテンプレートに変換し、次いで、図9(c)に示すように矩形領域[0〜xd ,0〜yd ]内に納まるように縦(y)方向のスケーリング(縮小)を行う。
【0077】この動作を数式で説明すると、活字体のファジィテンプレートを式(22)で表わした場合、角度ψだけ右上がりのファジィテンプレートは式(23)により表わすことができ、縦方向にスケーリング(中心位置の補正を含む。)されたファジィテンプレートは式(24)により表わすことができる。
【0078】
【数19】t=f(x,y) ・・・(22)t=f(x,y’) ・・・(23)但し、y’=y−xtan ψ
【0079】
【数20】
【0080】図10(b)は、図10(a)に示す活字体「8」のファジィテンプレートを手書き数字認識用ファジィテンプレートに変換した場合を示し、図11(b)は、図11(a)に示す活字体「カ」の認識用ファジィテンプレートを手書き数字認識用ファジィテンプレートに変換した場合を示す。
【0081】メインプロセッサ3は、活字体を認識する場合には記憶装置5から読み出された活字体認識用のファジィテンプレートと比較することにより、活字体の評価値として確信度を演算して出力し、手書き文字を認識する場合にはアルゴリズム記憶部7により変換された手書き文字認識用のファジィテンプレートと比較することにより、手書き文字の評価値として確信度を演算して出力する。
【0082】図12は、このようにアルゴリズム記憶部7により変換された手書き文字認識用のファジィテンプレートによる手書き数字「8」の認識結果を示す。実験例では、活字体認識用のファジィテンプレートにより手書き文字を認識した場合には認識の確信度が 0.6〜0.7 程度であったが、アルゴリズム記憶部7により変換された手書き文字認識用のファジィテンプレートにより手書き文字を認識したところ、0.9 以上の確信度を実現することができた。したがって、上記実施例によれば、手書き文字専用のファジィテンプレートを別途作成することなく、手書き文字の認識の確信度を向上することができる。
【0083】以上、実施例について説明したが、本発明は文字を認識する場合に限らず、活字体に対する手書き文字のように基本パターンから変形されて一定の特徴を持つ変形パターンの認識に適用し得るものである。
【0084】
【発明の効果】以上説明したように、本発明によれば、手書き文字のように基本パターンから変形したパターンを認識する場合に、既に作成された基本パターン認識用のファジィテンプレートを変形パターン認識用のファジィテンプレートに変換するので、変形パターン専用のファジィテンプレートを別途作成することなく、手書き文字などの認識の確信度を向上することができる。
【図面の簡単な説明】
【図1】本発明に係るファジィパターン認識装置の一実施例を示すブロック図。
【図2】図1のファジィパターン認識装置において用いられる3次元メンバシップ関数の一例を示す図。
【図3】図2の3次元メンバシップ関数に対して直線を付加した場合を示す図。
【図4】本発明の実施例で識別する文字図形の一例とその形状に対応した2値信号を示す図。
【図5】実施例で用いる3次元メンバシップ関数の形状を示す図。
【図6】実施例で用いる別の3次元メンバシップ関数の形状を示す図。
【図7】図4の文字図形を識別する手順の説明図。
【図8】手書き文字を数字や欧文字を認識する場合に活字体のファジィテンプレートを手書き文字認識用のファジィテンプレートに変換する動作を示す図。
【図9】手書き文字の仮名や漢字を認識する場合に活字体のファジィテンプレートを手書き文字認識用のファジィテンプレートに変換する動作を示す図。
【図10】手書き数字「8」の認識用ファジィテンプレートへの変換例を示す図。
【図11】手書き文字「カ」の認識用ファジィテンプレートへの変換例を示す図。
【図12】手書き数字「8」の認識結果を示す図。
【図13】活字体と手書き文字の関係を示す図。
【符号の説明】
1…画像読取装置、2…信号変換部、3…メインプロセッサ、4…マンマシンインタフェース、5…記憶装置、6…3次元メンバシップ関数発生装置、7…テンプレート変換アルゴリズム記憶部、8…選択スイッチ。
【特許請求の範囲】
【請求項1】ファジィ集合を表わすメンバシップ関数に基づいてパターン認識を行う装置において、認識対象のパターンを入力するパターン入力部と、前記メンバシップ関数を1以上発生し、該メンバシップ関数を組み合わせることにより、前記パターン入力部から入力される認識対象の基本パターンを認識するための照合用パターンを形成する照合パターン形成手段と、前記照合パターン形成手段で形成された照合用パターンを、前記基本パターンから変形したパターンを認識するための照合用変形パターンに変換する照合パターン変換手段と、前記基本パターンを認識するときは前記パターン入力部から入力されたパターンを前記照合パターン形成手段で形成された照合用パターンと比較することにより認識の確信度を算出し、前記基本形から変形したパターンを認識するときは前記照合パターン変換手段で変換された照合用変形パターンと比較することにより認識の確信度を算出する演算処理手段とを備えたことを特徴とするファジィパターン認識装置。
【請求項2】前記認識対象の基本パターンは活字体、前記基本パターンから変形したパターンは手書き文字であり、前記照合パターン変換手段は、前記パターン入力部から手書き文字の数字又は欧文字が入力される場合には、前記照合用パターンを右傾斜の照合用変形パターンに変換することを特徴とする請求項1記載のファジィパターン認識装置。
【請求項3】前記認識対象の基本パターンは活字体、前記基本パターンから変形したパターンは手書き文字であり、前記照合パターン変換手段は、前記パターン入力部から手書き文字の仮名又は漢字が入力される場合には、前記照合用パターンを右上がりの照合用変形パターンに変換することを特徴とする請求項1記載のファジィパターン認識装置。
【請求項1】ファジィ集合を表わすメンバシップ関数に基づいてパターン認識を行う装置において、認識対象のパターンを入力するパターン入力部と、前記メンバシップ関数を1以上発生し、該メンバシップ関数を組み合わせることにより、前記パターン入力部から入力される認識対象の基本パターンを認識するための照合用パターンを形成する照合パターン形成手段と、前記照合パターン形成手段で形成された照合用パターンを、前記基本パターンから変形したパターンを認識するための照合用変形パターンに変換する照合パターン変換手段と、前記基本パターンを認識するときは前記パターン入力部から入力されたパターンを前記照合パターン形成手段で形成された照合用パターンと比較することにより認識の確信度を算出し、前記基本形から変形したパターンを認識するときは前記照合パターン変換手段で変換された照合用変形パターンと比較することにより認識の確信度を算出する演算処理手段とを備えたことを特徴とするファジィパターン認識装置。
【請求項2】前記認識対象の基本パターンは活字体、前記基本パターンから変形したパターンは手書き文字であり、前記照合パターン変換手段は、前記パターン入力部から手書き文字の数字又は欧文字が入力される場合には、前記照合用パターンを右傾斜の照合用変形パターンに変換することを特徴とする請求項1記載のファジィパターン認識装置。
【請求項3】前記認識対象の基本パターンは活字体、前記基本パターンから変形したパターンは手書き文字であり、前記照合パターン変換手段は、前記パターン入力部から手書き文字の仮名又は漢字が入力される場合には、前記照合用パターンを右上がりの照合用変形パターンに変換することを特徴とする請求項1記載のファジィパターン認識装置。
【図5】
【図6】
【図13】
【図1】
【図2】
【図10】
【図3】
【図4】
【図11】
【図7】
【図8】
【図9】
【図12】
【図6】
【図13】
【図1】
【図2】
【図10】
【図3】
【図4】
【図11】
【図7】
【図8】
【図9】
【図12】
【公開番号】特開平5−135206
【公開日】平成5年(1993)6月1日
【国際特許分類】
【出願番号】特願平3−296039
【出願日】平成3年(1991)11月12日
【出願人】(000006666)山武ハネウエル株式会社 (1,808)
【公開日】平成5年(1993)6月1日
【国際特許分類】
【出願日】平成3年(1991)11月12日
【出願人】(000006666)山武ハネウエル株式会社 (1,808)
[ Back to top ]