説明

音響検査方法および装置

【課題】音信号の加工手段とニューラルネットワーク(NNW)を用いる音響検査方法において、検査対象によって相違する音信号の適正加工条件を、簡便かつ確実に決定できる手段を提供する。
【解決手段】デジタル化された音信号を周波数解析、座標軸変換、座標軸分割、平均化処理、強度・振幅の圧縮処理の各ステップで加工した後、NNWに入力して学習データによる学習及び検査対象音の異常判定を行う。また、学習データとは別に教師付き試験データのセットを使用し、周波数軸変換モードや圧縮処理の冪指数を変えて、試験データセットについて正常か否かの判定を行い、正答率が最高になる座標軸変換モードや圧縮処理の冪指数の最適条件を定めて、この条件で検査対象音の異常判定を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ニューラルネットワークを用いた音響検査方法に関し、とくに打診音により製品の異常の有無を判定するのに好適で、音信号の加工手段により判定の的中率を高めることのできる音響検査方法とこれに用いる検査装置に関する。
【背景技術】
【0002】
従来から各種の製品や装置の異常の有無を判定する検査方法として、検査対象の音響信号の周波数スペクトルを求め、各周波数成分の振幅値と閾値とを比較して、異常の有無を判定する音響検査方法が広く用いられている。しかしこの方法は、判定精度を高めようとすると、分割する周波数帯域の数を多くする必要があり、適切な閾値を設定する手間が過大になるという問題があった。
【0003】
これを解決するため、音響信号の周波数解析結果を、ニューラルネットワーク(以下、NNWと略記する)に入力して、異常の有無を判定する音響検査方法も広く試みられるようになってきた(例えば下記の非特許文献1、特許文献1など)。この方法は、NNWの入力層に各周波数帯域の音信号を入力し、その出力値を閾値と比較して異常を判定するものであるが、学習データを用いて、NNWのパラメータの値を学習することにより、判定精度を高めることができる。
【0004】
しかし、この方法でも、学習データを用いてNNWのパラメータの値を学習する過程において、入力の与え方や条件設定等の巧拙があり、効率良くNNWの学習を行なうには、かなりの熟練を要するという問題があった。また、検査対象の音信号の種類によっては、学習したNNWを用いても、異常判定の的中率が必ずしも向上しないという問題もあった。
【非特許文献1】R.P.Gorman et al.:Neural Networks Vol.1,Issue1,1988 pp.75-89
【特許文献1】特開平11−241945号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
本発明者らは、人の聴覚特性を模擬して加工した音響検査の打診音を、階層型のNNWに入力して異常(とくに瓶の欠陥)を判定する方法について、種々の検討を行なってきた。かかる音信号の加工には、音信号を複数の周波数帯域に分割し、各帯域での音圧の圧縮処理(出力音圧を入力音圧のn乗(n<1)として、小さな音を相対的に大きくする処理)や、周波数軸を人間の聴覚特性にならって変換する処理(例えば対数変換や指数変換など)が含まれる。その結果、音信号に何らかの加工をしてNNWに入力したときに、元の音信号のまま入力するより、判定の的中率が大幅に向上する場合があることを知見した。
【0006】
しかし、検査対象は多様であり、如何なる加工が的中率の向上に有効であるかは、一律に論ずることができない。同じ圧縮処理でも、冪指数nの値によって的中率に差が生じるし、当然ながら周波数軸の変換処理モードによっても大きく相違する。例えば、瓶の欠陥検査の場合、ビール瓶とコーラ瓶の欠陥では、最も高い的中率が得られる周波数軸の変換処理モードや冪指数nの値が大きく相違する。従来は、検査対象の種類によって、試行錯誤しながら適正な音信号の加工条件を探索する必要が有り、実際に打音検査に着手する前の、事前検討の手間がきわめて大きいという問題があった。
【0007】
また、かかる音響検査はすでに実用化の段階に入っていると言えるが、実際の生産ラインにこれを適用するには、上述のような音信号の加工条件の選択や学習データによる学習
に手間取ることなく、自動的にこれを行いうること、およびかかる条件の選択に熟練を要することなく、誰にでも操作可能であることが求められる。
【0008】
そこで本発明は、音信号の加工手段とニューラルネットワーク(NNW)を用いる音響検査方法において、検査対象によって相違する音信号の適正加工条件を、簡便かつ確実に決定することのできる手段を提供し、これにより異常有無の判定の的中率を従来より大幅に高め得る音響検査方法と検査装置を提供することを課題としている。
【0009】
また本発明は、上記の音信号の適正加工条件を自動的に決定しうる手段を提供
し、これにより、かかる音響検査に格別の熟練を要することなく、何人にもこれ
を実施可能にすることを課題としている。
【課題を解決するための手段】
【0010】
上記課題を解決するための本発明の音響検査方法は、
周波数解析した音信号を、学習データセットを使用して学習したニューラルネットワークの入力層に入力し、その出力により検査対象の音信号が正常状態か異常状態かを判定する音響検査方法であって、
デジタル化された音信号を周波数解析してその周波数スペクトルを得るステップと、該スペクトルの周波数軸を変換するステップと、変換された周波数軸をニューラルネットワークの入力ユニット数Nと同数の周波数帯域に分割するステップと、この分割された帯域内の音信号の強度または振幅をそれぞれ平均化するステップと、この平均化された音信号をニューラルネットワークの各入力ユニットに入力して、学習データセットによる学習及び検査対象音信号が正常か否かの判定を行なうステップとを具備することを特徴とする。
【0011】
上記の方法によれば、ニューラルネットワークを使用する音響検査において、音信号の周波数軸を人間の聴覚特性に倣って変換してから周波数分割して、ニューラルネットワークに入力することが可能になり、人間の官能による音響検査に近づけることができる。そのため、かかる変換を行なわずにニューラルネットワークに入力する場合よりも、異常判定の的中率を向上させることができる場合が多い。
【0012】
上記の音響検査方法においては、前記の平均化ステップで周波数帯域毎に平均化された音信号を入力して、その強度または振幅を下記(1)式の関係を満たすように圧縮処理するステップを設け、該ステップで圧縮処理された信号を前記ニューラルネットワークの各入力ユニットに入力することが好ましい。
【0013】
W = C・I ………(1)
ここで、I:圧縮処理ステップへの入力信号
W:圧縮処理ステップからの出力信号
C:比例定数
n:処理目的に応じて設定される冪指数で、入力信号が強度のとき
0<n<0.5、振幅のとき0<n<1
かかる圧縮処理により、入力信号が大きい範囲では出力信号が相対的に小さく、入力信号が小さい範囲で相対的に大きくなる。そのため、比較的大きな打診自体の音響の中から、異状時の小さな音信号をキャッチすることが容易になり、異常判定の的中率の向上を図ることができる。
【0014】
また、上記の音響検査方法においては、前記学習データセットとは別に、各複数の正常状態及び異常状態の音信号からなる試験データセットを使用し、前記の周波数軸変換ステップにおける周波数軸変換モードを複数選択して、選択された各変換モードにおいて、学習データセットによる学習及び前記試験データセットについて正常か否かの判定を行い、
この判定によりこれらの変換モードのうちで正答率が最高になる変換モードを定め、定められた変換モードを用いて、学習データセットによる学習及び検査対象音信号が正常か否かの判定を行なうことが好ましい。
【0015】
前述した周波数軸を変換する方法において、如何なる変換モードが的中率の向上に最も有効かは、検査対象の音信号によって相違し、一律に論ずることができない。従来は最適な周波数軸変換モードを試行錯誤して定める必要があり、そのための手間が過大になるという問題があった。これに対して、上記の方法によれば、一定の計算プログラムを用いて上記の試行を自動的に行なうことが可能になり、試行の手間が著しく軽減されるとともに、「かかる検査を熟練を要することなく実施可能にする」という本発明の目的を容易に達成することができる。
【0016】
さらに、上記の音響検査方法においては、前記の周波数軸変換ステップにおける周波数軸変換モードとして、対数変換、冪指数変換、メル変換、bark変換等の周波数軸圧縮変換及び線形変換よりなる群から2種以上を選択するとともに、(1)式における冪指数nを入力信号が強度のとき0<n<0.5、振幅のとき0<n<1の範囲の値を含む数値で2段階以上に変えて、この変換モードとn値の各組合せにおいて学習データセットによる学習及び前記試験データセットについて正常か否かの判定を行い、この判定によりこれらの組合せのうちで正答率が最高になるものを定め、定められた変換モードとn値の組合せを用いて、学習データセットによる学習及び検査対象音信号が正常か否かの判定を行ってもよい。
【0017】
このように構成することによって、異常判定の的中率の向上に最も有効な、周波数軸変換モードと圧縮処理における冪指数nの値の組合せを、自動的に定めることが可能になり、的中率の向上にさらに有効な手段を提供することができる。
【0018】
本発明の音響検査装置は、上記の検査方法を実施するための装置であって、
デジタル化された音信号を周波数解析して周波数スペクトルを得る手段と、該スペクトルの周波数軸を変換する手段と、この変換された周波数軸を複数の周波数帯域に分割する手段と、この分割された帯域内の信号強度または振幅をそれぞれ平均化する手段と、この平均化された音信号を前記(1)式の関係を満たすように圧縮処理する手段と、この圧縮処理された信号を入力して学習及び検査対象音信号が正常か否かの判定を行なうニューラルネットワークを備えたことを特徴とする音響検査装置である。
【発明の効果】
【0019】
本発明により、音信号の加工手段とニューラルネットワーク(NNW)を用いる音響検査方法において、検査対象によって相違する音信号の適正加工条件を、簡便かつ確実に決定することが可能になり、これにより異常有無の判定の的中率を従来より大幅に高めることができるようになった。
【0020】
また本発明によれば、かかる音響検査に格別の熟練を要することなく、何人にも実施可能になり、かかる検査の普及に寄与することができる。
【発明を実施するための最良の形態】
【0021】
本発明の音響検査方法は、入力音信号に一定の加工を施したのち、学習したNNWで判定を行なうものであるが、教師信号あり(正常か異常か既知の)試験データを用いて、音信号の加工条件の最適化を行なったのち、検査対象データについて異常の有無の判定を行なうことを特徴とするものである。したがって、その操作手順は、図1のブロック図に示すように、最適化処理と検査の2工程に分けられる。
【0022】
最適化処理及び検査のいずれの工程も、音信号の加工の内容は、デジタル化された音信号を周波数解析して周波数スペクトルを得て(S1、T1)、この周波数スペクトルの周波数軸を特定の周波数軸変換モードで変換し(S2、T2)、変換された周波数軸において、周波数帯域をNNWのニューロン数(N)と同数に分割(原則的には等分割)して、それぞれの帯域で信号強度または振幅を平均化し(S3、T3)、この平均化された信号を前記(1)式の関係を満たすように振幅・強度の圧縮処理を行う(S4、T4)という点で同じである。また、この加工した信号をNNWの各ニューロンに入力して、その出力値により判定を行なうことも同様である。
【0023】
最適化処理の内容は、検査対象に応じて、ステップS2における周波数軸変換モードとステップS4における圧縮処理の冪指数((1)式のn)の値の最適なものを選択することである。すなわち、候補となる周波数軸変換モード(以下、これをM(k=1,2,……,k)と表示する)と、圧縮処理の冪指数の値(以下、これをn(j=1,2,……,j)と表示する)を予め複数水準選択しておき、デジタル化された教師信号あり試験データのセットをNNWで判定したときに、その正答率が最高になるパラメータ(Mとn)を求めることにある。ただし、両者各々独立に最適化するのではなく、両者の組合せ(M,n)において最適条件を求める。
【0024】
NNWで試験データセットか正常か異常かを判定する前に、NNWの重み係数を最適化しておく必要がある。そのため、試験データセットとは別に、デジタル化された教師信号あり学習データのセットを用意する。この学習データセットの音信号も、S1〜S4のステップで加工を施したのち、NNWの各ニューロンに入力して学習し、重み係数を最適化する。このようにして学習したNNWに、試験データセットの加工後の信号を入力すれば、確度の高い判定を行なうことができる。
【0025】
上記のようにして、検査対象に応じて、最適な(M,n)の組合せが定まれば、T2ステップにおけるMとT4ステップにおけるnは、これらの値に固定する。また、T5ステップにおけるNNWの最適重み係数は、先のS5ステップで既に求められているので、これをそのまま使うことができる。したがって、この状態で検査工程に入り、検査対象音を採音してA/D変換を行った(T0)のち、T1〜T4の加工が施された信号を、学習したNNWに入力して(T5)、正常か異常かの判定を行なうことができる。
【0026】
以下、最適化処理及び検査の各工程のフローについて、さらに詳しく説明する。図2は、最適化処理の操作手順の例を示すフローチャートである。同図において、入力されるデータセット1は、教師信号あり学習データのセットと、教師信号あり試験データのセットで構成される。教師信号あり学習データセットを使ってニューラルネットワーク(NNW)の学習を行い、教師信号あり試験データセットを使って、学習の効果とパラメータ選定の適否(正答率)を判定する。
【0027】
S1ステップで入力音信号を周波数解析すると、直流成分、基本波(f)成分と高調波(2f,3f,…kf)成分が算出される。それらの成分数(k+1)がNNWの入力層ニューロンの数Nより十分大きくなるように、周波数帯域と基本波の周波数fを設定する。
【0028】
次にS2の周波数軸変換としては、線形変換、対数変換、冪乗変換、メル変換、bark変換、ERB変換、ERBs変換等が例示される。これらの変換は、元の周波数をfとし変換後の周波数をFとしたとき、下記の各式で表される。
【0029】
線形変換: F = af (aは比例定数であるが通常は1、以下同じ)
対数変換: F = alogf、又はF = alnf
冪乗変換: F = af(n<1)
メル変換: F = 2595log10(1+f/700)
bark変換: F = 13tan−1(0.76f/1000)
+3.5tan−1((f/7500)
ERB変換: F = 24.7+0.108f
ERBs変換: F = 21.4log10(0.00437f+1)
上記の各変換のうち、線形変換、対数変換、冪数nを0.25及び0.5とした時の冪乗変換、メル(mel)変換及びbark変換における元の周波数fと変換後の周波数Fとの関係を図3に示す。同図の縦軸は、f=20,000Hzの時のFの値 F(20000)を100として、これに対するF(f)の相対値(F(f)/F(20000)×100)で表示している。上記の変換のうち、線形変換とERB変換以外は、低周波域の帯域幅を相対的に拡大し、高周波域の帯域幅を相対的に縮小する変換(本発明においては、これを周波数軸圧縮変換という)である。人間の聴覚は、一種の周波数軸圧縮変換を行なっており、上記のメル変換やbark変換は、人間の聴覚特性を良く近似することが知られている。したがって、人間の聴覚に基づく打診検査を模擬するという意味において、かかる周波数軸圧縮変換が、的中率の向上に寄与する可能性が高いと考えられる。
【0030】
次にS3ステップの分割処理は、変換した周波数軸をニューロン数Nに合わせて等分することである。また、平均化は等分された各帯域内の高調波の強度の平均値(変換後の周波数Fを変数として上記の強度を積分し、帯域幅ΔFで除した値)を求めることである。振幅の平均値を使用しても同様な学習及び検査結果が得られる。
【0031】
S4ステップの振幅・強度圧縮処理は、S3の平均値を入力信号Iとして、下式の関係を満たすような出力信号の値Wを求めることである。
W =C・I ………(1)
ここで、C:比例定数
n:処理目的に応じて設定される冪指数で、入力信号が強度のとき
0<n<0.5、振幅のとき0<n<1
一般に、冪指数nを1未満にすると、入力Iの値の大きい範囲(大きい音)は出力値Wが相対的に小さくなり、Iの小さい範囲(小さい音)は相対的に大きくなる。また、nを1超にするとその逆になるので、n=1を境として音圧圧縮と音圧伸長とに分けられる。比較的大きな打診自体の音響の中から、異状時の小さな音信号を確実にキャッチするという意味で、一般に音圧圧縮が的中率の向上に有効である。上記(1)式のIは、スペクトルの強度または振幅であって、強度は振幅の2乗に相当する。したがって、本発明における圧縮処理は、入力信号が強度のとき0<n<0.5、振幅のとき0<n<1として、圧縮する処理を行なっている。
【0032】
S5ステップのNNWでは、先ず教師信号あり学習データのセットを使って学習を行い、ニューロン間の結合の重みを調整する(重み調整の内容については後述する)。次いで、その調整結果と教師信号あり試験データのセットを使って、NNWの出力値から、各試験データが正常か異常かの判定を行なう。試験データセットは、正常か異常かが既知であるから、この判定から正答率が求められる。この正答率は、周波数軸変換モードをMとし、圧縮処理の冪指数の値をnとしたときのものである。そこで、S5ステップの出力1として、M、n、正答率及びNNWの重み係数のセットをメモリーに記録する。
【0033】
次いで、nのフラッグjをj−1として、S4ステップの入り口に戻る。学習データセットの圧縮処理と、そのデータによるNNWの学習を行なった後、試験データセットを圧縮処理して、NNWに入力して正答率を求め、出力1をメモリーに記録する手順を繰り返す。J=0になったところで、j=jに戻すとともに、Mのフラッグkをk−1として、S2ステップの入り口に戻り、k=0になるまで、上記と同じ手順を繰り返す。フラ
ッグj,kがともに0になったところで、すべての(M,n)の組合せにおける正答率とNNWの重み係数のセットがメモリーに記録されているので、この中から最も高い正答率を与えるM,nの組合せを選定し、その時のM,nの値とNNWの重み係数のセットを出力2として出力して、最適化処理の工程を終了する。
【0034】
図4は、検査工程の操作手順の例を示すフローチャートである。まず、最適化処理の出力2((M,n)の組合せの最適値と、その時のNNWの重み係数のセット)を入力したところで、検査開始のトリガー信号を出力3として出力する(S0)。これにより打診検査が開始され、打診検査の信号入力を増幅し(P1)、フィルタにより可聴範囲を越える高周波域をカット(P2)した後、A/D変換を行い(T0)、このデジタル化された信号を検査データとして取り込む。
【0035】
この検査データについて、前述のS1ステップと同様に周波数解析し(T1)、最適条件として選択した周波数軸変換モードMで周波数軸変換を行い(T2)、周波数軸の分割と各周波数帯域での信号強度または振幅の平均化を行い(T3)、その平均値の信号を入力して、各周波数帯域毎に(1)式の冪指数を選択されたnとする圧縮処理を行い(T4)、その出力をすでに学習ずみ(重み係数が最適化された)NNWの入力層のそれぞれのユニットに入力して、その出力値により検査データが正常か異常かの判定を行なう(T5)。この正常・異常の判断結果を出力4として出力する。検査回数のフラッグmをm−1として、S0ステップの入り口に戻って、検査データの取込み、データの加工とNNWによる判定の一連の操作を繰り返す。
【0036】
上記の手段によれば、NNWの学習と音信号の加工条件の最適化を完全に自動的に行なうことができ、「音響検査に格別の熟練を要することなく、何人にもこれを実施可能にする」という本発明の目的を容易に達成することができる。なお、上記の最適化処理及び検査の両工程において、振幅・強度の圧縮処理(S4,T4ステップ)をともに省略しても差し支えない。この場合は、S3及びT3の出力信号が直ちにNNWに入力されることになる。また、S4,T4ステップをS3,T3ステップの周波数分割処理と平均化処理の間に入れることも可能である。すなわち、平均化する前の各高調波について、(1)式による圧縮処理を行い、その結果を平均化してもよい。しかしこの方法は、(1)式の計算の手間が大きくなるので、図1、3及び4の例に示すように、S3,T3ステップの後にS4,T4ステップを置くことが好ましい。
【0037】
次ぎに、後記の実施例で用いたニューラルネットワ−ク(NNW)の構成と、学習データによる学習について説明する。本実施例では、パターン認識に効果があるとされる階層型のNNWを用い、入力層、中間層、出力層の計3層で構成される階層型のNNWを用いた。出力は、検査対象物が正常か異常かを判別する2通りなので、出力層のニューロン数は1個とした。このNNWを図5に示す。図に示されるように、ニューロンが層をなして並んでいて、それぞれ異なる重み付け(weight)をされてつながっている。ニューロンの役割は、他のニューロンからの入力を受け取り、その入力和に応じて出力をするだけであるが、重み付けが変化することで、同じ入力データを与えても違う出力が出てくる。
【0038】
NNWの学習とは、目的の出力が得られるように、重み付けを変化させていくことである。学習には、バックプロパゲーション(誤差逆伝播法)を用いた。この学習方法は、まずニューロン数を入力層I個、中間層J個とし、入力層のi番目のニューロンから中間層のj番目のニューロンへの重みをVji、中間層のj番目のニューロンから出力層のニューロンへの重みをWとすると、入力層ニューロンの出力Xはそのまま次の層へ値を伝え、中間層ニューロンjの出力Yは、下記(2)式で与えられ、
【数1】

出力層ニューロンの出力Zは、下記(3)式で与えられる。
【数2】

教師信号をDとすると、出力層の出力との誤差Eは、E=(D−Z)/2で与えられる。NNWの学習は、この誤差Eが小さくなるように重みの修正を行なっていくもので、中間層から出力層への重みの現在の値をW(t)、重み修正後の値をW(t+1)とすると、W(t+1)=W(t)+ΔWとしたときのΔWは下記(4)式で与えられる。
【数3】

ここで、η(η>0)は学習係数であり、この値を調整することにより、学習の度合いを変化させることができる。
【0039】
一方、入力層から中間層への重みの現在の値をVji(t)、重み修正後の値をVji(t+1)とすると、Vji(t+1)=Vji(t)+ΔVjiとしたときのΔVjiは下記(5)式で与えられる。
【数4】

このようにして、WとVjiの修正を繰り返す。N個の学習データのセットがあるとすると、下記(6)式を満たすまで、この重みの修正を続ける。
【数5】

なお、上式のε(ε>0)は学習終了条件である。
【0040】
バックプロパゲーションのアルゴリズムは、出力と教師信号との誤差を小さくする方向へ重み付けを変更していくもので、重み付けの修正が、入力から出力を計算する時のデータの流れと逆向きの流れで行われる。このNNWの学習は、あらかじめ上記のηやεを経験的に設定しておくことにより、一定の計算プログラムで自動的に計算を行なうことができる。(6)式の関係が満たされた時のWとVjiの値を、NNWの重み係数としたものが、ここでいう「学習したNNW」である。
【実施例】
【0041】
コーラ瓶とビール瓶の2種類を試料として、図3に示したフローで音信号の加工とNNWによる判定を行い、周波数軸変換のモードや振幅・音圧圧縮処理の冪指数を変えて、正答率がどのように変化するかを調査した。教師ありデータとして、コーラ瓶とビール瓶ともに、正常瓶と欠陥瓶の打音を各400個用意し、この音信号をデジタル化して、正常瓶・欠陥瓶ともに半数を学習データセット、他の半数を試験データセットとした。NNWのニューロン数は、入力層100、中間層5、出力層1とした。
【0042】
周波数軸変換モードとして、線形,対数,mel,bark,ERB,ERBsの各変換について検討した。また、振幅・音圧圧縮処理(S4ステップ)の入力は振幅(強度の1/2乗)とし、コーラ瓶については、冪指数n=0.4(圧縮処理あり)とn=1(圧縮処理なし)の2水準で、ビール瓶については、冪指数n=0.4(圧縮処理あり)の場合のみ検討した。またコーラ瓶については、周波数帯域を可聴域全体(20Hz〜20kHz)とした場合と、周波数解析で比較的強いスペクトルが認められる範囲(1kHz〜15kHz)に制限した場合の両方について検討した。上記の条件で、学習セータセットで学習したNNWにより、試験データセットについて正常か否かの判定を行い、正答率を求めた結果をまとめて表1に示す。
【表1】

表1のコーラ瓶についての結果から、n=1(振幅そのまま)とした場合よりも、n=0.4とすると正答率が大幅に高くなることが知れる。また、n=0.4で、周波数軸変換モードは、線形とERB(線形に類似)の場合に正答率が高い。したがって、コーラ瓶の場合には、周波数解析した周波数軸を変換せずに等分割・平均処理し、その振幅を0.4乗したものをNNWに入力した検査を行なうのが好ましいことが知れる。なお、周波数帯域は制限せず、可聴域全体で解析した方が正答率が高かった。
【0043】
一方、ビール瓶では、周波数軸変換がmelやbarkの場合に、線形(周波数軸変換なし)よりも正答率が明らかに高い。したがって、この場合は、周波数軸をmel変換又はbark変換して、その振幅を0.4乗したものをNNWに入力することが好ましい。
【0044】
この実施例から分かるように、打音検査の的中率を高めるための音信号の加工の適正条件(周波数軸の変換モードや圧縮処理の冪指数)は、検査対象により大幅に相違する。しかしながら本発明によれば、検査対象に応じて、自動的に(格別の熟練を要することなく)最適な加工条件を見つけ出して検査を行なうことができ、これにより、打音検査の的中率を確実に高めることができる。
【図面の簡単な説明】
【0045】
【図1】本発明の音響検査方法の操作手順の例を示すブロック図である。
【図2】本発明における最適化処理の操作手順の例を示すフローチャートである。
【図3】各種の周波数軸変換における元の周波数と変換後の周波数との関係を示す図である。
【図4】本発明における検査工程の操作手順の例を示すフローチャートである。
【図5】本発明の実施例で用いたニューラルネットワークの構成を示す図である。

【特許請求の範囲】
【請求項1】
周波数解析した音信号を、学習データセットを使用して学習したニューラルネットワークの入力層に入力し、その出力により検査対象の音信号が正常状態か異常状態かを判定する音響検査方法であって、
デジタル化された音信号を周波数解析してその周波数スペクトルを得るステップと、該スペクトルの周波数軸を変換するステップと、変換された周波数軸を前記ニューラルネットワークの入力ユニット数Nと同数の周波数帯域に分割するステップと、この分割された帯域内の音信号の強度または振幅をそれぞれ平均化するステップと、この平均化された音信号を前記ニューラルネットワークの各入力ユニットに入力して、学習データセットによる学習及び検査対象音信号が正常か否かの判定を行なうステップとを具備することを特徴とする音響検査方法。
【請求項2】
前記の平均化ステップで周波数帯域毎に平均化された音信号を入力して、その強度または振幅を下記(1)式の関係を満たすように圧縮処理するステップを設け、該ステップで圧縮処理された信号を前記ニューラルネットワークの各入力ユニットに入力することを特徴とする請求項1記載の音響検査方法。
W =C・I ………(1)
ここで、I:圧縮処理ステップへの入力信号
W:圧縮処理ステップからの出力信号
C:比例定数
n:処理目的に応じて設定される冪指数で、入力信号が強度のとき
0<n<0.5、振幅のとき0<n<1
【請求項3】
前記学習データセットとは別に、各複数の正常状態及び異常状態の音信号からなる試験データセットを使用し、前記の周波数軸変換ステップにおける周波数軸変換モードを複数選択して、選択された各変換モードにおいて前記学習及び前記試験データセットについて正常か否かの判定を行い、この判定によりこれらの変換モードのうちで正答率が最高になる変換モードを定め、定められた変換モードを用いて、前記学習及び検査対象音信号が正常か否かの判定を行なうことを特徴とする請求項1又は2記載の音響検査方法。
【請求項4】
前記の周波数軸変換ステップにおける周波数軸変換モードとして、対数変換、冪指数変換、メル変換、bark変換等の周波数軸圧縮変換及び線形変換よりなる群から2種以上を選択するとともに、前記(1)式における冪指数nを入力信号が強度のとき0<n<0.5、振幅のとき0<n<1の範囲の値を含む数値で2段階以上に変えて、この変換モードとn値の各組合せにおいて前記学習及び前記試験データセットについて正常か否かの判定を行い、この判定によりこれらの組合せのうちで正答率が最高になるものを定め、定められた変換モードとn値の組合せを用いて、前記学習及び検査対象音信号が正常か否かの判定を行なうことを特徴とする請求項3記載の音響検査方法。
【請求項5】
請求項1乃至4のいずれかに記載の音響検査方法を実施するための装置であって、デジタル化された音信号を周波数解析して周波数スペクトルを得る手段と、該スペクトルの周波数軸を変換する手段と、この変換された周波数軸を複数の周波数帯域に分割する手段と、この分割された帯域内の信号強度または振幅をそれぞれ平均化する手段と、この平均化された音信号を前記(1)式の関係を満たすように圧縮処理する手段と、この圧縮処理された音信号を入力して学習及び検査対象音信号が正常か否かの判定を行なうニューラルネットワークを備えたことを特徴とする音響検査装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2006−58051(P2006−58051A)
【公開日】平成18年3月2日(2006.3.2)
【国際特許分類】
【出願番号】特願2004−237925(P2004−237925)
【出願日】平成16年8月18日(2004.8.18)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 平成16年2月27日 山梨大学電気電子システム工学科、山梨大学共催の「平成15年度 電気電子システム工学科 卒業論文発表会」において文書をもって発表
【出願人】(800000079)株式会社山梨ティー・エル・オー (11)
【Fターム(参考)】