説明

波形解析装置

【課題】波形データは、同じ検体を測定しても用いる測定機器や測定日、測定場所などの要因によって得られる測定数値が変動する。そのため波形データを用いるデータ解析において、測定数値をそのまま用いる従来手法では再現性や信頼性に問題が生じる。
【解決手段】変数軸と強度軸とを有する同種の複数の波形に基づいて解析を行う波形解析方法であって、前記変数軸上のある特定位置に形成された前記強度に関する複数のピークであって、それぞれのピ−クのピーク強度値に基づいて、前記複数のピークを前記強度軸上において分割可能であるか否かを判定する分割可能性判定ステップを有することを特徴とする波形解析方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ピークを有する波形の解析技術に関し、特に、質量分析装置等で測定された波形データの解析において、測定時の条件によって生じる測定誤差やノイズ等の影響を極力受けずに解析を行なうための技術に関する。
【背景技術】
【0002】
質量分析装置等により検体を測定することで得られる波形データを用いて(例えば図25に示される)、その検体の特性を解析することが一般に行なわれている。波形データの解析技術には、様々な方法が提案されている。
【0003】
例えば、下記の特許文献1〜3では、波形データを解析して疾患患者と普通の患者を区別する分類モデル(本願の判別規則)の構築方法についての記載がある。特許文献1〜3における分類モデルの構築においては、波形上のピーク強度の数値をそのまま用いている。また、下記の非特許文献1においても、プロテインチップを利用した卵巣癌患者血清のプロテオミックパターンの解析に、特許文献1〜3と同様にピーク強度数値をそのまま用いている。
【特許文献1】米国特許第6,675,104号明細書
【特許文献2】特表2004−536276号公報
【特許文献3】特表2004−522980号公報
【非特許文献1】Emanuel F. Petricoin III et al., THE LANCET, Vol.359, February 16,2002, 572−577
【非特許文献2】Mark A.Rogers et al.,Cancer Research, Vol.63,October 15,2003,6971−6983
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところが、例えば、上記質量分析装置等で得られる波形データは、同じ検体を測定した場合でも、用いられる測定機器や測定日、測定場所などの差異に関連する諸要因の変動によって、測定結果自体も変動してしまうことが良く知られている。例えば非特許文献2にその旨報告されている。
【0005】
そのため、波形データを用いるデータ解析において、測定数値をそのまま用いると、再現性や信頼性等の面で問題が生じる。すなわち、ディファレンシャル解析やクラス未知検体のクラス判別等において、測定数値をそのまま用いる従来手法では再現性や信頼性に問題が生じる。
【0006】
ここで、ディファレンシャル解析とは、異なるクラスに属する複数の検体から得られる測定結果において、クラス間で差のある要因や箇所を同定する解析のことである。測定対象は、例えば、遺伝子やタンパク質の発現量などである。質量分析装置による測定結果の場合では、例えば、健常者と癌患者とでピーク強度の差が顕著に現れている波形上の特定のピークあるいはその位置を同定することに相当する。
【0007】
また、クラス判別とは、主にディファレンシャル解析で同定されたクラス間で差のある要因等を用いて、別途与えられた検体のクラスを判別・予測することである。例えば、癌か否かを診断したい患者の血漿を測定し、それにより得られた波形において特定位置に出現するピークの強度に基づいて、健常者/癌患者のいずれのクラスに属するかを判別することなどが挙げられる。
【0008】
従来のディファレンシャル解析では、統計的検定を用いてクラス間でピーク強度の数値自体に統計的に有意な差が認められるピークやその位置を同定するという方法が用いられてきた(図26参照)。しかしながら、質量分析では大量のピークが検出されるため、ディファレンシャル解析において測定誤差等が原因で偶然有意差が生じる危険性が高い。特に検体数が少ない場合は、その傾向が顕著である(図23参照)。図23における各点は、それぞれ異なる波形における特定の位置に出現するピークについて、そのピークトップのみを重ねて表示したものである。一見クラス1のピークとクラス2のピークはピーク強度に差がありそうだが、ピークの数自体が10個と少ないため測定誤差による偶然の差である可能性が否定できない。
【0009】
また、従来の方法でクラス判別を行なう場合、まず主にディファレンシャル解析で選ばれた特定位置に存在するピークの集団において、クラスをもっともよく分ける強度の境界を設定する。その後、別途与えられたクラスが不明の検体(未知検体)に対する当該位置のピークの強度が、その境界のどちら側に存在するかで、その未知検体のクラス判別を行なう(図24参照)。
【0010】
しかしながら、測定数値は諸条件で変動するため境界の位置は厳密な正確さを持つものではなく、また未知検体の強度も変動するため、そのピークが境界付近に存在する場合はクラス判別の信頼性が低くなる。特に、ディファレンシャル解析に用いられた検体(学習用検体)と未知検体は測定時の諸状況が異なる場合があり、両者には大きな強度差が生じる危険性がある。
【0011】
このように、質量分析装置等で得られる波形データは、同じ検体を測定しても用いる測定機器や測定日、測定場所などの要因によって得られる測定数値が変動する。そのため波形データを用いるデータ解析において、測定数値をそのまま用いる従来手法では再現性や信頼性に問題が生じる。
本発明は、波形解析における精度の向上を目的とする。
【課題を解決するための手段】
【0012】
本発明の一観点によれば、変数軸と強度軸とを有する同種の複数の波形に基づいて解析を行なう波形解析方法であって、前記変数軸上のある特定位置に形成された前記強度に関する複数のピークであって、それぞれのピークが前記複数の波形のいずれか一つの波形の一部である複数のピークに関して、それぞれのピークのピーク強度値に基づいて、前記複数のピークを前記強度軸上において分割可能であるか否かを判定する分割可能性判定ステップを有することを特徴とする波形解析方法が提供される。
【0013】
前記分割可能性判定ステップに基づいて、前記特定位置のピークを波形解析に利用するかどうかの選別を行ない、選別された前記特定位置のピークに基づいてデータ解析を行なうステップを有することが好ましい。
【0014】
分割可能性が高いピークは、分割可能性が低いピークに比べて、もとの検体の質的な差を反映していると考えられるため、波形解析において選択的に用いることで解析精度を向上させることができる。
【0015】
この際、前記分割可能性判定ステップにおいて、前記複数のピーク強度値が、N分割可能(Nは2以上の整数)であるか否かを判定することも可能であり、或いは、ピークの有り無しに基づいて行なうこともできる。前者はNが2以上の整数の場合に、後者は、N=2の場合に適用可能である。
【0016】
分割可能性判定ステップは、あるN群が明確に分かれている程度を示す分割スコアを定義し、当該のピーク群を任意の境界でN個に分割した際のスコアを計算するステップと、境界の決め方を変更しながら得られたN群の分割スコアの中で最も高いスコアが所定の指定値よりも高ければそのスコアを記録した境界およびN群をもって当該ピーク群を分割可能と判断するステップと、を有することが好ましい。スコア値を前記特定位置に形成されるピークの集合に対する重み付けとして利用しても良い。
【0017】
また、前記ピーク強度値をスケール変換した値に基づいて選別を行なうこともできる。これにより、前記ピーク強度値をより小さい値に変換する関数を利用してスケール変換することができる。前記変換は、a>1なる底aに対してF:x→log(x)となる変換とG:x→log(1+x)となる変換とを含む対数変換あるいは0<b<1なるbに対してH:x→xとなる変換であっても良い。
【0018】
また、前記特定位置のピークを解析に利用するかどうかの選別を行なうステップと、選別された特定位置のピークによるデータ解析を行なうステップと、を行なった後に、該データ解析の結果に基づいて波形を複数のサブグループに分類し、該サブグループそれぞれに対して、再度、分割可能性判定ステップとデータ解析ステップとを実行することを必要な回数再帰的に繰り返して行なうことも可能である。
【発明の効果】
【0019】
本発明によれば、波形解析における解析結果の精度を高めることができるという利点がある。
【発明を実施するための最良の形態】
【0020】
ピークを有する波形を解析する際に、ピーク位置は変数軸により表され、ピーク強度は強度軸により表される。変数軸上の同じ位置に複数の測定により得られた複数のピークが位置する場合に、ピーク強度に基づいて、これらのピークが測定誤差による偶然では起こりにくい「二群に分割可能」な状態で分布しているか否かを判定する(分割可能性判定)ことが可能である。この「二群に分割可能」という状態は、測定誤差よりもむしろ検体の質的な差に基づくものと考えられ、クラス判別等の解析にとっては若干の統計的有意性の減少を補って余りある優位点となる。尚、従来の検定を用いる方法と組み合わせて用いることも可能であり、このようにすれば、より有意性の高いピークを絞り込むことができる。
【0021】
また、本発明では、「二群に分割可能」という性質のため境界付近は大きく空いており、境界位置の厳密さが要求されない。また、未知の検体も測定の変動はあるが、境界からは比較的離れていると考えられ、変動の影響を受けにくい(図14A)。
【0022】
本発明の実施の形態によるピーク解析技術は、測定差があるにも拘わらず高精度のクラス判別が可能となる利点を有しているが、学習用検体と未知検体との測定状況の差異によって生ずる測定結果の差が、著しく許容範囲を超えればその限りではない。しかしながら、複数の未知検体がすべて同様の状況で測定され、かつ、その検体数が十分多ければ、以下のようにして高精度を保ったクラス判別が可能である。
【0023】
まず測定された複数の未知検体に対して分割可能性判定を行なう。未知検体は同様の状況で測定されているため、二群に分割可能であればその分割は測定差ではなく検体の質的差に由来しているものと考えられる。さらに、その質的差は、学習用検体を二群分割したそれと同じとみなすことが、ある程度の妥当性をもって可能である。そこで、学習用検体の二群と未知検体の二群とを対応付けるようにクラス判別を行なう(図14B)。
【0024】
以下に、本発明の実施の形態について説明するにあたって、発明者の行なった技術的な考察について図面を参照しながら説明を行なう。
【0025】
発明者は、測定数値をそのまま直接使わず、粒度を落した情報に加工して解析を行なうことで、変動に影響を受けにくい頑健な解析が実現できると考えた。より具体的には、図1(A)に示す波形データにおいて、波形上の特定位置のピークに着目し、複数の波形における同特定位置のピーク強度の数値を「ピーク有り」「ピーク無し」あるいは「大ピーク」「小ピーク」のように明確に二分できるか否かを判断する。明確に二分できるピークに絞ってそのピーク有無情報あるいはピーク大小情報を用いて解析することにより、変動に影響受けにくくかつ実質的に重要な情報を残した上での解析が可能となる。
【0026】
ここで、本実施の形態によるピーク解析技術では、以下の条件を満たす複数の波形データ群を対象とする。
1)同一種類の質量分析装置等から得られた複数の波形データであること、
2)各波形データは任意の方法によりピーク抽出済み(すべてのピークの位置と強度を同定済み)であること、
3)当該の複数波形データ間で、抽出されたピークの対応付けがなされていること。尚ピークの対応付けとは、特定位置に出現するピークの集団をまとめてグループ化すること。そのグループを以降ではピークグループと呼ぶ。また特定位置とは一つのポイントではなく、ある程度の幅を持つことも可能とする。
【0027】
上記の1)から3)までの条件を満たす複数の波形データにおける対応付けられたピークグループのそれぞれに対して、「分割可能性判定」を行なう。
【0028】
「分割可能性判定」とは、対象ピークグループに含まれる複数のピークを、「ピーク有り」群、「ピーク無し」群など、ピーク強度という観点に基づいて、それぞれの群でまとまりがあり、かつ、各群に明確な差がある二群に分割することが可能か否かを判定することである。このような分割可能性は、連続的に変動する測定誤差よりも、むしろ波形データが由来する検体の質的な差に基づくものと考えるほうが妥当である。
【0029】
従って、同判定によって分割可能と判断されたピークグループのみを対象として、それ以降のデータ解析を実施することにより、元検体の質的差が現れているピークグループのみを対象とすることができ、測定誤差による影響を極力排除することができる(図1(A)参照)。
【0030】
図1(B)は、本発明の第1の実施の形態による波形解析システムの一構成例を示す図である。図1(B)に示すように、本実施の形態による波形解析システム5は、質量分析装置11により分析された結果として得られた波形データにおいてピーク抽出及びピーク対応付け処理15を行い、これらのピークに関して分割可能性を判定する手段17と、分割可能なピークのデータのみを解析する手段41と、を有している。
【0031】
尚、本実施の形態において、複数の波形データ上のあるピークグループが、「ピーク有り」、「ピーク無し」、あるいは、より一般的に「大ピーク」、「小ピーク」の2群に明確に分割可能か否かの「分割可能性判定」が重要となる。以下においては、この分割可能性判定について詳細に説明する。
【0032】
分割可能性判定の基本方式は以下の通りである。ある二群が明確に分かれている程度を示す分割スコアを定義し、当該のピーク群を任意の境界で二分した際の上記スコアを計算し、様々な境界の決め方により得られた二群の分割スコアの中で最も高いスコアがユーザ指定値よりも高ければ、そのスコアを記録した境界および二群をもって当該ピーク群を分割可能と判断する。
【0033】
図2は、本実施の形態による分割可能性判定処理の流れを示すフローチャート図である。
【0034】
図2に示すように、ステップS1において、対象となるN個のピークに対し、それぞれのピークの強度を得る。ステップS2において、強度値列を二分する(N−1)個の強度境界値を求める。次いで、ステップS3において、各強度境界値をもとに強度値列を二分した際の分割スコアを算出する。ステップS4において、全ての強度境界値に対して分割スコアを算出したか否かを判断し、算出した場合には(Yes)、ステップS5に進み、最も高いスコアを「最大分割スコア」とする。ステップS6において、最大分割スコアがユーザ指定値よりも大きいか否かを判定し、大きい場合には(Yes)、ステップS7に進み、最大分割スコアを持つ強度境界値およびそれを用いて二分した二群をもって「分割可能」と判定する。小さい場合(No)には、ステップS8に進み、「分割不可能」と判定する。これにより、図1Aのような判定を行なうことができる。
【0035】
以下、上記のステップS2およびステップS3の処理について、より詳細に説明する。
ステップS2では、ピーク強度値列を二群に分ける強度境界値を全て求める。対象ピークがN個である場合、ある境界で二群に分ける方法は、図3に示すように、(N−1)通り存在する。すなわち、強度値を昇順ソートし、I1,…,INとした場合、Ii とIi+1(i=1,…,N-1)の間に一つの強度境界値が設定できる。ただし、Ii=Ii+1あるいはIi とIi+1が十分近い場合は、その間に強度境界値を設定できず、その分だけ強度境界値の個数は減少するものとする。
【0036】
以下に、Ii−Ii+1間の強度境界値の決め方について説明する。決め方には種々の方法があるが、例えばIiとIi+1の算術平均値をもって強度境界値とする方法がある。
【0037】
ステップS3においては、ステップS2で定めた(N−1)個の強度境界値による二分割の仕方それぞれに対して分割スコアを計算する。分割スコアは以下の性質を持つことが求められる。
1)最も妥当な強度境界値で二分割された際に、スコアが最大となる(図4)。
2)分割可能性がより高く二群が明確に分離できているほど、分割スコアが大きい(図5)。
【0038】
このような性質を持つ分割スコアの定義には様々なものが考えられる。その一つとして画像の二値化処理において利用される「群間分散/群内分散」がある(図6)。これらの値に基づいて、群1と群2との2つのピークに分割することができる(図7)。
【0039】
以下に群間分散/群内分散の算出方法について簡単に説明する。強度境界値より強度が大きいピーク群を群1とし、小さいピーク群を群2とした場合に、群1と群2の各群に属するピークの数及び各群に属するピーク強度値を以下の記号で示す。
【0040】
【数1】

このとき各群のピーク強度の平均値、分散、全体のピーク強度の平均値は以下のように計算することができる。
【0041】
【数2】

【0042】
さらに群間分散V、群内分散Vおよびその比「群間分散/群内分散」Rは以下のように計算することができる。
【0043】
【数3】

【0044】
このようにして算出されたRをもって、分割スコアとする。
尚、分割スコアの算出方法は群間分散/群内分散に限らず、前述の性質を持つ任意の方法が利用可能である。
【0045】
次に、対数変換された強度値に基づく分割スコア計算について詳細に説明する。図8の左図に示すように、ある群においては各ピークの強度値の差が大きい場合がしばしば見られる。このような場合に、強度値をそのまま用いると、図8の右図における「元のスケール」で示されるような不適切な位置で分割スコアが最大となる可能性がある。このようなケースでは、一旦、強度値を例えば対数変換することで適切な位置で分割スコアが最大となるようにすることができる(図8右図の「対数スケール」)。強度値の対数変換に代わる変換方法についても説明を行なう。対数変換は、強度値をより小さい値に置き換える処理であるが、特に次の性質を満たしている。
1)x1<x2 の場合、f(x1)<f(x2) 即ち単調増加な変換である。この性質により、元の強度値の大小関係が変換後も保存される(大小関係が逆転しない)。
2)1<x1<x2 の場合、f(x1)/x1>f(x2)/x2 である。即ち強度値が大きければ大きいほど、値を小さく変換する効果が大きい。
【0046】
上記の性質を満たす変換を、対数変換の代わりに用いても同様の効果が期待できる。例えば以下の変換がその例である。
x → log(1+x) (ただし、a>1)
x → x(ただし 0<b<1)
【0047】
尚、元の強度値および上記性質を満たすいくつかの強度変換を施した値に対してそれぞれ分割スコア計算を行い、それら複数の結果の中で最大の分割スコアを与える分割を最終的なスコア最大の分割とするという方法を用いることもできる。
【0048】
図1Bのデータ解析処理において、分割可能と判断されたピークグループを一つあるいは複数用いてクラス判別を行なうための判別規則を決定する場合について説明する。判別規則とは、当該のクラス判別を行うに際し、その手順を具体的に定めたものである。
【0049】
(1)単一のピークグループによるクラス判別
この方法は、一つのピークグループにおけるピークの有無に従ってクラスを判別する方法である。分割可能なピークグループそれぞれに対して、表1に示すような2×2分割表を作成し、与えられた波形をクラス別に最もよく分類するピークグループを選択する。よく分類されている程度を示す指標(分類指標)の一つに、精度がある。表1では、ピーク有をクラスA、ピーク無をクラスBと判断すれば、精度は(46+41)/100 = 87% となる。
【0050】
【表1】

【0051】
尚、表中の数字は該当する波形の数である。波形の総数は100であり、クラスの数はAとBで2とした。上記分類指標をすべての分割可能なピークグループに対して求め、正しいクラスにもっともよく分類するピークグループが定まれば、そのピークグループを用いて以下のような判別規則を定めることができる。
【0052】
【表2】

【0053】
尚、クラスの数がM(≧3)の場合は、2×M分割表を用いて同様に判別規則を定めることが可能である。
【0054】
尚、上の例では分類指標として精度を用いたが、他のもので代用することも可能である。例えば統計的検定を行った際のp値や相互情報量などが挙げられる。
【0055】
(2)複数のピークグループによるクラス判別
単一のピークグループでクラス判別を行なうと精度良くクラス判別できない場合は、複数のピークグループを組み合わせてクラス判別を行なう。例えば、前項の単一ピークグループからの判別規則の生成手続きを多段に行なうことで、図9に示すような決定木と呼ばれる構造の階層的な判別規則を生成することができる。
【0056】
図9に示す決定木では、特定のピークグループにおけるピークの有無により全波形を順次分類していく。最終的に各波形はいずれかの末端ノードにたどり着き、その末端ノードに割り当てられているクラスとして判別される。例えば下表のような波形ア、イを考える。
【0057】
【表3】

【0058】
波形アはピークグループNo.1において「ピーク有」であるので、最初の分岐(一番上の分岐)において左側をたどる。次の分岐においては、ピークグループNo.2が「ピーク無」であるため、右側をたどる。最終的には波形アはクラスBと判別される。一方波形イについては、同様の手続きによりクラスCと判別される。
【0059】
複数のピークグループからのクラス判別で用いる判別規則としては、上述の決定木の他にもニューラルネットワーク、サポートベクターマシン、多変量解析など様々な方法を用いることが可能であるが、一般に以下のようなN入力1出力の写像fとして捉えることができる。
f:PN → C
但し、P={ピーク有, ピーク無}
N:分割可能なピークグループの数
C:波形の属するクラスの集合
である。
【0060】
次に、本発明の第2の実施の形態による波形解析システムについて説明を行なう。本実施の形態による波形解析システムは、上記第1の実施の形態による処理(図1B参照)を再帰的に適用することを特徴とする。図10は、本実施の形態による波形解析処理の流れを示すフローチャート図である。図10に示す処理は、再帰的な処理が行なわれることを特徴とする。
【0061】
すなわち、最初に与えられた全波形を用いて分割可能性判定17およびデータ解析41を実施した後、その実施結果に基づいて全波形をいくつかのサブグループに分類し、各サブグループそれぞれに対して再度分割可能性判定およびデータ解析を独立に実施する。このような処理を必要に応じて繰り返し行なうことにより、階層的なデータ解析モデルを生成することができる。各サブグループ個別の解析に一度も進まない場合(一度もYESに進まない場合)が第1の実施の形態による処理の流れである。
【0062】
より詳細に説明すると、本発明の再帰的適用では、図10に示すように(符号は図1(B)に対応させて付している)、分割可能性判定と分割可能なピークグループを用いたデータ解析とを繰り返し行い、階層的な判別規則を生成する。分割可能性判定は、ノードごとに当該ノードに属する波形を用いて個別に実施する。データ解析では上記第1の実施の形態において説明したいずれの方式の判別規則を用いてもよい。また用いる判別規則の方式はデータ解析毎に異なっても良い。
【0063】
生成された判別規則を用いて当該ノードに属する波形をサブグループに分類した結果、特定の一つのクラスが大部分を占めるサブグループとそうではないサブグループとが得られる。後者に対しては更に本発明の実施による解析技術を適用して処理を行なう。そして、特定のクラスが大部分を占めるか、ノードに属する波形の数が十分少なくなるまで、分割可能性判定とデータ解析とを繰り返す。一方前者に対しては適用を終了する。
【0064】
データ解析において単一ピークグループによる判別規則を用いた場合、得られる判別規則は図9に示す決定木と同じ構造となる(図11)。しかしながら、再帰的適用により得られた決定木と非再帰的に得られた決定木では、分割可能性判定の実施回数や実施対象波形が異なる。すなわち、後者では全波形に対する分割可能性判定を最初に1回のみ行い、それにより得られた分割可能ピークグループをすべてのノードでのデータ解析で用いる。つまり分割可能ピークグループの見直しを行なわず、全ノードで分割可能ピークグループは同じとなる。一方前者では、分岐するごとに当該ノードに属する波形を対象とした分割可能性判定を再度実施する。つまりノードごとに分割可能ピークグループの見直しを行なうため、各ノードで分割可能ピークグループは異なる。
【0065】
ノードごとに分割可能性判定を再実施することの利点を、例を用いて説明する。表4は8つの波形と各波形の2つのピークグループP,Qにおけるピーク強度を示している。図12は分割可能性判定の実施対象波形をそれぞれ(a)波形1〜8、(b)波形1〜4、(c)波形5〜8としたときの各波形図と分割可能性判定結果である。
【0066】
【表4】

【0067】
図12(a)から(c)までに示すように、ピークグループQは全波形を対象とした分割可能性判定では分割不可能と判断されるが、波形1〜4を用いた判定では分割可能と判断される。すなわち判定結果は対象とする波形によって異なる。もし分割可能性判定の実施が全波形を対象とした実施1回のみである場合、ピークグループQはデータ解析に用いられることはない。一方ノードごとに分割可能性判定を行なえば、波形1〜4を対象としたデータ解析においてピークグループQは用いられることとなる。このようにノードごとに分割可能性判定を実施することで、ノードごとに適切なピークグループをデータ解析に用いることが可能となる。
【0068】
図13に示すように、本発明によれば、統計的有意性は劣るが明確に分割が可能である場合には、偶然の危険性は格段に低く、精度の良い測定が可能である。
【0069】
二群をわける境界の位置自体は従来同様正確なものではないが、「二群に分割可能」という性質のため各群は十分離れており境界付近は大きく空いている。そのため、境界位置の厳密さは従来方法ほど要求されない。また別途測定された検体も測定の変動はあるが、境界からは比較的離れていると考えられ、変動の影響を受けにくい(図14A)。
【0070】
本発明は測定差があるにも拘わらず高精度の判別が可能となる点を特徴としているが、学習用検体と未知検体との測定状況の差異によって生ずる測定結果の差が、著しく許容範囲を超えればその限りではない。しかしながら未知検体がいずれも同様の状況で測定され、かつその検体数が十分多ければ、以下のようにして高精度を保ったクラス判別が可能である。まず測定された複数の未知検体に対して分割可能性判定を行なう。未知検体は同様の状況で測定されているため、二群に分割可能であればその分割は測定差ではなく検体の質的差に由来しているものと考えられる。更にその質的差は学習用検体を二群分割したそれと同じとみなすことが、ある程度の妥当性をもって可能である。そこで学習用検体の二群と未知検体の二群を対応付けるようにクラス判別を行なう(図14B)。
【0071】
上記においては、「ピーク有」、「ピーク無」あるいは「大ピーク」、「小ピーク」の二群に分けることを考えてきたが、一般にN群に分けることへ拡張することも可能である。例えば図15に示す例では、「大ピーク」、「小ピーク」、「ピーク無」の三群にわけることができる。
【0072】
尚、一般的には、Nが少ない群の方が望ましい。二群にはうまく分けられない場合に三群、四群と増やしていくことになる。うまく分けられたところで分割処理をストップするのが一般的である。
【実施例1】
【0073】
以下に、本発明のより詳細な実施例について、ヒトの血漿を用いた解析処理を例にして説明を行なう。本発明の第1実施例による実施の概要について以下に説明する。
【0074】
ある薬剤に対するレスポンダーとノンレスポンダーを、それぞれ5人と11人、計16人の被験者を対象に、血漿を採取した。その血漿の質量分析結果に基づき、上記とは別の、薬剤反応が不明の被験者2人を対象にして、同薬剤に対する反応を判別する例を示す。本実施例による処理の流れについて図16を参照しながら説明を行なう。レスポンダー・ノンレスポンダー16人の血漿に対し、質量分析装置101、103を用いてそれぞれ2回の測定を行い、測定結果を計算機に取り込める形式の波形データとして出力する。1回の測定に対しそれぞれ一つの波形データが得られる。次に、計算機に取り込まれた各波形データに対して、「前処理」107、111、「ピーク抽出」115および「ピークグループ化」117の処理を実施する。前処理にはベースライン除去や平滑化など事前に必要な処理がすべて含まれる。これら一連の処理の後に得られる波形データ(図中(a)に相当)を図17に示す。図17では32個の波形データが重ねて表示されている。網掛け部分Db1からDb18内のピークがグループ化されているものである。
【0075】
各波形データは、図16の波形解析装置に入力されると、「分割可能性判定」部121によって各ピークグループDa1からDa18に対する分割可能性判定がなされる。図17の18個のピークグループDa1からDa18に対する最大分割スコアおよび強度境界値を表5に示す。表5中のNo.は、図17の18個のピークグループDa1からDa18に対して左側から割り当てた通し番号である。尚、本実施例では、同一被験者の検体を2回測定しているため、各ピークグループDa1からDa18に含まれるピークの強度値を被験者ごとに平均して分割可能性判定した。
【0076】
【表5】

【0077】
最大分割スコアが20以上のピークグループを分割可能と判断するものと規定すると、No.12のピークグループDa12が分割可能と判断される。同ピークグループDa12の拡大図を図18に示す。図18に示すように、ピークグループDa12では二群に明確に分かれているのがわかる。
【0078】
次に図16の「判別規則決定」123では、分割可能と判定されたピークグループを用いて次処理の「クラス判別」125を行なうための判別規則を決定する。本発明によるクラス判別123では、ピークの強度数値をそのまま用いず強度境界値より大きいか小さいかという粒度を落した情報を用いる。本実施例では分割可能ピークグループは1つ(Da12)であるため、このピークグループの強度境界値より大きいか小さいかでクラスを判別する。
【0079】
図19に32個の波形データそれぞれから得られるピークトップの分布を示す。ピーク有り群ではレスポンダーが、ピーク無し群ではノンレスポンダーが多いことがわかる。そこで強度境界値以上をレスポンダー、未満をノンレスポンダーと判別する方法を判別規則とする。
【0080】
次に薬剤反応不明被験者2人(以下、被験者A、被験者B)の薬剤反応、すなわちレスポンダー・ノンレスポンダーのいずれのクラスに属するのかを判別する。まず同被験者の血漿に対して質量分析装置を用いてそれぞれ2回測定を行い、測定結果を計算機に取り込める形式の波形データとして出力する。1回の測定に対しそれぞれ一つの波形データが得られる。次に、計算機に取り込まれた各波形データに対して、「前処理2」を行なう。「前処理2」は「前処理」と同じ処理でなければならない。被験者A、Bの波形データを図20に示す。網掛け部分DbとピークグループDaに関しては、図17と同様の意味を持つ。
【0081】
次に図16の「クラス判別」125において、被験者A、Bのクラスを判別する。被験者A、Bの波形データのNo.12ピークグループに対応する部分を拡大したものが図21である。
【0082】
被験者A、Bのピークの強度を図19に重ねると図22のようになる。「判別規則決定」123で定めた基準に従いクラス判別を行った結果、被験者Aはレスポンダー、被験者Bはノンレスポンダーと判別される。なお強度境界値との大小比較においては、被験者A,Bそれぞれ2回の測定で得られたピーク強度の平均値を用いている。
【0083】
尚、変数軸に関する位置の異なる複数のピークに基づいて、例えば診断などの判定を行なうことも可能である。このようなマルチマーカによる判定を行うと、診断などの精度がより向上するという利点がある。
【0084】
尚、本発明は、飛行時間型質量分析装置(TOF−MS:time-of-flight Mass Spectrometry)、液体クロマトグラフなどの質量分析装置を用いて血漿、血清、尿、組織抽出液、髄液などの様々な生体試料を測定することにより得られる波形データから、生体試料に含まれるタンパク質等の生体由来分子に対応する波形のピークを、電子計算機を用いた情報処理によって抽出する技術にも応用することができる。
【産業上の利用可能性】
【0085】
本発明は、医療分野におけるピーク解析に利用可能である。
【図面の簡単な説明】
【0086】
【図1】図1(A)は、波形上の特定位置のピークに着目し、複数の波形における同特定位置の測定数値を「ピーク有り」「ピーク無し」あるいは「大ピーク」「小ピーク」のように明確に二分できるか否かを判断する様子を示す図である。図1Bは、本発明の第1の実施の形態による波形解析システムの一構成例を示す図である。
【図2】本実施の形態による分割可能性判定処理の流れを示すフローチャート図である。
【図3】図2のステップS2における、ピーク強度値列を二群に分ける強度境界値を全て求めるステップの概要を示す図である。
【図4】分割スコアの満たすべき性質(1)を示す図である。
【図5】分割スコアの満たすべき性質(2)を示す図である。
【図6】「群間分散/群内分散」の概要を示す図である。
【図7】ピークグループの分割の様子を示す図である。
【図8】強度値の対数変換による応用例を示す図である。
【図9】決定木と呼ばれる構造であり、階層的な判別規則を示す図である。
【図10】本発明の第2の実施の形態による波形解析処理の流れを示すフローチャート図である。
【図11】本発明の第2の実施の形態による波形解析処理に対して適用される判別規則の構造である。
【図12】分割可能性判定の実施対象波形をそれぞれ(a)波形1〜8、(b)波形1〜4、(c)波形5〜8としたときの各波形図と分割可能性判定結果を示す図である。
【図13】本発明により、明確にピーク群を分離することが可能である場合の例を示す図である。
【図14A】測定値が境界から大きく離れている状態でのクラス判別の様子を示す図である。
【図14B】学習用検体の二群と未知検体の二群を対応付けるようにクラス判別を行なう例を示す図である。
【図15】「大ピーク」、「小ピーク」、「ピーク無」の三群にわけることができる例を示す図である。
【図16】本発明の第1実施例による処理の全体を示す図である。
【図17】ピーク抽出、ピークグループ化後の波形データ例を示す図である。
【図18】ピークグループの拡大図である。
【図19】32個の波形データそれぞれから得られるピークトップの分布を示す図である。
【図20】被験者A、Bの波形データ例を示す図である。
【図21】被験者A、Bの波形データ(No.12ピークグループの位置に対応する範囲)を示す図である。
【図22】被験者A、Bのクラス判別の様子を示す図である。
【図23】従来のディファレンシャル解析方法であって、統計的検定を用いてクラス間でピーク強度の数値自体に統計的な有意差が認められるピークの位置を同定するという方法を示す図である。
【図24】従来のピーク強度値をそのまま用いたクラス判別方法を示す図である。
【図25】波形データの例を示す図である。
【図26】ディファレンシャル解析を説明する図である。
【符号の説明】
【0087】
A…波形解析システム、1…質量分析装置、3…ピーク抽出及びピーク対応付け装置、3…分割可能性判定装置、5…データ解析装置。

【特許請求の範囲】
【請求項1】
変数軸と強度軸とを有する同種の複数の波形に基づいて解析を行なう波形解析方法であって、
前記変数軸上のある特定位置に形成された前記強度に関する複数のピークであって、それぞれのピークが前記複数の波形のいずれか一つの波形の一部である複数のピークに関して、それぞれのピークのピーク強度値に基づいて、前記複数のピークを前記強度軸上において分割可能であるか否かを判定する分割可能性判定ステップを有することを特徴とする波形解析方法。
【請求項2】
前記分割可能性判定ステップに基づいて、前記特定位置のピークを波形解析に利用するかどうかの選別を行ない、選別された前記特定位置のピークに基づいてデータ解析を行なうステップを有することを特徴とする請求項1に記載の波形解析方法。
【請求項3】
前記分割可能性判定ステップは、
前記複数のピーク強度値が、N(Nは2以上の整数)分割可能であるか否かを判定するステップを有することを特徴とする請求項1又は2に記載の波形解析方法。
【請求項4】
前記分割可能性判定ステップは、
ピークの有り無しに基づいて行なわれることを特徴とする請求項3に記載の波形解析方法。
【請求項5】
前記分割可能性判定ステップは、
ピークの強度値の大小に基づいて行なわれることを特徴とする請求項3に記載の波形解析方法。
【請求項6】
分割可能性判定判定ステップは、
あるN群が明確に分かれている程度を示す分割スコアを定義し、当該のピーク群を任意の境界でN個に分割した際のスコアを計算するステップと、
境界の決め方を変更しながら得られたN群の分割スコアの中で最も高いスコアが所定の指定値よりも高ければそのスコアを記録した境界およびN群をもって当該ピーク群を分割可能と判断するステップと
を有することを特徴とする請求項3に記載の波形解析方法。
【請求項7】
前記ピーク強度値をスケール変換した値に基づいて選別を行なうことを特徴とする請求項1から6までのいずれか1項に記載の波形解析方法。
【請求項8】
前記変換は、a>1なる底aに対してF:x→log(x)となる変換とG:x→log(1+x)となる変換とを含む対数変換あるいは0<b<1なるbに対してH:x→xとなる変換であることを特徴とする請求項7に記載の波形解析方法。
【請求項9】
請求項2から8までのいずれか1項に記載の前記特定位置のピークを解析に利用するかどうかの選別を行なうステップと、選別された特定位置のピークによるデータ解析を行なうステップと、を行なった後に、該データ解析の結果に基づいて波形を複数のサブグループに分類し、該サブグループそれぞれに対して、再度、分割可能性判定ステップとデータ解析ステップとを実行することを必要な回数再帰的に繰り返して行なうことを特徴とする波形解析方法。
【請求項10】
前記データ解析を行なうステップは、選別された一つ以上の前記特定位置のピークに基づき、前記複数の波形のそれぞれが由来する検体のクラスを判別する規則を生成するステップを含むことを特徴とする請求項2から9までのいずれか1項に記載の波形解析方法。
【請求項11】
前記データ解析を行なうステップは、前記クラスを判別する規則と別途与えられたクラス未知の検体から得られた波形とを用いて、前記クラスが未知の検体のクラスを判別するステップを含むことを特徴とする請求項10に記載の波形解析方法。
【請求項12】
前記のクラスを判別するステップは、前記クラス未知検体の一つ一つをそれぞれ単独に前記クラスを判別する規則を用いてクラス判別するステップと、複数の前記クラス未知検体から得られた波形をもとに別途行った分割可能性判定結果に基づき前記クラスを判別する規則を用いてクラス判別するステップと、のいずれかのステップにより構成されることを特徴とする請求項11に記載の波形解析方法。
【請求項13】
第1の軸と第2の軸とを有する同種の複数の波形に基づいて解析を行なう波形解析方法であって、
前記第1の軸上のある特定位置に形成された前記第2の軸上の値に関する複数のピークであって、それぞれのピークが前記複数の波形のいずれか一つの波形の一部である複数のピークに関して、それぞれのピークにおける第2の軸の度値に基づいて、前記複数のピークを前記第2の軸上において分割可能であるか否かを判定する分割可能性判定ステップと、
前記分割可能性判定ステップに基づいて、前記特定位置のピークを波形解析に利用するかどうかの選別を行ない、選別された前記特定位置のピークに基づいてデータ解析を行なうステップと
を有することを特徴とする波形解析方法。
【請求項14】
コンピュータに請求項1から13までのいずれか1項に記載のステップを実行させるためのプログラム。
【請求項15】
変数軸と強度軸とを有する同種の複数の波形に基づいて解析を行なう波形解析装置であって、
前記変数軸上のある特定位置に形成された前記強度に関する複数のピークであって、それぞれのピークが前記複数の波形のいずれか一つの波形の一部である複数のピークに関して、それぞれのピークのピーク強度値に基づいて、前記複数のピークを前記強度軸上において分割可能であるか否かを判定する分割可能性判定部と、
前記分割可能性判定に基づいて、前記特定位置のピークを解析に利用するかどうかの選別を行ない、選別された前記特定位置のピークに基づいてデータ解析を行なうデータ解析部と
を有することを特徴とする波形解析装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14A】
image rotate

【図14B】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate