標的物質と相互作用するタンパク質の検出方法

【課題】偽陰性問題のみだけでなく、偽陽性問題も同時に解決することが可能な相互作用の検出方法の提供。
【解決手段】（１）転写工程、（２）対応付け工程、（３）選択工程、及び、（４）増幅工程を繰り返すことを含む、標的物質と相互作用するタンパク質の検出方法。（ａ）複数回のｃＤＮＡライブラリーの調製において、その調製回に特異的な配列を有するプライマーを用いて前記ｃＤＮＡを調製し（ｂ）前記調製回に特異的な配列を有するプライマーを用いて調製されたｃＤＮＡを混合し、配列決定を行い（ｃ）決定された配列を、前記調製回に特異的な配列に基づいて調製回毎の同一候補タンパク質をコードする分子の数を測定し（ｄ）候補タンパク質を前記標的物質と相互作用するタンパク質として検出する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、標的物質と相互作用するタンパク質の検出方法に関する。
【背景技術】
【０００２】
タンパク質と物質との間の相互作用を検出する方法として、mRNAとそれがコードするタンパク質が共有結合で連結したmRNA-protein対応付け分子を用い、タンパク質のアミノ酸配列情報を、DNAの塩基配列情報として取り出す方法がin vitro virus (IVV)法として知られている（特許文献１〜３）。このIVV法とサンガー型DNAシーケンサーを用いて、プロテオーム解析が行なわれている(非特許文献２; 非特許文献３; 非特許文献４)。これまでのサンガーの配列解析では、ライブラリーの１部（1000リード程度）のデータを配列解析出来るにとどまっていたため、ライブラリー空間の全容を把握することが現実的には困難であった（偽陰性問題）。
【０００３】
次世代型シーケンサーをトランスクリプトームやプロテオーム解析に導入し、タンパク質・DNA・RNAに関する分子間相互作用情報を、大量に取得する試みがなされている。(非特許文献４)。しかしながら、データに偽陽性が含まれていることが知られており、大量にデータが取得されるとき、大量の偽陽性データが取得されるため、偽陽性排除（信頼性向上）が望まれている。
【先行技術文献】
【特許文献】
【０００４】
【特許文献１】WO 98/16636
【特許文献２】WO 2003/048363
【特許文献３】WO 2004/053127
【非特許文献】
【０００５】
【非特許文献１】Genome Res., 15, 710-717, 2005
【非特許文献２】J Biol Chem, 284, 478-485, 2009
【非特許文献３】PLoS ONE, 5, e9289, 2010
【非特許文献４】Review: Morozova & Marra, Genome Res, 19, 521-532, 2009
【発明の概要】
【発明が解決しようとする課題】
【０００６】
IVV法と次世代シーケンサーと組み合わせることで、１０万から１億リードの配列解析が可能となり、これまでの偽陰性問題（ライブラリーの中の配列解析出来ていなかったデータの問題）が著しく改善することが期待できる。しかしながら、大量の配列解析は、大量の偽陽性データも生産することになり、偽陰性問題のみだけでなく、偽陽性問題も同時に解決することが大きな課題となる。
【０００７】
本発明は、偽陰性問題のみだけでなく、偽陽性問題も同時に解決することが可能な相互作用の検出方法を提供することを目的とする。
【課題を解決するための手段】
【０００８】
本発明者らは、ライブラリー中における目的タンパク質の絶対量による影響を受けずに、ラウンド毎の濃縮を検出できれば、偽陽性問題を解決し得るという仮説をたて、このような検出が、IVV法の特性を利用して特定の様式で調製した試料の配列解析を行うことにより可能になることを、次世代シーケンサーにより解析することにより見出し、本発明を完成した。
【０００９】
本発明は、以下の方法を提供する。
(1)候補タンパク質をコードするcDNAライブラリーを逆転写してmRNAライブラリーを調製する転写工程、
(2)前記転写工程で調製されたmRNAライブラリーからmRNA-タンパク質対応付け分子ライブラリーを調製する対応付け工程、
(3)前記対応付け工程で調製されたmRNA-タンパク質対応付け分子ライブラリーから、標的物質と相互作用するmRNA-タンパク質対応付け分子を選択する選択工程、及び、
(4)前記選択工程で選択されたmRNA-タンパク質対応付け分子のmRNA部分に基づく核酸増幅により、候補タンパク質をコードするcDNAライブラリーを調製する増幅工程、
(5)増幅工程で調製されたcDNAライブラリーを用いて工程(1)〜(4)を繰り返すことを含む、標的物質と相互作用するタンパク質の検出方法であって、
(a)最初のcDNAライブラリーの調製及び繰返しの増幅工程におけるcDNAライブラリーの調製のうち複数回のcDNAライブリーの調製において、その調製回に特異的な配列を有するプライマーを用いて前記cDNAライブラリーを調製し、
(b)前記調製回に特異的な配列を有するプライマーを用いて調製されたcDNAライブラリーを混合し、混合されたcDNAライブラリーについて配列決定を行い、
(c)決定された配列を、前記調製回に特異的な配列に基づいて、調製回毎における、同一候補タンパク質をコードする分子の数を測定し、
(d)前記調製回に応じて有意に増加している分子にコードされる候補タンパク質を、前記標的物質と相互作用するタンパク質として検出する
ことを含む前記方法。
【００１０】
本発明方法においては、cDNAのライブラリーを混合する量比において、早い調製回の量を次の調製回の量以上とすることが好ましい。
調製回に特異的な配列の長さは通常には４〜１０塩基長である。
前記プライマーは、通常には、調製回に特異的な配列を5'末端に有する。
工程(b)で混合するcDNAライブラリーの数は通常には３以上である。
工程(b)で混合するcDNAライブラリーが最初のcDNAライブラリーを含んでもよい。
工程(d)において分子の増加を統計学的方法により評価することが好ましい。
標的物質は、例えば、タンパク質である。タンパク質の場合は、タンパク質間相互作用を検出できる。
【発明の効果】
【００１１】
本発明により、偽陰性及び偽陽性の問題の軽減された検出方法が提供される。本発明の方法によれば、ライブラリーに含まれる絶対量の小さいタンパク質をコードする分子も検出できる。また、従来の方法では、偽陽性を排除するために、大量のリアルタイムPCRなどでの検証実験を行っていたが、それらが必要なくなる。データの信頼性が向上するだけでなく、実験時間やコストの大幅な削減になる。
【図面の簡単な説明】
【００１２】
【図１】本発明の方法の実施例の概要を示す。最初に、初期増幅用プライマーを用いてプレイcDNAライブラリーを作成し(1)、in vitro転写を行う(2)。転写後にプレイmRNAに付加したピューロマイシンは、そのmRNAがコードするタンパク質合成時にリボソームによって取り込まれ、C末端と結合する[IVV分子の形成](3)。次に、ベイトタンパク質に対して結合するプレイをアフィニティービーズを用いて選択し(4)、RT-PCRによるDNA転写及び増幅回特異的増幅用プライマーを用いる増幅を行う(5)。これらの工程（ラウンド）を繰り返すことでプレイ配列を濃縮することができる。各ラウンド後のプレイmRNAは、増幅回（ラウンド）毎に特異的（ユニーク）な配列（バーコード配列）を有するプライマーを用いて増幅され、それぞれの一部が保存される(5')。これらを混合し(6)、混合物について高速シークエンサーで配列決定し(7)、各決定配列についてラウンド情報の復元とゲノム配列へのマッピングを行う(8)。最後に、プレイの増加度合いの有意性を統計的検定によって確認し、相互作用の判定を行う(9)。
【図２】本発明方法 (左)と従来法(右)のデータの定量性比較を示す。左図はセレクションラウンド毎のリード数変化、右図は、同実験の分子数測定の結果である。
【図３】本発明方法と従来法のデータの定量性比較を示す。21個の領域の各ラウンドについてのリード数（縦軸）と同実験の分子数測定の結果（横軸）を示す。
【図４】本発明方法（454 GS FLX）と従来法（3730xl）で得られる配列の重なりを示す。
【発明を実施するための形態】
【００１３】
本発明の方法は、IVV法によるスクリーニングと、配列の解析とを組み合わせたものである（図１）。第１の部分は、特定のプライマーを用いる増幅によりcDNAライブラリーを調製する他は、従来のIVV法による方法と同様でよい。第２の部分は、特定のプライマーに含まれる配列を利用して配列を解析するものである。
【００１４】
先ず、第１のスクリーニング部分について説明する。この部分は、基本的にIVVを用いたPPI検出のための工程と同様でよい。この工程は更にいくつかの部分に分けることができる。すなわち、cDNAライブラリーからのmRNAの転写、通常にはPEG-PuroスペーサーのｍRNAへのライゲーション及び翻訳からなるIVV形成（対応付け）、選択、そして、次のラウンドで用いるcDNAライブラリーを調製する増幅である。これらのin vitro工程を繰り返す（通常には３〜５ラウンド程度）ことによって、ベイトに結合するプレイ分子は徐々にライブラリー中で濃縮されていき、RT-PCRプロダクトのシーケンシングによって同定することができるようになる。
以下、工程毎に説明する。
【００１５】
(1)転写工程
本工程は、候補タンパク質をコードするcDNAライブラリーを逆転写してmRNAライブラリーを調製する転写工程である。
【００１６】
候補タンパク質をコードするcDNAライブラリーは、特許文献３に記載のcDNAライブラリーの製造方法により調製できる。cDNAライブラリーの調製に使用されるＲＮＡ又はｍＲＮＡライブラリーは、原核、真核生物、ウイルスなどあらゆる種のいかなる組織から抽出したＲＮＡ又はｍＲＮＡライブラリーでも構わない。また、解読したゲノムやｃＤＮＡライブラリーを転写したＲＮＡライブラリーやそれを再現した人工のＲＮＡライブラリー、あるいは自然には存在しない配列を含む人工のｃＤＮＡライブラリーを転写したＲＮＡライブラリーでも構わない。
【００１７】
cDNAライブラリーを逆転写してmRNAライブラリーを調製する転写工程は、特許文献３に記載のRNAライブラリーの製造方法により行うことができる。
【００１８】
(2)対応付け工程
本工程は、転写工程で調製されたmRNAライブラリーからmRNA-タンパク質対応付け分子ライブラリーを調製する対応付け工程である。この工程は、特許文献２又は特許文献３に記載の方法により行なうことができる。以下、具体例を説明する。
【００１９】
(2-1)対応付け分子
本明細書において、対応付け分子(IVVと同義である)とは、表現型と遺伝子型と対応付ける分子を意味する。対応付け分子は、遺伝子型を反映する塩基配列を有する核酸を含む
遺伝子型分子と、表現型の発現に関与するタンパク質を含む表現型分子とが結合してなる。遺伝子型分子は、遺伝子型を反映する塩基配列を、その塩基配列が翻訳され得るような形態で有するコード分子と、スペーサー部とが結合してなる。このような対応付け分子は、例えば、特許文献２に記載されているので特許文献２を参照して説明する。
【００２０】
対応付け分子における、表現型分子に由来する部分、スペーサー分子に由来する部分、及び、コード分子に由来する部分をそれぞれ、デコード部、スペーサー部及びコード部と呼ぶ。また、遺伝子型分子における、スペーサー分子に由来する部分、及び、コード分子に由来する部分をそれぞれ、スペーサー部及びコード部と呼ぶ。
【００２１】
特許文献２図８に、対応付け分子、スペーサー分子及びコード分子の一例の大まかな構成が示されている。この対応付け分子は、ピューロマイシンを含むスペーサー(スペーサー部と呼ぶ)と表現型のコードを反映する塩基配列(コード部と呼ぶ)からなる。この対応付け分子は、コード分子に何らかの方法によってピューロマイシンを含むスペーサー部を結合して遺伝子型分子とし、無細胞翻訳系において、リボソーム上で表現型分子と連結した構成をもつ。スペーサー分子は、ポリエチレングリコールを主成分としたPEG領域、少なくともピューロマイシンあるいはピューロマイシンと1残基以上のDNAあるいは/またはRNAからなるCCA領域、少なくとも1残基以上のDNAあるいは/またはRNAを含むドナー領域、さらに、少なくとも1残基のDNAあるいは/またはRNAの塩基に機能修飾を施した機能付与ユニット(X)からなる。コード分子は、デコード部の一部の配列からなるDNAあるいは/またはRNAのポリA配列を含む3'末端領域、および、DNAあるいは/またはRNAからなる転写プロモーターおよび翻訳エンハンサーを含んだ5'UTR、さらに、主として表現型分子の配列からなるORF領域から構成される。以下、この例を参照して説明するが、本発明はこれに限定されるものではない。
【００２２】
(2-2)スペーサー分子
スペーサー分子は、核酸の3'末端に結合できるドナー領域と、ドナー領域に結合した、ポリエチレングリコールを主成分としたPEG領域と、PEG領域に結合した、ペプチド転移反応によってペプチドと結合し得る基を含むペプチドアクセプター領域とを含む。
【００２３】
核酸の3'末端に結合できるドナー領域は、通常、１以上のヌクレオチドからなる。ヌクレオチドの数は、通常には１〜１５、好ましくは１〜２である。ヌクレオチドはリボヌクレオチドでもデオキシリボヌクレオチドでもよい。
【００２４】
ドナー領域の5'末端の配列は、ライゲーション効率を左右する。コード部とスペーサー部をライゲーションさせるためには、少なくとも1残基以上を含むことが必要であり、ポリA配列をもつアクセプターに対しては、少なくとも１残基のdC(デオキシシチジル酸)あるいは２残基のdCdC(ジデオキシシチジル酸)が好ましい。塩基の種類としては、C>U又はT>G>Aの順で好ましい。
【００２５】
PEG領域はポリエチレングリコールを主成分とするものである。ここで、主成分とするとは、PEG領域に含まれるヌクレオチドの数の合計が20 bp以下、又は、ポリエチレングリコールの平均分子量が400以上であることを意味する。好ましくは、ヌクレオチドの合計の数が10 bp以下、又は、ポリエチレングリコールの平均分子量が1,000以上であることを意味する。
【００２６】
PEG領域のポリエチレングリコールの平均分子量は、通常には、400〜30,000、好ましくは1,000〜10,000、より好ましくは2,000〜8,000である。ここで、ポリエチレングリコールの分子量が約400より低いと、このスペーサー分子に由来するスペーサー部を含む遺伝子型分子を対応付け翻訳したときに、対応付け翻訳の後処理が必要となることがあるが（
Liu, R., Barrick, E., Szostak, J.W., Roberts, R.W. (2000) Methods in Enzymology,
vol. 318, 268-293）、分子量1,000以上、より好ましくは2,000以上のPEGを用いると、対応付け翻訳のみで高効率の対応付けができるため、翻訳の後処理が必要なくなる。また、ポリエチレングリコールの分子量が増えると、遺伝子型分子の安定性が増す傾向があり、特に分子量1,000以上で良好であり、分子量400以下ではDNAスペーサーと性質がそれほどかわらず不安定となることがある。
【００２７】
ペプチドアクセプター領域は、ペプチドのＣ末端に結合できるものであれば特に限定されないが、例えば、ピューロマイシン、3'-N-アミノアシルピューロマイシンアミノヌクレオシド（3'-N-Aminoacylpuromycin aminonucleoside, PANS-アミノ酸）、例えばアミノ酸部がグリシンのPANS-Gly、バリンのPANS-Val、アラニンのPANS-Ala、その他、全アミノ酸に対応するPANS-全アミノ酸が利用できる。また、化学結合として3'-アミノアデノシンのアミノ基とアミノ酸のカルボキシル基が脱水縮合した結果形成されたアミド結合でつながった3'-N-アミノアシルアデノシンアミノヌクレオシド（3'-Aminoacyladenosine aminonucleoside, AANS-アミノ酸）、例えばアミノ酸部がグリシンのAANS-Gly、バリンのAANS-Val、アラニンのAANS-Ala、その他、全アミノ酸に対応するAANS-全アミノ酸が利用できる。また、ヌクレオシドあるいはヌクレオシドとアミノ酸のエステル結合したものなども利用できる。その他、ヌクレオシドあるいはヌクレオシドに類似した化学構造骨格を有する物質と、アミノ酸あるいはアミノ酸に類似した化学構造骨格を有する物質を化学的に結合可能な結合様式のものなら全て利用することができる。
【００２８】
ペプチドアクセプター領域は、好ましくは、ピューロマイシンもしくはその誘導体、又は、ピューロマイシンもしくはその誘導体と1残基もしくは２残基のデオキシリボヌクレオチドもしくはリボヌクレオチドからなることが好ましい。ここで、誘導体とはタンパク質翻訳系においてペプチドのＣ末端に結合できる誘導体を意味する。ピューロマイシン誘導体は、ピューロマイシン構造を完全に有しているものに限られず、ピューロマイシン構造の一部が欠落しているものも包含する。ピューロマイシン誘導体の具体例としては、PANS-アミノ酸、AANS-アミノ酸などが挙げられる。
【００２９】
ペプチドアクセプター領域は、ピューロマイシンのみの構成でもかまわないが、5'側に1残基以上のDNAあるいは/またはRNAからなる塩基配列を持つことが好ましい。配列としては、dC-ピューロマイシン, rC-ピューロマイシンなど、より好ましくはdCdC-ピューロマイシン, rCrC-ピューロマイシン, rCdC-ピューロマイシン, dCrC-ピューロマイシンなどの配列で、アミノアシル-tRNAの3'末端を模倣したCCA配列（Philipps, G.R. (1969) Nature 223, 374-377）が適当である。塩基の種類としては、C>U又はT>G>Aの順で好ましい。
【００３０】
(2-3)コード分子
コード分子は、転写プロモーターおよび翻訳エンハンサーを含む5'非翻訳領域と、5'非翻訳領域の3'側に結合した、タンパク質をコードするORF領域と、ORF領域の3'側に結合した、ポリA配列及び、必要によりその5'側に翻訳増強配列（例えば制限酵素XhoIが認識する配列）を含む3'末端領域を含む核酸である。コード分子は、前記転写工程で調製されたmRNAライブラリーを構成する。
【００３１】
3'末端領域は、好ましくはSNNS配列（例えばXhoI配列）とその下流にポリA配列を含む。スペーサー分子とコード分子とのライゲーション効率に影響を与える要素としては3'末端領域のポリA配列が重要であり、ポリA配列は、少なくとも２残基以上のdAあるいは/またはrAの混合あるいは単一のポリA連続鎖であり、好ましくは、3残基以上、より好ましくは６以上、さらに好ましくは８残基以上のポリA連続鎖である。
【００３２】
コード分子の翻訳効率に影響する要素としては、転写プロモーターと翻訳エンハンサー
からなる5'UTR、および、ポリA配列を含む3'末端領域の組み合わせがある。3'末端領域のポリA配列の効果は通常には10残基以下で発揮される。5'UTRの転写プロモーターはT7/T3あるいはSP6などが利用でき、特に制限はない。好ましくはSP6であり、特に、翻訳のエンハンサー配列としてオメガ配列やオメガ配列の一部を含む配列（Ω様配列）を利用する場合はSP6を用いることが特に好ましい。翻訳エンハンサーは好ましくはオメガ配列の一部であり、オメガ配列の一部としては、TMVのオメガ配列（Gallie D.R., Walbot V. (1992)
Nucleic Acids Res., vol. 20, 4631-4638）の一部(O29)を含んだものが好ましい。
【００３３】
また、翻訳効率に関し、3'末端領域においては、XhoI配列とポリA配列の組み合わせが重要となる。また、ORF領域の下流部分、すなわちXhoI配列の上流に親和性タグがついたものとポリA配列の組み合わせも重要となる。親和性タグ配列としては、抗原抗体反応など、タンパク質を検出できるいかなる手段を用いるための配列であればよく、制限はない。好ましくは、抗原抗体反応によるアフィニティー分離分析用タグであるFlag-tag配列である。ポリA配列効果としては、Flag-tag等の親和性タグにXhoI配列がついたものとそこへさらにポリA配列がついたものの翻訳効率が上昇する。
上記の翻訳効率に関し効果のある構成は、対応付け効率にも有効である。
【００３４】
ORF領域については、遺伝子配列、エキソン配列、イントロン配列、ランダム配列、あるいは、いかなる自然界の配列、人為的配列が可能であり、配列の制限はない。また、コード分子の5'UTRをSP6+O29とし、3'末端領域を、たとえば、Flag+XhoI+A_n(n=8)とすることで、各長さは、5'UTRで約60bp、3'末端領域で約40bpであり、PCRのプライマーにアダプター領域として組み込める長さである。このため、あらゆるベクターやプラスミドやcDNAライブラリーからPCRによって、5'UTRと3'末端領域をもったコード分子を簡単に作成できる。コード分子において、翻訳はORF領域を超えてされてもよい。すなわち、ORF領域の末端に終止コドンがなくてもよい。
【００３５】
特許文献２図１０に、コード分子の一例の詳細な構成が示されている。コード分子は、3'末端領域と、転写プロモーターおよび翻訳エンハンサーを含む5'UTRと、デコード部の配列情報からなる、すなわち表現型タンパク質をコードするORF領域とからなる。ここでは、3'末端領域として、親和性タグ配列、XhoI配列、ポリA配列を含み、Flag-tag配列を用いている。5'UTRとして、転写プロモーターのSP6、翻訳エンハンサーのオメガ配列の一部であるO29を含む配列を用いている。
【００３６】
(2-4)遺伝子型分子およびその製造方法
遺伝子型分子は、転写プロモーターおよび翻訳エンハンサーを含む5'非翻訳領域と、5'非翻訳領域の3'側に結合した、タンパク質をコードするORF領域と、ORF領域の3'側に結合した、ポリA配列を含む3'末端領域を含む核酸であるコード分子の3'末端と、スペーサー分子のドナー領域とが結合してなる。
【００３７】
遺伝子型分子を構成するコード分子は、上記のコード分子においてXhoI配列が必須ではない他は、コード分子について説明したとおりである。しかしながら、XhoI配列を有することが好ましい。
【００３８】
遺伝子型分子は、上記コード分子の3'末端と、スペーサー分子のドナー領域を、通常のリガーゼ反応により結合させることにより製造できる。反応条件としては、通常、４〜２５℃で４〜４８時間の条件が挙げられ、PEG領域を含むスペーサー分子のPEG領域内のポリエチレングリコールと同じ分子量のポリエチレングリコールを反応系に添加する場合には、15℃で0.5〜４時間に短縮することも可能である。
【００３９】
スペーサー分子とコード分子の組み合わせはライゲーション効率に重要な効果をもたら
す。アクセプターにあたるコード部の3'末端領域において、少なくとも２残基以上、好ましくは３残基以上、さらに好ましくは６〜８残基以上のDNAあるいは/またはRNAのポリA配列があること、さらに、5'UTRの翻訳エンハンサーとしては、オメガ配列の部分配列(O29;
特許文献２図１０)が好ましく、スペーサー部のドナー領域としては、少なくとも１残基のdC(デオキシシチジル酸)あるいは２残基のdCdC(ジデオキシシチジル酸)が好ましい。このことによって、RNAリガーゼを用いることでDNAリガーゼのもつ問題点を回避し、かつ効率を60〜80%に保つことができる。
【００４０】
(a)転写プロモーターおよび翻訳エンハンサーを含む5'非翻訳領域と、5'非翻訳領域の3'側に結合した、タンパク質をコードするORF領域と、ORF領域の3'側に結合した、ポリA配列を含む3'末端領域を含むコード分子の3'末端と、(b)（１）〜（４）のいずれか１項に記載のスペーサー分子のドナー領域であってRNAからなるものとを、スペーサー分子内のPEG領域を構成するポリエチレングリコールと同じ分子量をもつ遊離のポリエチレングリコールの存在下で、RNAリガーゼにより結合させることが好ましい。
【００４１】
ライゲーション反応時に、PEG領域を含むスペーサー部のPEG領域と同じ分子量のポリエチレングリコールを添加することによって、スペーサー部のポリエチレングリコールの分子量によらずライゲーション効率が80〜90%以上に向上し、反応後の分離工程も省略することができる。
【００４２】
(2-5)対応付け分子及びその製造方法
mRNA-タンパク質対応付け分子は、上記の遺伝子型分子を、ペプチド転移反応で、遺伝子型分子内のORF領域によりコードされたタンパク質である表現型分子と連結してなるものである。
【００４３】
対応付け分子は、遺伝子型分子を無細胞翻訳系で翻訳することにより、ペプチド転移反応で、遺伝子型分子内のORF領域によりコードされたタンパク質である表現型分子と連結することを含む。
【００４４】
無細胞翻訳系は、好ましくは、小麦胚芽又はウサギ網状赤血球のものである。翻訳の条件は通常に採用される条件でよい。例えば、２５〜３７℃で１５〜２４０分の条件が挙げられる。
【００４５】
無細胞翻訳系については、これまで大腸菌(E. coli)、ウサギ網状赤血球、小麦胚芽の系で対応付け分子の形成が検討され、ウサギ網状赤血球の系でのみ対応付け分子が確認されていたが（Nemoto, N., Miyamoto-Sato, E., Yanagawa, H. (1997) FEBS Lett. 414, 405; Roberts, R.W, Szostak, J.W. (1997) Proc. Natl. Acad. Sci. USA 94, 12297）、この態様によれば、PEG領域を含むスペーサー部をもつ対応付け分子として、小麦胚芽の系でも対応付け分子の形成を行うことができる。また、これまでウサギ網状赤血球の系では遺伝子型分子の安定性を欠くために実用性に乏しく、短い鎖長の遺伝子型分子にのみ適用されてきたが（Roberts, R.W, Szostak, J.W. (1997) Proc. Natl. Acad. Sci. USA 94, 12297; Nemoto, N., Miyamoto-Sato, E., Yanagawa, H. (1997) FEBS Lett. 414, 405）、PEG領域を含むスペーサー部をもつ対応付け分子は、小麦胚芽の系ではより安定であり長い鎖長を取り扱える実用的な系である。
【００４６】
無細胞共翻訳で「相互作用」が実現される場合、その無細胞翻訳系については、大腸菌(E. coli)、ウサギ網状赤血球、小麦胚芽の系などいずれでも構わない。in vitro virus法（IVV法）では、対応付け分子の形成は、大腸菌(E. coli)はかなり不安定であるが、ウサギ網状赤血球の系(Nemoto N, Miyamoto-Sato E, Yanagawa H. (1997) FEBS Lett. 414,
405; Roberts R.W, Szostak J.W. (1997) Proc. Natl. Acad. Sci. USA 94, 12297)では
安定に確認されており、さらに小麦胚芽の系(WO 02/46395)ではより安定に確認されている。
【００４７】
(3)選択工程
本工程は、対応付け工程で調製されたmRNA-タンパク質対応付け分子ライブラリーから、標的物質と相互作用するmRNA-タンパク質対応付け分子を選択する選択工程である。
【００４８】
選択の方法は、対応付け分子を用いることができる限り特に制限されず、公知の方法に従って行うことができる。例えば、特許文献１に記載の淘汰プロセスが挙げられる。
【００４９】
具体的には次のような方法が挙げられる。標的物質のタンパク質や核酸（DNAまたはRNA）や他の物質、例えば糖質や脂質などをマイクロプレートやビーズに予め共有結合や非共有結合を介して結合させておき、これに対応付け工程で調製した対応付け分子を加え、ある温度条件で、一定時間反応させた後、洗浄し、標的に結合しない対応付け分子を除去する。その後、標的に結合した対応付け分子を遊離させ、回収する。
【００５０】
(4)増幅工程
本工程は、選択工程で選択されたmRNA-タンパク質対応付け分子のmRNA部分に基づく核酸増幅により、候補タンパク質をコードするcDNAライブラリーを調製する増幅工程である。増幅の方法は、対応付け分子のmRNA部分に基づく核酸増幅が可能な限り特に限定されず、公知の方法に従って行うことができる。例えば、RT-PCRにより逆転写及び増幅をする方法が挙げられる。
【００５１】
本発明において、最初のcDNAライブラリーの調製及び繰返しの増幅工程におけるcDNAライブラリーの調製のうち複数回のcDNAライブリーの調製において、その調製回に特異的な配列を有するプライマーを用いて前記cDNAライブラリーを調製する。これにより、ライブラリーを構成する核酸部分の配列を決定したときに、いずれのライブラリーに由来するかを判別できるようにする。
【００５２】
特異的な配列の長さや位置は、後工程の配列決定後に識別できれば特に制限されない。通常のスクリーニングでは上記(1)〜(4)の工程が３〜５回繰り返されるので、最初の調製を含めて６回分が識別できる長さであればよく、この場合には３塩基長あれば十分となる。一方、識別を容易にするために、論理的に必要な塩基数より長い配列を用いてもよい。このような観点から、通常には、４〜１０塩基長の配列を用いる。
【００５３】
プライマーにおけるこの配列の位置は、増幅を妨げない限り特に制限されず、通常には、プライマーの5'側に付加される。
【００５４】
調製回に特異的な配列を有するプライマーを用いるcDNAライブラリーの調製は、最初及び全てのラウンド毎に行う必要はなく、後述する検出において有意な結果が得られる数だけ行えばよい。通常には、調製回に特異的な配列を含む３〜６のcDNAライブラリーを準備すればよい。
【００５５】
次に、特定のプライマーに含まれる配列を利用して配列を解析する部分について説明する。
本発明では、調製回に特異的な配列を有するプライマーを用いて調製されたcDNAライブラリーを混合し、混合されたcDNAライブラリーの配列決定を行う。
【００５６】
cDNAライブラリーの混合比は、配列決定に用いるシークエンサーの性能を考慮して決定すればよいが、目的配列が濃縮されていない早い調製回のライブラリーの量を多くするこ
とが好ましい。すなわち、cDNAのライブラリーを混合する量比において、早い調製回の量を次の調製回の量以上とすることが好ましい。調整回ごとのプレイの濃縮率は通常１０〜１００倍程度の範囲に収まるため、通常は配列決定を行う規模の大きさを考慮しながら、先の調製回の量を次の調製回の量の１〜１００倍とすることが好ましい。このようにすることにより解析を効率的に行うことができる。
【００５７】
配列決定の方法は、混合物に含まれる配列（調製回に特異的な配列を含めて、タンパク質をコードする配列）を決定できる限り、特に制限されないが、混合により対象となる分子の数が増えるため、いわゆる次世代シークエンサー又はハイスループットシーケンシングに使用されるシーケンサーを用いる方法が好ましい。
【００５８】
このように決定された配列を、調製回に特異的な配列に基づいて、調製回毎における、同一候補タンパク質をコードする配列の数（分子の数に相当する）を測定する。これは、いわゆるインシリコ解析と知られているコンピューターによる方法により行うことができる。
【００５９】
このように調製回毎に測定された数に基づき、調製回に応じて有意に増加している配列（分子）を特定し、その配列にコードされる候補タンパク質を、前記標的物質と相互作用するタンパク質として検出する。増加の判定においては、調製回の一部のデータを用いてもよい。例えば、最初及び１〜４ラウンドのデータがある場合に、後半の２〜４ラウンドのデータのみを用いてもよいし、最初、２及び４のように中間を省略したデータを用いてもよい。
【００６０】
配列（分子）の増加は、統計学的方法により評価することが好ましい。このような統計学的手法としては、フィッシャーの正確確率検定が挙げられる。
【００６１】
標的物質は、例えば、タンパク質である。タンパク質の場合は、タンパク質間相互作用を検出できる。
【００６２】
従来のIVV法などのmRNAディスプレイ技術を用いたタンパク質間相互作用解析技術では、偽陽性の判別のために、定量リアルタイムPCRアッセイなどの追加的な検証実験に大きなコストを払う必要があったが、本発明はそのコストを軽減できる。従来の方法では、プレイタンパク質の種別決定にラウンド毎の配列決定の結果を用いているため、その際のクローニング工程が解析効率を下げることになり、多くの偽陰性が生じていたが、本発明ではそれらの偽陰性を軽減できる。本発明によれば、ラウンド毎に配列決定をするのではなく、複数のラウンドのライブラリーを混合して配列決定をするとともに、ラウンド毎に配列を評価できるようにすることにより、ラウンド毎の変化の検出の誤差を最小にすることができ、それにより、IVV法によるスクリーニングにおける濃縮を正確に評価できるようになると考えられる。
【００６３】
以下、具体的に本発明の実施例を記述するが、下記の実施例は本発明についての具体的認識を得る一助とみなすべきものであり、本発明の範囲は下記の実施例により何ら限定されるものでない。本実施例では、本発明を具体的に適用した事例に加え、従来のラウンド毎に配列決定を行う方法との比較結果について記載する。
【実施例】
【００６４】
1 概要
IVV法によるセレクション過程を4ラウンド繰り返し、Irf7（Interferon regulatory factor 7）と相互作用するタンパク質をマウスの脾臓由来のランダムフラグメントライブラリから抽出する試みを行った。
【００６５】
2 IVV法によるセレクション
・プレイライブラリーの準備
mRNAディスプレイに用いるRNAライブラリーは、以前に報告された方法 (Miyamoto-Sato, E., et al. (2005) Genome Res, 15, 710-717.; Miyamoto-Sato, E., et al. (2003) Nucleic Acids Res, 31, e78.)に従って、C57BL/6マウスから抽出したpoly(A)+ mRNAから作成した。まず、poly(A)+mRNAのランダムプライミングを行い、ライゲーションを介した増幅、そしてin vitro発現を行うためのマルチステップPCRを行った。結果のPCR産物（SP6-Ω-T7-Flagment-Kpn1-FLAG-A[8]）は QIAquick PCR Purification Kit (Qiagen)で精製し、m7G(5')ppp(5')G RNA Capping Analog (Ambion)と共に RiboMAX Large Scale RNA Production System-SP6 (Promega)を用いて転写した。RNeasy96BioRobot8000Kit (Qiagen)を用いてｍRNAの精製を行った後、PEG-Puroスペーサーを、T4RNAリガーゼ（Promega）を用いてmRNAの3'末端にライゲーションし、再び精製した。
【００６６】
・ベイト調製
ベイト用のDNAは、以前の報告に従い準備した(Miyamoto-Sato, E., et al. (2005) Genome Res, 15, 710-717.; Miyamoto-Sato, E., et al. (2003) Nucleic Acids Res, 31, e78.)。マルチステップPCRによって作成されたcDNAコンストラクトの構造 (SP6-(O')-T7-Irf7-CBP-zz-His) には、マウスのIrf7のコード領域全体が含まれている。QIAquick PCR Purification Kit (Qiagen) を用いて生成されたPCR産物は、RiboMax Large Scale RNA Production System-SP6 (Promega)を用いて m7G(5')ppp(5')G RNA Capping Analogと共にmRNAに転写され、RNeasy96BioRobot8000Kit (Qiagen) を用いて精製された。
【００６７】
・In vitro翻訳とセレクション
プレイmRNAライブラリーとベイトのIrf7のmRNAは、小麦胚芽抽出 (Promega) を用いて無細胞翻訳系にて共翻訳した。このとき、mRNAの3’末端に付加してあるPuromycinは、mRNAから翻訳されたタンパク質のC末端と共有結合で連結され、IVV分子が完成する。その後、タグ付けされたベイトタンパク質を用いた１段階（4ラウンド目のみ２段階）の精製（Rigaut, G., et al. (1999) Nat Biotechnol, 17, 1030-1032.）を行った。各セレクションラウンドの後、プレイのmRNAはRT-PCRによって増幅され、その後転写・翻訳反応が行われ、次のラウンドのセレクションが再び行われる。ネガティブコントロール実験は、ベイトタンパク質が不在であること以外は同様の条件で行われた。
【００６８】
・454 GS FLXによる配列決定のためのサンプル準備
454 GS FLXによるシーケンシングの後に配列の由来ラウンドを見分けるために、初期〜4thラウンドのmRNAライブラリーのRT-PCRによる増幅においては、次の表１のように4塩基のユニーク配列を持つバーコードプライマーを使用した。
【００６９】
【表１】

【００７０】
バーコードプライマーで増幅された DNAサンプルは、QIAquick PCR Purification Kit (Qiagen)を用いて精製した。DNAの精製後、それぞれのサンプルの濃度を、NanoDropを用いて測定した。最後に、初期及び１〜４ラウンド目までのサンプルを20:10:7:2:1（濃度比）の割合で混合した。ネガティブコントロール実験におけるサンプルは、同様の方法で作成した。最後に、初期ライブラリーのサンプルと２つのミクスチャーサンプルをGS FLX
454（Roche）シーケンサーにかけ、配列決定を行った。
【００７１】
シーケンシングの結果、ベイト(+)ライブラリについて206,322リード、とベイト(-)ライブラリについて304,504リード、イニシャルライブラリについて277,833リードを得た。これらのうち、177,935、278,816、238,683はバーコード領域によってセレクションラウンドを決定することができた。これらのリードはBLATを用いてマウスゲノムにマッピングされ、結果として、ベイト(+)ライブラリについて47,849、ベイト(-)ライブラリについて
63,306、イニシャルライブラリにいて102,092リードがゲノムに適正にヒットすることが確認され、それらを続くインシリコ解析に用いることとした。
【００７２】
2.2 インシリコ解析
・ゲノムへのマッピングによる領域のカウントと統計解析
最初に、cDNA配列の端に存在するラウンド特異的な4塩基の部位のデコードを行い、各リードがどのラウンド由来のものであるのかを判定した。その後、処理されたリードはマスクされたゲノム配列に対してBLATを用いて次の条件の下でマッピングを行った： match length ≧30bp and identity ≧95%。マップされたリードのそれぞれのセレクションラウンドにおける頻度は、ゲノム上の各塩基ポジションについて計算され、初期ライブラリーとネガティブコントロールの結果に対して比較が行われた。さらに、初期ライブラリーおよびネガティブコントロールよりも高い頻度を示したポジションについては、統計的検定が行われたFisherの正確確率検定）。統計的に有意性（p<0.001）のある差が、初期ライブラリーとネガティブコントロールと比べて認められた場合、その領域をベイト特異的に濃縮された領域とみなした。有意な濃縮を示した領域のうち、連続しているものは一つに統合され、一つの相互作用領域（Interaction region; IR）とみなした。
【００７３】
・リアルタイムPCRとの比較による定量性およびその有効性の確認
本手法の定量性能を確認するために、複数のラウンドでリードが得られており、RefSeq領域との重なりが認められた21個の領域をランダムに抽出し、下記のようにリアルタイムPCRアッセイを行った。まず、ゲノム上でのリードの頻度がセレクションラウンドごとに計算された。これらの頻度はゲノム配列にマッピングされたリードの数に基づく。図２は、シーケンサー (図２(左)) およびリアルタイムPCRで定量された分子数 (図２(右)) の間の比較の例を示している。目視においては、本手法によるデータはリアルタイムPCRによる定量結果とよく符合した結果を見せたが、さらなる確証を得るために、それらの二つのデータの間の相関係数を計算し (図３)、それが統計的に有意に高いことを確認した (Pearson's correlation coefficient = 0.92)。また、本手法で陽性と判定されたもののうち、87.5%（7/8）がリアルタイムPCRでも陽性と判定され、リアルタイムPCRで偽陽性と判定されたもののうち、本手法で陽性であると判定されたものは、8%（1/12）のみであることを確認した。
【００７４】
・リアルタイムPCRアッセイ
リアルタイムPCRアッセイは7300 Real-Time PCR System (Applied Biosystems)を用い、標準プロトコルに従って行った。その際、プレイライブラリー由来の5ngのDNAテンプレート、10μM・0.5μlのプライマー（フォワード側、リバース側それぞれ）、12.5μlのPower SYBR Green PCR Master Mix (Applied Biosystems) を含む25μlのリアクションmixが使用された。サンプルの測定は2回ずつ行われ、その数値の平均を採用した。
【００７５】
・ハイスループットな相互作用領域の決定
上に示したように、本手法で得られたリード数とリアルタイムPCRで計られた分子数の間に有意な相関が確認された。したがって、本手法の定量性能を生かして、システマティックに統計的に有意な濃縮領域を決定した。濃縮の統計的な有意性は2×2分割表に対するFisherの正確確率検定を用いて行った。それぞれの分割表は、ある領域についてのあるセレクションラウンドにおけるベイト(+)、ベイト(-)実験で得られたリード数、および各実験でよって得られた総リード数から成り立っている。加えて、イニシャルライブラリとあるラウンドとの比較も同様の方法で行われた。結果として、p-value<0.001の条件でゲノム上の466個のプレイ領域が決定された。
【００７６】
2.3 従来法との比較
・偽陽性の軽減効果
上記のランダムに選択した領域（ただし、複数のラウンドでリードが得られていて、RefSeq領域にプライマーの設計が可能という条件付き）のリアルタイムPCRの判定結果に基づけば、42.9%（9/21）がライブラリーにおける陽性となる領域の割合と考えることができ、ラウンド毎のシーケンスの結果をリアルタイムPCRで判定する場合（従来法）の結果として考えることが出来る。本実施例では、本発明方法（IVV-HiTSeq法）を介して陽性と判断されたもののうち、定量リアルタイムPCRでも陽性と判断されたものの割合は87.5% (=7/8) であった。したがって、IVV-HiTSeq法を用いることで従来法と比較して、高い信頼性を持って相互作用分子を特定することができると考えられる。
【００７７】
・偽陰性の軽減効果
Irf7をベイトとして同一ライブラリーに対して、ラウンド毎の増幅物を用いる配列決定法で決定した740配列のうち、640配列（86.5%）がIVV-HiTSeq法によっても得られていたことから、従来法による結果の殆どを包含していることが示された（表２、図４）。
【００７８】
また、IVV-HiTSeq法によって陽性判定を得た479領域のうち、従来法で得られていたのは72領域のみであった。これは、残りの423領域がIVV-HiTSeq法でないと得られないことを意味しており、IVV-HiTSeq法の検出能力の高さを示している。
【００７９】
更に、重なりがあった72領域も、ラウンド毎の増幅物を用いる配列決定によって得られたクローンだけからは、その真偽を確認することは出来ないため、定量リアルタイムPCRアッセイなどの検証を追加的に行う必要がある。本実施例は4790（=479×ラウンド数×2）回以上のリアルタイム定量PCRアッセイを行ったことに相当し、ラウンド毎の配列決定とその後の定量リアルタイムPCRによる解析に比べてポストセレクションの効率が飛躍的
に高くなっていることを示している。
【００８０】
【表２】

【特許請求の範囲】
【請求項１】
(1)候補タンパク質をコードするcDNAライブラリーを逆転写してmRNAライブラリーを調製する転写工程、
(2)前記転写工程で調製されたmRNAライブラリーからmRNA-タンパク質対応付け分子ライブラリーを調製する対応付け工程、
(3)前記対応付け工程で調製されたmRNA-タンパク質対応付け分子ライブラリーから、標的物質と相互作用するmRNA-タンパク質対応付け分子を選択する選択工程、及び、
(4)前記選択工程で選択されたmRNA-タンパク質対応付け分子のmRNA部分に基づく核酸増幅により、候補タンパク質をコードするcDNAライブラリーを調製する増幅工程、
(5)増幅工程で調製されたcDNAライブラリーを用いて工程(1)〜(4)を繰り返すことを含む、標的物質と相互作用するタンパク質の検出方法であって、
(a)最初のcDNAライブラリーの調製及び繰返しの増幅工程におけるcDNAライブラリーの調製のうち複数回のcDNAライブリーの調製において、その調製回に特異的な配列を有するプライマーを用いて前記cDNAライブラリーを調製し、
(b)前記調製回に特異的な配列を有するプライマーを用いて調製されたcDNAライブラリーを混合し、混合されたcDNAライブラリーについて配列決定を行い、
(c)決定された配列を、前記調製回に特異的な配列に基づいて、調製回毎における、同一候補タンパク質をコードする分子の数を測定し、
(d)前記調製回に応じて有意に増加している分子にコードされる候補タンパク質を、前記標的物質と相互作用するタンパク質として検出する
ことを含む前記方法。
【請求項２】
工程(b)におけるcDNAライブラリーの混合比において、早い調製回の量を次の調製回の量以上とする請求項１に記載の方法。
【請求項３】
前記調製回に特異的な配列の長さが４〜１０塩基長である請求項１又は２に記載の方法。
【請求項４】
前記プライマーが前記調製回に特異的な配列を5'末端に有する請求項１〜３のいずれか一項に記載の方法。
【請求項５】
工程(b)で混合するcDNAライブラリーの数が３以上である請求項１〜４のいずれか一項に記載の方法。
【請求項６】
工程(b)で混合するcDNAライブラリーが最初のcDNAライブラリーを含む請求項１〜５のいずれか一項に記載の方法。
【請求項７】
工程(d)において分子の増加を統計学的方法により評価することを含む請求項１〜６のいずれか一項に記載の方法
【請求項８】
前記標的物質がタンパク質である請求項１〜７のいずれか一項に記載の方法。

【図１】