反復DNAエレメント(LINE/SINE)を陰性対照として用いる、次世代シークエンシングのための標的濃縮の効率を予測するための、定量PCRに基づく方法
【課題】濃縮プロセスのモニタリングに用いることができる方法を提供すること。
【解決手段】陰性対照配列および陽性対照配列をDNAライブラリーに加える、または陰性対照配列および/もしくは陽性対照配列をライブラリーから選ぶステップ(901)と、陰性対照配列の捕捉前の量および陽性対照配列の捕捉前の量を決定するステップ(902)と、捕捉後ライブラリーを作製するためにベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップ(903)と、捕捉後ライブラリーにおける陰性対照配列の捕捉後の量および陽性対照配列の捕捉後の量を決定するステップ(904)と、陽性対照配列の捕捉後の量、陰性対照配列の捕捉後の量、陽性対照配列の捕捉前の量、および陰性対照配列の捕捉前の量に基づいて、標的濃縮の効率を決定するステップ(905)とを含む、DNAライブラリーからの標的濃縮の効率を決定するための方法(900)。
【解決手段】陰性対照配列および陽性対照配列をDNAライブラリーに加える、または陰性対照配列および/もしくは陽性対照配列をライブラリーから選ぶステップ(901)と、陰性対照配列の捕捉前の量および陽性対照配列の捕捉前の量を決定するステップ(902)と、捕捉後ライブラリーを作製するためにベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップ(903)と、捕捉後ライブラリーにおける陰性対照配列の捕捉後の量および陽性対照配列の捕捉後の量を決定するステップ(904)と、陽性対照配列の捕捉後の量、陰性対照配列の捕捉後の量、陽性対照配列の捕捉前の量、および陰性対照配列の捕捉前の量に基づいて、標的濃縮の効率を決定するステップ(905)とを含む、DNAライブラリーからの標的濃縮の効率を決定するための方法(900)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、DNAライブラリー組成物の分析の分野に、特に、DNAライブラリーにおける配列の相対的存在量の変化を分析するための方法に関するものである。
【背景技術】
【0002】
ゲノムをシークエンシングするためのさらに効率的な技術の必要性によって、次世代ゲノムシークエンシング技術が開発されてきた。これらの次世代シークエンシング技術によって、ゲノムをシークエンシングする方法は激変したが、これらの技術には弱点がある。例えば、これらの技術は、ゲノムの特定の領域を容易に標的にすることができない。
【0003】
ゲノムの特定の領域をシークエンシングできることには、多くの用途に適用できる。例えば、一部の疾患は、わずか数個のヌクレオチドの突然変異から生じる。これらのわずかな突然変異を同定するためにヒトゲノム全体をシークエンシングすることは非効率的であろう。同様に、多くの複雑な疾患は、疾患のリスクに関連する1つの単一ヌクレオチド多型(SNP)またはSNPの組み合わせを伴う。ゲノムにおけるこのようなSNPの同定は、一塩基の変化を発見したり、全ての配列変異体を同定したりするために、罹患した個体のゲノムDNAの広範な領域(典型的には、100キロベース超)をシークエンシングすることを伴うため、困難な課題である。
【0004】
このような課題を容易にするために、分析またはシークエンシングの前に目的の配列についてライブラリーを濃縮することを伴う、さらに新たなアプローチが開発されている。濃縮の後、目的の配列のサブセットは、さらに効率的にシークエンシングされ得る。濃縮システムは、典型的には、目的の領域を囲む配列を含むオリゴヌクレオチドプローブを、DNAライブラリーから目的のDNA断片を捕獲するためのベイトとして用いる。これらのオリゴヌクレオチドプローブは、ハイブリダイズした配列をライブラリーから単離することを容易にし得る修飾を含むことが多い。
【0005】
このような濃縮システムの例は、Agilent Technologies,Inc.(Santa Clara、CA)から入手可能なSureSelect(商標)システムである。SureSelect(商標)システムは、目的の配列を濃縮するために、ビオチン−アビジンに基づく選択技術を用いる。このシステムは、シークエンシングの作業フローの費用およびプロセスの効率を大幅に向上させ得る。
【0006】
図1は、SureSelect(商標)を用いる、ライブラリーから目的のDNA配列を濃縮するプロセスを説明する略図を示す。図1において示されるように、ゲノムライブラリー試料は、配列断片をアダプター内にクローニングすることによって調製される。このライブラリーは、次に、ビオチン化されたRNAベイト(すなわち、ビオチンタグを有するRNAオリゴヌクレオチド)でプローブされる。ハイブリダイゼーションの後、ビオチン化されたベイトに結合した配列は、ストレプトアビジンで被覆された磁気ビーズを用いて、混合物から分離される。ビーズは(結合した配列とともに)洗浄され、次に、濃縮された標的配列が一本鎖DNA配列として放出されるように、RNA配列は消化される。目的のDNA配列は、次いで、PCRを用いて増幅されて、さらなる分析またはシークエンシングのための、濃縮された配列を生産することができる。この濃縮方法によって、比較的容易に目的の配列に焦点を当てることが可能になる。
【0007】
類似のアプローチが、米国特許出願公開第20110184161号において最近開示されている。この出願において開示される方法によると、断片化され変性したゲノム核酸分子を含有する試料が、ハイブリダイズ条件下で、基質上に固定されたオリゴヌクレオチドプローブに曝露される。固定されたプローブにハイブリダイズする目的の核酸分子は、次に、他の配列から分離され、結合したDNA断片は基質から溶出されて、濃縮されたライブラリーが作製できる。
【0008】
このような濃縮アプローチでは、濃縮されたライブラリーをシークエンシングする努力を費やす前に、標的配列が実際に濃縮されているか(およびどの程度濃縮されているか)を確認できることが望ましい。したがって、濃縮のモニタリングを可能にするために、陽性対照配列およびベイトが濃縮プロセスに含まれることが多い。濃縮の量的推計が望ましい場合、内部標準配列もまた含まれ得る。濃縮サイクルの後、または濃縮の推計が望ましい場合、濃縮されたライブラリーのアリコートを取り出し、典型的には定量PCR(qPCR)などの増幅技術を用いて分析することができる。
【0009】
標的にされたDNA分子を増幅し、同時に定量するために、定量PCR(qPCR)(またはリアルタイムPCR)を用いることができる。このプロセスは、DNA試料における1つまたは複数の特定の配列を増幅するためのPCRを伴う。同時に、リアルタイムでの定量をもたらすように、プローブ(典型的には、蛍光プローブ)が反応混合物内に含まれる。リアルタイムPCR産物を定量するための、2つの一般的に用いられる蛍光プローブは、(1)配列非特異的な様式で二本鎖DNA分子内にインターカレートする非配列特異的蛍光染料(例えば、SYBR(登録商標)Green)、および(2)DNA標的とのハイブリダイゼーションの後になって初めて、またはPCR産物内への組み込みの後に検出を可能にする配列特異的なDNAプローブ(例えば、蛍光レポーターで標識されたオリゴヌクレオチド)である。
【0010】
蛍光レポーターの例には、別の基によって消光される1つのフルオロフォアを有するプローブが含まれ得る。プローブが増幅配列内に組み込まれると、フルオロフォア分子または蛍光クエンチャー分子は切断され、それによって、フルオロフォアが発光することが可能になる。このアプローチの例は、米国特許第5,723,591号において記載されているようなTaqMan(登録商標)アッセイである。TaqMan(登録商標)アッセイは、中央のプローブオリゴヌクレオチドに隣接する2つのPCRプライマーを用いる。プローブオリゴヌクレオチドは、フルオロフォアおよびクエンチャーを含有する。PCRプロセスにおける重合ステップの間、ポリメラーゼはプローブオリゴヌクレオチドを切断する。この切断によって、フルオロフォアおよびクエンチャーは物理的に分離され、これによって、蛍光の発光が変化する。生産されるPCR産物が多いほど、蛍光シグナルの強度は増大する。
【発明の概要】
【0011】
これらの先行技術では、さらに高い信頼性でDNAライブラリーの濃縮をモニタリングすることができる。しかし、濃縮プロセスのモニタリングに用いることができる方法の必要性は依然として存在する。
【0012】
本発明の1つの態様は、DNAライブラリーからの標的濃縮の効率を決定するための方法に関する。本発明の1つの実施形態に従った方法は、陰性対照配列および/もしくは陽性対照配列をDNAライブラリーに加える、または、陰性対照配列および/もしくは陽性対照配列をDNAライブラリーから選ぶステップと、DNAライブラリーにおける陰性対照配列の捕捉前の量および陽性対照配列の捕捉前の量を決定するステップと、捕捉後ライブラリーを作製するために少なくとも1つのベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップと、捕捉後ライブラリーにおける陰性対照配列の捕捉後の量および陽性対照配列の捕捉後の量を決定するステップと、陰性対照配列の捕捉後の量に対する陽性対照配列の捕捉後の量の比率に基づいて、または(i)陽性対照配列の捕捉前の量および陰性対照配列の捕捉前の量の第1の比率と(ii)陽性対照配列の捕捉後の量および陰性対照配列の捕捉後の量の第2の比率との比較に基づいて、標的濃縮の効率を決定するステップとを含む。
【0013】
本発明の別の態様は、DNAライブラリーからの標的濃縮の効率を決定するための方法に関する。本発明の1つの実施形態に従った方法は、陰性対照配列をDNAライブラリーに加える、または陰性対照配列をDNAライブラリーから選ぶステップと、DNAライブラリーにおける陰性対照配列の捕捉前の量を決定するステップと、捕捉後ライブラリーを作製するために少なくとも1つのベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップと、捕捉後ライブラリーにおける陰性対照配列の捕捉後の量を決定するステップと、陰性対照配列の捕捉前の量と陰性対照配列の捕捉後の量とを比較することによって標的濃縮の効率を決定するステップとを含む。
【0014】
本発明の他の態様および利点は、以下の記載および添付の特許請求の範囲から明らかとなろう。
【図面の簡単な説明】
【0015】
【図1】Agilent TechnologiesのSureSelect(商標)システムを用いる標的濃縮のプロセスを説明する略図を示す図である。
【図2】本発明の1つの実施形態に従ったAluJo配列の増幅および定量のための、AluJoの配列ならびにプライマーおよびプローブを示す図である。
【図3】本発明の1つの実施形態に従ったL1MEe配列の増幅および定量のための、L1MEeの配列ならびにプライマーおよびプローブを示す図である。
【図4】本発明の1つの実施形態に従ったqPCRアッセイのための標準曲線のグラフを示す図である。
【図5】本発明の1つの実施形態に従った捕捉実験前後の様々な陽性対照配列およびSINE陰性対照配列の量を示す図である。
【図6A】様々なライブラリーを用いる捕捉実験前の5つの陽性対照配列および1つの陰性対照配列(AluJo)の量を示す図である。
【図6B】本発明の1つの実施形態に従った捕捉実験後のこれらの配列の量を示す図である。
【図7A】様々な条件下での捕捉実験前の5つの陽性対照配列および1つの陰性対照配列(AluJo)の量を示す図である。
【図7B】本発明の1つの実施形態に従った捕捉実験後のこれらの配列の量を示す図である。
【図8】本発明の1つの実施形態に従った方法を説明するフローチャートを示す図である。
【図9】本発明の1つの実施形態に従った方法を説明するフローチャートを示す図である。
【発明を実施するための形態】
【0016】
本発明の実施形態は、DNAライブラリーからの目的の配列の濃縮をモニタリングするための方法に関する。上記のように、DNAライブラリーから目的の配列を濃縮するプロセスにおいて、陽性対照を含めることによって、濃縮の進行をモニタリングすることが可能になることが示されている。本発明の方法は、陰性対照配列を用いることによって、濃縮のモニタリングにおけるさらなる向上を提供する。本発明の方法は、陰性対照配列を単独で、または陽性対照配列と組み合わせて用い得る。本発明の実施形態は、特に陽性対照配列と共に用いると、予想外の利点をもたらす。さらに、本発明の方法は、特定のライブラリーのために設計されたものではなく、したがって、標的ライブラリーに関わらず一般的な適用性を有する。
【0017】
本明細書において用いられる場合、「陰性対照配列」は、DNAライブラリーからの標的配列の濃縮において陰性対照として用いるための、選択された配列を有するオリゴヌクレオチドを言う。以下に記載されるように、陰性対照配列は、好ましくは、SINEファミリーまたはLINEファミリーに属する反復エレメントである。
【0018】
「陽性対照配列」は、DNAライブラリーからの標的配列の濃縮において陽性対照として用いるための選択された配列を有するオリゴヌクレオチドを言う。陽性対照配列は、DNAライブラリーにおいて見られる配列、またはDNAライブラリー内に添加された外因性の配列であり得る。
【0019】
本明細書において用いられる場合、「ベイト配列」は、ライブラリーから目的の配列(標的配列)を濃縮する(捕捉する)ために選択された配列を有するオリゴヌクレオチドである。ベイト配列は、DNAオリゴヌクレオチド、RNAオリゴヌクレオチド(例えば、SureSelect(商標)システムのためのベイト)、またはDNA/RNAオリゴヌクレオチドの組み合わせであり得る。ベイト配列と結合した配列の単離を容易にするために、ベイト配列は、親和性リガンド(例えば、ビオチン)と連結していてもよい。あるいは、ベイト配列は、固体担体に付着していてもよい。典型的には、濃縮実験において、目的の配列(標的配列)の周囲に1つまたは複数のベイト配列が設計される。ベイト配列は、標的配列とハイブリダイズする。ハイブリダイゼーションの後、ベイト配列は、結合した標的配列と共に、混合物から単離される。
【0020】
DNAライブラリーは、典型的には、多くのゲノムDNA断片を含む。本明細書において用いられる場合、「DNAライブラリー」は、増幅およびシークエンシングを容易にするためにDNA断片が特異的アダプターによって隣接されている、第二世代ゲノムライブラリーを言う場合がある。
【0021】
「濃縮」または「捕捉」は、1つまたは複数のベイト配列を用いてDNAライブラリーから標的配列を濃縮するプロセスを言う。1つまたは複数のベイト配列を用いることによる標的配列の濃縮後のDNAライブラリーは、「捕捉後ライブラリー」と呼ばれる。捕捉実験前のDNAライブラリーは、「捕捉前ライブラリー」と呼ばれ得る。したがって、配列(例えば、陽性対照配列または陰性対照配列)の量(数量)は、それが捕捉実験の前であるか後であるかに応じて、「捕捉前の量」または「捕捉後の量」と呼ばれ得る。
【0022】
本明細書において用いられる場合、「(1つまたは複数の)LINE」は、真核生物のゲノムにおいて多数見られる遺伝子エレメントの群である「(1つまたは複数の)長鎖散在エレメント」を言う。LINEの5’UTRは、典型的には、RNAポリメラーゼIIのプロモーター配列を含有するが、LINEの3’UTRは、ポリアデニル化シグナル(AATAAA)およびポリA尾部を含有する。したがって、LINEは、5’UTRにあるRNAポリメラーゼIIプロモーターを用いてRNAに転写され得る。LINEは逆転写酵素をコードし、多くのLINEはまたエンドヌクレアーゼ(RNase Hなど)をコードする。逆転写酵素は、他のRNAよりもLINEのRNAに対して高い特異性を有し、そして、新たな部位でゲノム内に組み込まれ得るRNAのDNAコピーを作製し得る。LINEは自律的にコピーし得るため、LINEは、ゲノムを増大し得る。ヒトゲノムは、例えば、約50万個のLINEを含有し、これはゲノムのおよそ17%である。
【0023】
本明細書において用いられる場合、「(1つまたは複数の)SINE」は、tRNA、rRNA、および他の低分子核内RNAなどのRNA分子から逆転写された短いDNA配列(500ベース未満)である「(1つまたは複数の)短鎖散在エレメント」を言う。霊長類における最も一般的なSINEは、Alu配列である。約150万個のコピーで、SINEは、ヒトゲノムの約11%を構成する。これらのうち、100万を超えるコピーが「Alu」エレメントであり、これは、ヒトゲノムの約10.7%を占める。
【0024】
SINEまたはLINEにおける反復配列は、「反復エレメント」と呼ばれ得る。「Alu配列」または「Aluエレメント」は、Alu制限エンドヌクレアーゼの作用によって最初に特徴付けされた短い一続きのDNAを言う。Alu配列は、通常、約300bp長である。Alu配列は、ヒトゲノムにおいて最も豊富な可動性エレメントであり、短鎖散在エレメント(SINE)として分類される。Aluエレメントの典型的な構造は、5’−部分A−A5TACA6−部分B−ポリA尾部−3’であり、式中、「部分A」および「部分B」は、類似の配列であるが、逆方向に配置されている。ポリA尾部の長さは、Aluファミリー間で異なる。Alu配列は、AluJおよびAluSとして知られている2つの主要なサブファミリーならびに多くのサブサブファミリーに分けられた。Alu配列(またはAluエレメント)の具体的な例は、AluJoである。
【0025】
本発明の実施形態に従うと、濃縮プロセスのモニタリングに用いるための「陰性対照配列」は、好ましくは、以下の特性の1つまたは複数を有する。まず、陰性対照配列は、濃縮の標的であってはならない。したがって、陰性対照配列は、濃縮実験において減少する。さらに、これらの陰性対照配列は、好ましくは、ほとんどのライブラリーにおいて見られる。陰性対照がほとんどのライブラリーにおいて見られるならば、このような陰性対照配列を用いる実験設計は、様々な濃縮目的で多くのライブラリーに適用可能となる。したがって、新たなライブラリーを用いる場合に陰性対照を再設計する必要はない。最後に、陰性対照配列は、好ましくは、モニタリングが容易である。
【0026】
これらの基準に基づいて、本発明の発明者らは、ゲノムにおいてしばしば見られる反復配列が、本発明の実施形態と共に用いるための良好な陰性対照配列であることを見出した。このような反復配列の例には、LINE(長鎖散在核内エレメント)、SINE(低分子散在反復エレメント)、および他の類似の配列が含まれ得る。これらの反復配列は、直接反復(例えば、全体的な直接反復、局所的な直接単純反復、局所的な直接反復、スペーサーを伴う局所的な直接反復など)または逆反復(例えば、全体的な逆反復、局所的な逆反復、スペーサーを伴う逆反復、パリンドローム反復など)であり得る。例えば、Usseryら、「Word Frequencies,Repeats,and Repeat−related Structures in Bacterial Genomes」、Computing for Comparative Microbial Genomics:Bioinformatics for Microbiologists、Computational Biology.8(第1版)、Springer、133〜144頁(2008)を参照されたい。これらの反復配列は、それらが生物学的機能を有していようがいまいが、本発明の実施形態に従った陰性対照配列として用いられ得る。
【0027】
これらの反復配列は濃縮実験における目的ではないため、これらは、通常、標的ライブラリーの設計の間に意図的に「マスキング」される。したがって、各標的濃縮実験のために陰性対照を具体的に設計する必要はない。したがって、このような反復配列を陰性対照のモニタリングに用いることは一般的に有用であり得、すなわち、様々なDNAライブラリーに適用可能である。
【0028】
上記のように、Alu反復は、ゲノムにおいて極めて豊富である。例えば、Alu反復についてのBLASTサーチでは、91,000超のヒットがヒト参照ゲノムにおいて得られた。Alu反復の実際の存在量は、約1Mコピー/細胞であると推定される。コピー/ゲノムが多数であることに起因して、このような反復は、ゲノムをシークエンシングする必要なくオンターゲット%と相関し得る、濃縮の敏感な尺度として作用し得る。
【0029】
SINEは、eArray(商標)による(RepeatMaskerアルゴリズムを用いる)ELID設計から自動的に排除されるため、捕捉の陰性対照として用いることができる。eArray(商標)は、SureSelect(商標)捕捉のためのベイトを設計するためのオンラインツールであり、Agilent Technologies,Inc.のウェブサイトから入手可能である。SINEは濃縮の標的ではないため、これらは残される(捕捉されない)はずで、濃縮されたライブラリーは、SINE配列の有意な低減を示すはずである。1つの実験において、Scripps Instituteと共同で、SureSelect(商標)濃縮の後に、SINEの含有量が12.6%から4.1%に低下することが見出された。このことは、ベイトの設計を通じてマスキングされた反復配列が濃縮(捕捉)実験において減少し得ることを裏付けるものである。さらに重要なことに、この結果は、濃縮効率を推定するために陰性対照配列のみを用い得る(すなわち、いかなる陽性対照も用いない)ことを示す。すなわち、陰性対照配列の減少の程度は、標的配列の濃縮の倍率を推定するために用いることができる。
【0030】
さらに、本発明の実施形態に従うと、陰性対照配列として用いられる反復配列(例えば、SINE配列またはLINE配列)は、非特異的な捕捉によって、最終的には、捕捉されたライブラリーとなるため、非特異的なDNAの捕捉の量(すなわち、オフターゲット%)を評価するためにも用いることができる。
【0031】
図2は、SINEでありヒトゲノムにおいて非常に豊富な、陰性対照配列AluJoの例を示す。図2において示されるように、AluJo配列は、311ヌクレオチド長(配列番号1)である。プライマー対(左プライマーおよび右プライマー)およびプローブオリゴヌクレオチド(それぞれ20nt)が、この陰性対照配列のqPCR分析(例えば、TaqMan(登録商標)アッセイ)のために設計される。TaqMan(登録商標)アッセイのためのプライマーおよびプローブの設計は、Applied Biosystems(Carlsbad、CA)のPrimer Express(登録商標)またはMassachusetts Institute of Technologies(Boston、MA)のWhitehead InstituteのPrimer3などの市販されているプログラムを用いて行うことができる。
【0032】
AluJo配列内の2つのプライマーおよびプローブオリゴヌクレオチドの位置を図2に示す。これらのオリゴヌクレオチドの配列は以下に示す通りである。
AluJo:配列番号1
1 AGCTGGGCGTGGTGGCTCACGCCTGTAATCCCAGAACTTTGGGAGGCTGAGACTGGCTGA
61 TTTCTTGAGCCCAGGAGTTTGAGACTAGCCTGGACAACATAGTGAGACCCCATCTTTACA
121 AAAAAATTAAAAAAAATTAGTGGACATGGTGGCATGCACCTCTAGTCCCAGTTACTCAGG
181 AGGCTGAGGTGGGAGGATCACCTGTGCCCAGGCTGAGGCTGCAGTGAGCCATGATCACGC
241 CACTGCACTCCAGCCTGCGTGACAGAGCAAGACCCTGTCTCAAAAGAAAAGAAAAAAAAA
301 GAAGAAAGAAA
左プライマー:GTGGCATGCACCTCTAGTCC 配列番号2
右プライマー:TGAGACAGGGTCTTGCTCTG 配列番号3
プローブ:TACTCAGGAGGCTGAGGTGG 配列番号4
【0033】
図2は、本発明の方法と共に用いるためのSINE陰性対照配列の設計の1つの例を示す。図3は、LINE配列である別の例(すなわち、L1MEe反復)を示す。このL1MEe反復(配列番号5)は、ヒトゲノムにおいて、AluJoほど豊富ではない。それでも、L1MEe反復は、良好な陰性対照配列でもある。L1MEe反復を陰性対照配列として用いるための、左プライマー(配列番号6)、右プライマー(配列番号7)、およびプローブ(配列番号8)の設計が、図3において説明される。これらのオリゴヌクレオチドの配列は以下の通りである。
L1MEe:配列番号5
1 ATGCTATTTACGAGAGAAGCATTTGCAACAAAATGCCAAAGAGAAGGTGAAAATAGCTGG
61 AAAAAAAATGCGCAAAGCAAATAACCAATAGAAAGAAAGCCAAGTTGGGCTAGCAAAATC
121 AGACAAAATAACCTTCGAGGTGCAAACAACTTT
左プライマー:GCGCAAAGCAAATAACCAAT 配列番号6
右プライマー:TGTTTGCACCTCGAAGGTTA 配列番号7
プローブ:TGGGCTAGCAAAATCAGACA 配列番号8
【0034】
図2および図3は、それぞれ、陰性対照配列として用いるためのSINE配列およびLINE配列の例、ならびにそれらのプライマーおよびプローブの設計を示す。当業者には、他の反復配列(LINEまたはSINE)が、本発明の実施形態に従った陰性対照配列として用いるために同様に設計され得ることが理解されよう。以下は、本発明の実施形態に従った陰性対照配列として用いられ得るいくつかのさらなる反復配列の例である。
【0035】
AluSx(Aluファミリー、SINE反復):配列番号9。
GGCTGGATGCAGTGGCTCGTGCCTGTAATCCCAACACTTTGGGAGGCTGA
GGCGGGTGGATCACCTGAGGTCAGGAGTTCGAGACCAGGCTGGCCAACAT
GGCAAAACCCCGCCTCTACTAAAAATACAAAAATTAGCCAGGCATAGTGG
TGCACGCCTGTAATCACAGCTACTCAAGAGGCTGAAGCAGGAGAATTGCT
TGAACTCAGGAGGTGGAGGTGGCAGTGAGCCAAGATCGTGCCACTGCACT
CCAGCCTCAGTGACAGAGCGAGACTCTGTCTCAAAAAATAAATAAATAAA
A
【0036】
AluY(Aluファミリー、SINE反復):配列番号10。
GGCCGGGCGCGGGGGCTCGCGCCTGTCATCCCAGCACTTTGGGAGGCCGA
GGCGGGCGGATCACGAGGTCAGGAGATCGAGACCATCCTGGCTAACACGG
GGAAACCCCGTCTCCACTAAAAATACAAAAAGTTAGCCGGGCGCGGTGGC
GGGCGCCTGCGGTCCCAGCTGCTGGGGAGGCCGAGGCGGGAGCATGGCGG
GAACCGGGAGGCGGAGCCTGCAGTGAGCCGAGATGGCGCCACCGCACTCC
AGCCTGGGCGACCCAGCGAGACTCCGCCTCAAAAAAAAAAAAAGAA
【0037】
L5(LTEファミリー、LINE反復):配列番号11。
TCTCTTTATTTGCTTCTGCTAATTAAAAAATCAGAGCTAAAGATACTTAA
ACACTACAGTTAAAATGCCATGGTTGTCTATTGGCTTAACGAATTCTCTT
ATGAAATCAACTCTAAAATGCTATCCATCATAAATCATGAAACGCAATTT
TTCTTATTCTCTTTAGAGCTTTACAATTCATCTTAAAGACCAGTGTTTAC
ACTCTCTTCTGTAGGTTGTACAATAACTTTTGGCGAGAAAAAATAAAAGT
CTGGCTTTCTGAC
【0038】
MER58A(hAT−Charlieファミリー、DNA反復):配列番号12。
GGAGGTGGTAAATTTGACTCATGGGACAAATCTTTTGTAAATAAAGTTTC
ACTGGAACCCAGTCACACTCATTTGTTTCTGTATTGTCTGTTGACAGTTT
TTATGCTACAATAAGAGTTGAGTAGTTATGACAGACACTCTAGGGCCTGT
AGAGCCTATAATATTTACTTTTGGCCTTTTACGGAAGAAGTTTACTGACC
【0039】
MLT1A(ERVL−MaLRファミリー、LTR反復):配列番号13。
CTCCTCTGTCTTTTCCCACCAAGTGAGGATGCGAAGAGAAGGTGGCTGTC
TGCAAACCAGGAAGAGAGCCCTCACCGGGAACCCGTCCAGCTGCCACCTT
GAACTTGGACTTCCAAGCCTCCAGAACTGTGAGGGATAAATGTATGATTT
TAAAGTCGCCCAGTGTGTGGTATTTTGTT
【0040】
本発明の実施形態に従うと、濃縮(捕捉)実験後の陰性対照配列の減少は、標的配列が濃縮されることの指標となる。濃縮実験における陰性対照配列の減少をモニタリングするための技術は、標的配列または陽性対照配列の濃縮をモニタリングするために用いられる技術と同様であり得る。典型的には、モニタリング技術は、試料の増幅と、その後の増幅された試料の定量を伴う。あるいは、増幅および定量は、同時に行うことができる。同時の増幅および定量のための1つのこのような技術は、定量PCR(qPCR)であり、これはリアルタイムPCRとしても知られている。
【0041】
qPCRプロセスは、通常のPCR技術を用いる、DNA試料における1つまたは複数の特定の配列の増幅を伴う。PCR産物は、反応混合物内に含まれるプローブ(典型的には、蛍光プローブ)を用いて、リアルタイムで定量される。蛍光プローブは、二本鎖DNA生成物の量に基づいてシグナルを発して、リアルタイムな定量をもたらす。
【0042】
上記のように、2つのタイプの蛍光プローブが、qPCR産物の定量において一般的に用いられる。第1のタイプは、配列非特異的な様式で二本鎖DNA分子内にインターカレートする非特異的な蛍光染料である。このような蛍光染料の例には、SYBR(登録商標)Green、エチジウムブロマイド、DAPI(49,6−ジアミジノ−2−フェニルインドール)、Hoechst 33342、SYTO(登録商標)−13(ビス−ベンズイミド蛍光染料)、YOYO(登録商標)−1、およびTOTO(登録商標)−1(チアゾールオレンジの二量体)が含まれる。SYTO(登録商標)−13、YOYO(登録商標)−1、およびTOTO(登録商標)−1は、Life Technolodies(Carlsbad、CA)から入手可能である。これらの蛍光プローブは、典型的には、それ自体で蛍光シグナルをほとんど発しないか全く発しない。しかし、それらが二本鎖DNA分子または二本鎖RNA分子内にインターカレートすると、塩基の積み重ねによって疎水性の環境がもたらされ、これによって、これらのプローブが増強した蛍光を有することが可能になる。これらの染料は配列非特異的な様式で二本鎖DNA分子または二本鎖RNA分子内にインターカレートするため、蛍光シグナルの強度は、二本鎖分子内にインターカレートするこれらの染料の量のみを反映する。したがって、このような蛍光染料の存在においてリアルタイムPCRにおいて検出される蛍光シグナルの強度は、二本鎖生成物の量を反映する。
【0043】
DNA生成物の量を推定するためのqPCRにおいて用いられる第2のタイプの蛍光プローブは、配列特異的なDNAプローブである。これらの配列特異的なDNAプローブは、典型的には、蛍光レポーター(フルオロフォア)で標識されたオリゴヌクレオチドである。さらに、これらの配列特異的なDNAプローブはそれぞれ、蛍光レポーターからの蛍光シグナルを抑制する蛍光クエンチャーを含む。クエンチャー分子が蛍光レポーターから切り離されて初めて、蛍光レポーターからのシグナルは実質的に増大する。これらの配列特異的なプローブは、混合物内の標的配列の量の定量に用いることができるため、混合物内に同様に存在する他の配列からの干渉を伴わずに特定の配列の量を推定するために特に有用である。このアプローチは、Applied Biosystems,Inc.(Carlsbad、CA)から入手可能なTaqMan(登録商標)アッセイにおいて用いられる。TaqMan(登録商標)アッセイは、米国特許第5,723,591号において記載されている。
【0044】
DNAライブラリーの迅速な定量のためのqPCRの使用が、最近実証されている(Buehlerら、「Rapid Quantification of DNA Libraries for Next−Generation Sequencing」、Methods、50(2010)、S15〜S18)。この刊行物において示されているように、qPCRによって、DNAライブラリーの正確な定量測定値を得ることができる。さらに、次世代ライブラリーアダプターを含有する断片のみが増幅されるため、qPCRは、このようなライブラリーにおけるDNA濃度の過大評価を最小にし得、すなわち、アダプターを有さないかまたは1つのアダプターを有する断片は増幅されない。
【0045】
DNAライブラリーにおける配列組成のモニタリングにおけるqPCRの有用性は、Daniel Airdら、「Analyzing and Minimizing PCR Amplification Bias in Illumina Sequencing Libraries」、Genome Biology、2011、12−R18によって最近実証された。この出版物において、著者は、DNAライブラリーの増幅において生じるバイアスを調査するためにqPCRを用いた。様々な要因(GC含有量を含む)は、PCR反応の効率に影響し得、異なるPCR機およびPCRプロトコルもまた、増幅されたライブラリーにおける配列のバイアスを生じさせ得る。バイアスを評価するために、著者は、増幅前後の様々な配列を定量するためにqPCRを用いて、配列が異なると濃縮される程度が異なるかどうかを観察した。このモニタリング技術を用いて、著者は、PCR増幅におけるバイアスを最小にするPCRプロトコルを設計することができた。この研究は、DNAライブラリーの配列組成分析におけるqPCRの有用性を立証するものである。
【0046】
本発明の実施形態に従うと、qPCRは、市販されている機器および販売者によって提供される標準的なプロトコルを用いて行うことができる。市販されているqPCR機器の例は、Agilent(Strategene)Mx3005P QPCR Systemである。このシステムは、Brilliant II SYBR(登録商標)Green QPCR Master MixまたはBrilliant III Ultra−Fast SYBR(登録商標)Green Master Mixを用い得る。Brilliant IIを用いるためのサイクル条件は、例えば、以下の通りであり得る。95℃で10分間の活性化、95℃で30秒、60℃で60秒を40サイクル、および70から95℃への融解曲線。Brilliant III Ultra−Fastのためのサイクル条件は、例えば、以下の通りであり得る。95/98℃で3分間の活性化、95/98℃で10秒、60℃で20秒、72℃で20秒を40サイクル、および72から98℃への融解曲線。
【0047】
SYBR(登録商標)Greenに基づくアッセイは、非特異的であり、全ての二本鎖DNA分子または二本鎖RNA分子を定量するために用いることができる。特異的配列の定量が必要である場合、TaqMan(登録商標)アッセイを用いることができる。TaqMan(登録商標)アッセイは、配列を増幅するために2つのプライマーを用い、蛍光シグナルを生じさせるために標的配列に特異的なプローブを用いる。各プローブは、フルオロフォアおよび蛍光クエンチャーを含む。蛍光クエンチャーは、フルオロフォアがシグナルを発することを妨げる。プローブが標的配列鋳型に結合すると、ポリメラーゼのエキソヌクレアーゼ活性は、一部をプローブから切断し、フルオロフォアを蛍光クエンチャーから分離させる。その結果、フルオロフォアからの蛍光シグナルは検出可能となる。当業者には、目的に応じて、非特異的なqPCRアッセイ(例えば、SYBR(登録商標)Greenに基づく方法)または配列特異的なqPCRアッセイ(例えば、TaqMan(登録商標)アッセイ)のいずれかが本発明の実施形態と共に用いられ得ることが理解されよう。さらに、他の類似のqPCR定量方法もまた、本発明の範囲から逸脱することなく用いることができる。
【0048】
例えば、メカニズムに基づくqPCR定量方法もまた、用いることができる。メカニズムに基づくqPCR方法は、定量のために標準曲線を必要としない。メカニズムに基づくqPCR方法、例えばPCRの二パラメータ質量作用動力学モデル(MAK2)は、標準曲線方法に等しい、またはさらに良い定量性能を有することが示されている。これらのメカニズムに基づく方法は、元の試料濃度を推定するために、ポリメラーゼ増幅プロセスについての知識を用いる。Boggy G.J.、Woolf P.J.(2010)、「A Mechanistic Model of PCR for Accurate Quantification of Quantitative PCR Data」、PLoS ONE 5(8):e12355.doi:10.1371/journal.pone.0012355を参照されたい。
【0049】
DNA分子またはRNA分子の定量は、本明細書において記載される実施例においてqPCRと共に示されているが、当業者には、これらの分子を定量するための他の技術もまた、本発明の範囲から逸脱することなく用いることができることが理解されよう。例えば、Agilent 2100 Bioanalyzer(登録商標)は、有用な代用品である。
【0050】
Agilent 2100 Bioanalyzer(商標)でHigh Sensitivity DNAキットを用いる、濃縮されたライブラリーの定量を、製造者の指示に従って行うことができる(Agilent Technologies,Inc.、Santa Clara、CAのウェブサイトから入手可能な「Agilent High Sensitivity DNA kit Guide」)。例えば、試験試料は、1:50および1:100に希釈され得、1μlを、サイズ決定および定量のためのDNAマーカーとともに、プライムされたチップ上でランされた。濃度は、Bioanalyzer(商標)ソフトウェアを用いて、160から400bpの断片サイズで決定することができる。データは、希釈について補正され、平均され得る。
【0051】
DNA濃度を定量するためにqPCR技術を用いる場合、標準曲線が必要である。標準曲線を作成するために、典型的には、一連の増幅は、既知の濃度の配列を用いて行われる。増幅産物が検出可能となる(例えば、閾値レベルを超える)ために必要なPCRサイクルの数は、閾値サイクル(Ct)と呼ばれ、これは、配列の最初の濃度に対して反比例する。したがって、最初の濃度の対数に対する閾値サイクル(Ct)のプロットは、線形関係を示す。
【0052】
図4は、3つの試験配列、644、1219、およびAluJoについての標準曲線の例を示す。図4に示される例において、3つの配列全ては、最初のコピー数(102から105のコピー)と閾値サイクル(Ct)との間の良好な線形の相関を示す。このような標準曲線があれば、閾値サイクル数(Ct)が分かっていれば、特定の配列についての最初のコピー数を推定することができる。
【0053】
図4はまた、AluJo配列がqPCR定量に対してさらに敏感であり、他の2つの試験配列(644および1219)よりも約5サイクル早く検出され得ることを示し、このことは、AluJoの検出感度が他の2つの配列よりも約32倍優れていることを示唆する。AluJo配列のより優れた感度は、反復配列の固有の配列含有量および/またはさらに良好なプライマー/プローブ設計の結果生じ得る。陰性対照配列のより優れた検出感度は、本発明の実施形態と共に用いるために望ましい。
【0054】
本発明の実施形態の有用性を説明するために、SINE配列を一連の濃縮実験における陰性対照配列として用いている。図5は、このような実験の結果である。濃縮(捕捉)プロセスの前に、SINEおよび5つの陽性対照配列(77、296、62、644、および1219)のコピー数は、標準曲線に基づいてほぼ同じに、すなわち、それぞれ1×103から1×104コピーの間に調節される。
【0055】
図5において示されるように、捕捉の後、陽性対照配列のコピー数は全て、それぞれ約1×106および1×107コピーに増大するが、陰性対照配列(SINE)は、約1×101および1×102コピーに低減する。すなわち、全ての陽性対照配列は、約103倍濃縮されるが、陰性対照配列は、約102倍低減する。したがって、捕捉の後に、SINE陰性対照配列と比較して約104〜105倍多い陽性対照配列が存在する。これらの結果は、陽性対照配列の濃縮が良好に機能すること、および陰性対照配列が実際に減少することを明らかに示す。配列分析はまた、オンターゲットのパーセンテージ(すなわち、捕捉後のライブラリーにおける標的配列のパーセンテージ)が約55%〜60%の範囲であることを明らかにする。
【0056】
上記のように、qPCRはまた、目的の配列を定量するために用いることができる。定量が望ましい場合、ならびに異なるライブラリーおよび/または機械の間の差異が関心事である場合には、アッセイに内部標準を含めることができる。例えば、図6Aおよび図6Bは、AluJo配列を陰性対照配列として用いて様々なライブラリーからの5つの陽性対照配列(すなわち、77、644、62、296、および1219)の濃縮をモニタリングする実験の結果を示す。図6Aは、濃縮前のライブラリーにおける様々な配列の相対量を示す。捕捉前のライブラリーにおいて、陽性対照配列および陰性対照配列は、ほぼ同じ量(約1×102〜1×103)で存在する。
【0057】
図6Bは、濃縮後の、ライブラリーにおける相対量の結果を示す。捕捉後のライブラリーにおいて、陽性対照配列の含有量は約1×103まで増大するが、陰性対照配列の含有量は、約1×101〜1×102まで低減する。捕捉前および捕捉後の存在量の間の比較は、陽性対照配列が有意に濃縮されることを明らかに示す。陰性対照配列に対する陽性対照配列の比率を基準として用いれば、濃縮は特に明らかである。
【0058】
図6Aおよび図6Bにおいて示される実験はまた、単一のAluJo陰性対照配列が様々なライブラリーと共に用いられ得ることを示し、このことは、本方法の広範な適用性を説明する。言い換えると、新たなライブラリーを用いる場合に、陰性対照配列を再設計する必要がない。
【0059】
本発明の実施形態に従った捕捉プロセスをモニタリングするための様々な条件を調べるために、5つのSureSelect(商標)ベイト(62、77、296、644、および1219)を陽性対照配列として用いAluJo配列を陰性対照配列として用いる一連の実験を、異なる条件下で、例えば、異なるハイブリダイゼーション条件、洗浄条件、および/または溶出条件の下で行う。これらの条件を、以下の表に示す。
【0060】
【表1】
【0061】
図7Aは、様々な捕捉実験についての濃縮の倍率のデータを示す。示されるデータは、5つの陽性対照標的全ての平均値である。様々な配列のオンターゲットのパーセンテージもまた示されている。捕捉されたプールにおける標的配列の量(%表示)であるオンターゲット%は、特定のベイト設計、用いられるベイトの量、捕捉条件(例えば、ハイブリダイゼーションの温度および時間)、洗浄条件(例えば、洗浄緩衝液、温度、および回数)、および溶出条件(例えば、溶出緩衝液および温度)で変化する。
【0062】
Cap#13(50×ベイト)とCap#17(200×ベイト)との間の比較によって、ベイトが増えても濃縮の倍率が増大しないことが明らかになる。しかし、ベイトが増えると、オンターゲット%が有意に向上する。Cap#41(48時間)とCap#45(4時間)とCap#49(2時間)との間の比較によって、ハイブリダイゼーション時間が長くなると濃縮の倍率およびオンターゲット%の両方が向上することが明らかになり、このことは、アニーリングが緩やかなプロセスであることを示唆する。
【0063】
図7Bは、陰性対照(AluJo)配列に対する5つの対照標的の平均値の比率に基づく濃縮の倍率のデータを示す。陽性/陰性の比率を見ると、濃縮の倍率がさらに大きいことは明らかである。例えば、図7Aにおいて、陽性配列での濃縮の倍率は約102から約103の範囲であるが、図7Bにおける濃縮の倍率は約103から約105である。したがって、比率は、濃縮のさらに敏感な測定をもたらす。
【0064】
図8は、本発明の1つの実施形態に従った方法800を説明するフローチャートを示す。この方法に従うと、そのうちの1つまたは複数の標的配列が濃縮されるライブラリーに、陰性対照配列を場合によって加えることができる(ステップ801)。しかし、ほとんどのケースにおいて、ライブラリー内に既に存在する1つまたは複数の反復配列(すなわち、内在性配列)を陰性対照配列として用いることができる。したがって、ステップ801は、ほとんどのケースでは不必要である。しかし、既に陰性対照配列ならびにそのプライマーおよびプローブが手の内にある場合には、このような外因性の陰性対照配列を用いることがさらに都合が良いか、または有利であり得る(例えば、濃度を制御することができる)。上記のように、本発明の実施形態と共に用いるための陰性配列は、好ましくは、SINEファミリーまたはLINEファミリーにおける反復エレメントから選択される。内在性であっても添加されたものであっても、DNAライブラリー内の陰性対照配列の量が不明の場合には、捕捉前ライブラリーにおける陰性対照配列の捕捉前の量を決定する(ステップ802)。この量の決定は、上記のqPCRで、またはあらゆる他の適切な方法で行うことができる。捕捉前ライブラリーに加えられた陰性対照配列の量が分かっている場合には、ステップ802を飛ばすことができる。このケースでは、陰性対照配列の量を「決定すること」は、このような情報を「得ること」を意味することが意図される。
【0065】
次に、(1つまたは複数の)標的配列の捕捉または濃縮を行う(ステップ803)。捕捉または濃縮は、市販されているシステムのいずれかを用いて、かつ製造者の手順に従って行うことができる。例えば、Illumina,Inc.のIllumina機器と組み合わせた、Agilent TechnologiesのSureSelect(商標)システム。
【0066】
捕捉の後、捕捉後ライブラリーにおける陰性対照配列の量が決定される(ステップ804)。ここでも、この量の決定は、qPCRまたはあらゆる他の適切な方法を用いることができる。
【0067】
最後に、捕捉(濃縮)効率が、陰性対照配列の捕捉前の量および捕捉後の量から決定され得る(ステップ805)。効率は、陰性対照配列の減少の程度に基づいて推定または決定され得る。
【0068】
例えば、上記のScripps Instituteとの共同実験では、SINEの含有量が12.6%から4.1%に低下することが見出された。これらの数は、この特定の実験についての濃縮の効率のおおまかな指標を提供するために用いることができる。陰性対照配列のみの捕捉前の量および捕捉後の量(すなわち、約3倍(12.6/4.1≒3.1))から推定される数は、濃縮の実際の効率の推計未満である可能性が最も高い。例えば、図6Aおよび図6Bにおける陰性対照配列の比較に基づいて、陰性対照配列の1×101〜1×102倍の低減の指標が得られる。しかし、陽性対照配列は、1×102〜1×103倍の濃縮を示す。この方法が濃縮の倍率の正確な量的推計をもたらさない場合があっても、この推計は少なくとも、濃縮が成功したかどうかの指標を提供する。
【0069】
濃縮の効率のさらに正確な推計を得るために、図9において示される方法900において説明されるように、1つまたは複数の陽性対照配列を含めるべきである。図9において示されるように、場合によって、1つもしくは複数の陰性対照配列および/または1つもしくは複数の陽性対照配列をDNAライブラリーに加えることができる(ステップ901)。ここでも、場合によって、1つもしくは複数の陰性対照配列を加えることができるか、または内在性反復配列を陰性対照として用いることができる。同様に、陽性対照配列は内在性であり得、すなわち、配列は、標的ライブラリー内に元々存在する。いくつかのケースにおいて、外因性の陽性対照配列を加えることが有利であり得る(例えば、既知の濃度)。陰性対照配列および陽性対照配列の量が不明の場合には、濃縮の前にこれらの捕捉前の量を決定する(ステップ902)。陰性対照配列および陽性対照配列の量が分かっているか、または両配列が同じ(またはほぼ同じ)量で加えられる場合には、ステップ902を飛ばすことができる。このケースでは、陰性対照配列および陽性対照配列の量を「決定すること」は、このような情報を「得ること」を意味することが意図される。決定は、qPCRまたはあらゆる他の適切な方法で行うことができる。
【0070】
次に、所望の標的配列の濃縮は、1つまたは複数のベイト配列を用いて行われる(ステップ903)。ここでも、濃縮は、あらゆる市販されているシステムおよび機器を用いて行うことができる。
【0071】
濃縮の後、陰性対照配列および陽性対照配列の量が決定される(ステップ904)。最後に、濃縮の効率が、陰性対照配列および陽性対照配列の捕捉前の量および捕捉後の量に基づいて決定される(ステップ905)。
【0072】
捕捉前の量および捕捉後の量に基づいて濃縮効率を決定するために、いくつかのアプローチが存在する。まず、陰性対照および陽性対照の量がほぼ同じ量でステップ901において加えられる場合、陰性配列および陽性配列の捕捉後の量のみを用いて効率を推定することができる。具体的には、陰性対照配列の捕捉後の量に対する陽性対照配列の捕捉後の量の比率が、濃縮効率の良好な指標を提供する。このアプローチの1つの例を図7Bに示す。
【0073】
別のアプローチ(陰性対照配列および陽性対照配列の捕捉前の量が(ほぼ)同じでない場合に有用な)において、陰性対照配列の捕捉前の量に対する陽性対照配列の捕捉前の量の第1の比率および陰性対照配列の捕捉後の量に対する陽性対照配列の捕捉後の量の第2の比率を導き出すことができる。次に、第1の比率および第2の比率の比較によって、濃縮の効率の推計が得られる。
【0074】
<ライブラリーの調製>
本発明の実施形態と共に用いられるライブラリーは、市販されているライブラリーであり得るか、または実験室において調製され得る。DNAライブラリーの調製は、ペアエンドシークエンシングのための標準的なプロトコルに従って、様々な販売者(例えば、Illumina,Inc.)から入手可能な市販のキットを用いることができる(例えば、Illumina,Inc.、San Diego、CA.から入手可能な「Paired−End Sequencing Sample Preparation Guide」)。例えば、ゲノムDNA(Coriell、3μg)を適切なサイズ(例えば、200〜500bp)に断片化することができる(例えば、せん断、噴霧化、または超音波処理によって)。例えば、せん断は、Covaris E210機器を用いて中央断片サイズ(例えば、200〜250bp)まで実施することができる。これらの断片の末端は、フィルイン反応およびエキソヌクレアーゼ活性の組み合わせで修復されて、平滑末端となる。次に、3’非鋳型A’を平滑末端に付加する。その後、ペアエンドアダプターをDNA断片にライゲーションする。Illumina(登録商標)システムのための5’末端アダプターおよび3’末端アダプターを以下に示す。このように調製されたライブラリーに、アガロースゲル(例えば、4%Nusieve(登録商標)3:1アガロースゲル)上でサイズ選択を施し、QiaQuick(登録商標)ゲル抽出を用いて精製することができる。次に、ライブラリーを数サイクル(例えば、6〜8サイクル)のPCRによって増幅することができる。
【0075】
Illuminaアダプター:
P5:AATGATACGGCGACCACCGA 配列番号14
P7:CAAGCAGAAGACGGCATACGA 配列番号15
【0076】
<標的配列の濃縮>
本発明の実施形態に従うと、当技術分野において知られているあらゆる濃縮システムを用いることができる。標的配列の濃縮のために、Illumina,Inc.のIllumina(登録商標)システムおよびAgilentのSureSelect(商標)システムなどの、いくつかの機器が販売者から入手可能である。本発明の実施形態は、いかなる特定の手順または機器によっても限定されない。Agilent SureSelect(商標)Target Enrichment Systemは、ユーザー定義のゲノムサブセットの特異的な濃縮を提供する(Gnirkeら、Nat.Biotechnol.27、(2009)、182〜189頁を参照されたい)。この方法は、図1において説明されるように、ゲノムDNAライブラリーの、特別注文のビオチン化されたRNAプローブ(典型的には、120merのRNAプローブ)に対するハイブリダイゼーション、およびその後の磁気ビーズへの固定に基づくものであり、その後、洗浄ステップおよび溶出ステップがある。このプロセスは、ヒトX染色体、全てのヒトエキソン、または4番染色体上の領域に特異的な異なるRNA捕捉プローブセットを用いる、いくつかのライブラリーの濃縮において検証されている。捕捉されたDNA断片の溶出の後、ライブラリーは、SureSelect(商標)Illumina(登録商標)特異的なプライマー(配列番号14および配列番号15)を用いて、数サイクル(例えば、12〜14サイクル)のPCR分、再増幅され得る。増幅によって、シークエンシングの前に、Bioanalyzer High SensitivityチップまたはqPCRを用いる正確な定量が可能になる。
【0077】
本発明の実施形態の利点には、以下の1つまたは複数が含まれ得る。陰性対照を用いる本発明の実施形態は、全体的に適用可能である。特異的な陰性対照は不必要である。その代わりに、ほとんどのゲノムにおいて通常見られる反復配列を、陰性対照として用いることができる。逆に、1つのライブラリーのために特異的に設計される陰性対照は、異なるプローブライブラリーに用いることができない。このような特異的な「陰性対照」エレメントはプローブライブラリーから除去されるため、陰性対照が新たなライブラリー内に存在する可能性は低い。したがって、そのたびに、新たな陰性対照を設計する必要がある。
【0078】
本発明の実施形態はまた、陰性対照に対する陽性対照の比率を提供するために用いることができる。上記に示されるように、このような比率は、濃縮後の試料のみを用いて濃縮を推定するために用いることができる。濃縮前の試料は必要ではないため、このような濃縮実験における時間およびコストを節約することができる。
【0079】
本発明は限られた数の実施形態に関して記載されてきたが、本開示の利益を享受する当業者には、本明細書において開示される本発明の範囲から逸脱しない他の実施形態が考え出され得ることが理解されよう。したがって、本発明の範囲は、添付の特許請求の範囲によってのみ限定されるべきである。
【技術分野】
【0001】
本発明は、DNAライブラリー組成物の分析の分野に、特に、DNAライブラリーにおける配列の相対的存在量の変化を分析するための方法に関するものである。
【背景技術】
【0002】
ゲノムをシークエンシングするためのさらに効率的な技術の必要性によって、次世代ゲノムシークエンシング技術が開発されてきた。これらの次世代シークエンシング技術によって、ゲノムをシークエンシングする方法は激変したが、これらの技術には弱点がある。例えば、これらの技術は、ゲノムの特定の領域を容易に標的にすることができない。
【0003】
ゲノムの特定の領域をシークエンシングできることには、多くの用途に適用できる。例えば、一部の疾患は、わずか数個のヌクレオチドの突然変異から生じる。これらのわずかな突然変異を同定するためにヒトゲノム全体をシークエンシングすることは非効率的であろう。同様に、多くの複雑な疾患は、疾患のリスクに関連する1つの単一ヌクレオチド多型(SNP)またはSNPの組み合わせを伴う。ゲノムにおけるこのようなSNPの同定は、一塩基の変化を発見したり、全ての配列変異体を同定したりするために、罹患した個体のゲノムDNAの広範な領域(典型的には、100キロベース超)をシークエンシングすることを伴うため、困難な課題である。
【0004】
このような課題を容易にするために、分析またはシークエンシングの前に目的の配列についてライブラリーを濃縮することを伴う、さらに新たなアプローチが開発されている。濃縮の後、目的の配列のサブセットは、さらに効率的にシークエンシングされ得る。濃縮システムは、典型的には、目的の領域を囲む配列を含むオリゴヌクレオチドプローブを、DNAライブラリーから目的のDNA断片を捕獲するためのベイトとして用いる。これらのオリゴヌクレオチドプローブは、ハイブリダイズした配列をライブラリーから単離することを容易にし得る修飾を含むことが多い。
【0005】
このような濃縮システムの例は、Agilent Technologies,Inc.(Santa Clara、CA)から入手可能なSureSelect(商標)システムである。SureSelect(商標)システムは、目的の配列を濃縮するために、ビオチン−アビジンに基づく選択技術を用いる。このシステムは、シークエンシングの作業フローの費用およびプロセスの効率を大幅に向上させ得る。
【0006】
図1は、SureSelect(商標)を用いる、ライブラリーから目的のDNA配列を濃縮するプロセスを説明する略図を示す。図1において示されるように、ゲノムライブラリー試料は、配列断片をアダプター内にクローニングすることによって調製される。このライブラリーは、次に、ビオチン化されたRNAベイト(すなわち、ビオチンタグを有するRNAオリゴヌクレオチド)でプローブされる。ハイブリダイゼーションの後、ビオチン化されたベイトに結合した配列は、ストレプトアビジンで被覆された磁気ビーズを用いて、混合物から分離される。ビーズは(結合した配列とともに)洗浄され、次に、濃縮された標的配列が一本鎖DNA配列として放出されるように、RNA配列は消化される。目的のDNA配列は、次いで、PCRを用いて増幅されて、さらなる分析またはシークエンシングのための、濃縮された配列を生産することができる。この濃縮方法によって、比較的容易に目的の配列に焦点を当てることが可能になる。
【0007】
類似のアプローチが、米国特許出願公開第20110184161号において最近開示されている。この出願において開示される方法によると、断片化され変性したゲノム核酸分子を含有する試料が、ハイブリダイズ条件下で、基質上に固定されたオリゴヌクレオチドプローブに曝露される。固定されたプローブにハイブリダイズする目的の核酸分子は、次に、他の配列から分離され、結合したDNA断片は基質から溶出されて、濃縮されたライブラリーが作製できる。
【0008】
このような濃縮アプローチでは、濃縮されたライブラリーをシークエンシングする努力を費やす前に、標的配列が実際に濃縮されているか(およびどの程度濃縮されているか)を確認できることが望ましい。したがって、濃縮のモニタリングを可能にするために、陽性対照配列およびベイトが濃縮プロセスに含まれることが多い。濃縮の量的推計が望ましい場合、内部標準配列もまた含まれ得る。濃縮サイクルの後、または濃縮の推計が望ましい場合、濃縮されたライブラリーのアリコートを取り出し、典型的には定量PCR(qPCR)などの増幅技術を用いて分析することができる。
【0009】
標的にされたDNA分子を増幅し、同時に定量するために、定量PCR(qPCR)(またはリアルタイムPCR)を用いることができる。このプロセスは、DNA試料における1つまたは複数の特定の配列を増幅するためのPCRを伴う。同時に、リアルタイムでの定量をもたらすように、プローブ(典型的には、蛍光プローブ)が反応混合物内に含まれる。リアルタイムPCR産物を定量するための、2つの一般的に用いられる蛍光プローブは、(1)配列非特異的な様式で二本鎖DNA分子内にインターカレートする非配列特異的蛍光染料(例えば、SYBR(登録商標)Green)、および(2)DNA標的とのハイブリダイゼーションの後になって初めて、またはPCR産物内への組み込みの後に検出を可能にする配列特異的なDNAプローブ(例えば、蛍光レポーターで標識されたオリゴヌクレオチド)である。
【0010】
蛍光レポーターの例には、別の基によって消光される1つのフルオロフォアを有するプローブが含まれ得る。プローブが増幅配列内に組み込まれると、フルオロフォア分子または蛍光クエンチャー分子は切断され、それによって、フルオロフォアが発光することが可能になる。このアプローチの例は、米国特許第5,723,591号において記載されているようなTaqMan(登録商標)アッセイである。TaqMan(登録商標)アッセイは、中央のプローブオリゴヌクレオチドに隣接する2つのPCRプライマーを用いる。プローブオリゴヌクレオチドは、フルオロフォアおよびクエンチャーを含有する。PCRプロセスにおける重合ステップの間、ポリメラーゼはプローブオリゴヌクレオチドを切断する。この切断によって、フルオロフォアおよびクエンチャーは物理的に分離され、これによって、蛍光の発光が変化する。生産されるPCR産物が多いほど、蛍光シグナルの強度は増大する。
【発明の概要】
【0011】
これらの先行技術では、さらに高い信頼性でDNAライブラリーの濃縮をモニタリングすることができる。しかし、濃縮プロセスのモニタリングに用いることができる方法の必要性は依然として存在する。
【0012】
本発明の1つの態様は、DNAライブラリーからの標的濃縮の効率を決定するための方法に関する。本発明の1つの実施形態に従った方法は、陰性対照配列および/もしくは陽性対照配列をDNAライブラリーに加える、または、陰性対照配列および/もしくは陽性対照配列をDNAライブラリーから選ぶステップと、DNAライブラリーにおける陰性対照配列の捕捉前の量および陽性対照配列の捕捉前の量を決定するステップと、捕捉後ライブラリーを作製するために少なくとも1つのベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップと、捕捉後ライブラリーにおける陰性対照配列の捕捉後の量および陽性対照配列の捕捉後の量を決定するステップと、陰性対照配列の捕捉後の量に対する陽性対照配列の捕捉後の量の比率に基づいて、または(i)陽性対照配列の捕捉前の量および陰性対照配列の捕捉前の量の第1の比率と(ii)陽性対照配列の捕捉後の量および陰性対照配列の捕捉後の量の第2の比率との比較に基づいて、標的濃縮の効率を決定するステップとを含む。
【0013】
本発明の別の態様は、DNAライブラリーからの標的濃縮の効率を決定するための方法に関する。本発明の1つの実施形態に従った方法は、陰性対照配列をDNAライブラリーに加える、または陰性対照配列をDNAライブラリーから選ぶステップと、DNAライブラリーにおける陰性対照配列の捕捉前の量を決定するステップと、捕捉後ライブラリーを作製するために少なくとも1つのベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップと、捕捉後ライブラリーにおける陰性対照配列の捕捉後の量を決定するステップと、陰性対照配列の捕捉前の量と陰性対照配列の捕捉後の量とを比較することによって標的濃縮の効率を決定するステップとを含む。
【0014】
本発明の他の態様および利点は、以下の記載および添付の特許請求の範囲から明らかとなろう。
【図面の簡単な説明】
【0015】
【図1】Agilent TechnologiesのSureSelect(商標)システムを用いる標的濃縮のプロセスを説明する略図を示す図である。
【図2】本発明の1つの実施形態に従ったAluJo配列の増幅および定量のための、AluJoの配列ならびにプライマーおよびプローブを示す図である。
【図3】本発明の1つの実施形態に従ったL1MEe配列の増幅および定量のための、L1MEeの配列ならびにプライマーおよびプローブを示す図である。
【図4】本発明の1つの実施形態に従ったqPCRアッセイのための標準曲線のグラフを示す図である。
【図5】本発明の1つの実施形態に従った捕捉実験前後の様々な陽性対照配列およびSINE陰性対照配列の量を示す図である。
【図6A】様々なライブラリーを用いる捕捉実験前の5つの陽性対照配列および1つの陰性対照配列(AluJo)の量を示す図である。
【図6B】本発明の1つの実施形態に従った捕捉実験後のこれらの配列の量を示す図である。
【図7A】様々な条件下での捕捉実験前の5つの陽性対照配列および1つの陰性対照配列(AluJo)の量を示す図である。
【図7B】本発明の1つの実施形態に従った捕捉実験後のこれらの配列の量を示す図である。
【図8】本発明の1つの実施形態に従った方法を説明するフローチャートを示す図である。
【図9】本発明の1つの実施形態に従った方法を説明するフローチャートを示す図である。
【発明を実施するための形態】
【0016】
本発明の実施形態は、DNAライブラリーからの目的の配列の濃縮をモニタリングするための方法に関する。上記のように、DNAライブラリーから目的の配列を濃縮するプロセスにおいて、陽性対照を含めることによって、濃縮の進行をモニタリングすることが可能になることが示されている。本発明の方法は、陰性対照配列を用いることによって、濃縮のモニタリングにおけるさらなる向上を提供する。本発明の方法は、陰性対照配列を単独で、または陽性対照配列と組み合わせて用い得る。本発明の実施形態は、特に陽性対照配列と共に用いると、予想外の利点をもたらす。さらに、本発明の方法は、特定のライブラリーのために設計されたものではなく、したがって、標的ライブラリーに関わらず一般的な適用性を有する。
【0017】
本明細書において用いられる場合、「陰性対照配列」は、DNAライブラリーからの標的配列の濃縮において陰性対照として用いるための、選択された配列を有するオリゴヌクレオチドを言う。以下に記載されるように、陰性対照配列は、好ましくは、SINEファミリーまたはLINEファミリーに属する反復エレメントである。
【0018】
「陽性対照配列」は、DNAライブラリーからの標的配列の濃縮において陽性対照として用いるための選択された配列を有するオリゴヌクレオチドを言う。陽性対照配列は、DNAライブラリーにおいて見られる配列、またはDNAライブラリー内に添加された外因性の配列であり得る。
【0019】
本明細書において用いられる場合、「ベイト配列」は、ライブラリーから目的の配列(標的配列)を濃縮する(捕捉する)ために選択された配列を有するオリゴヌクレオチドである。ベイト配列は、DNAオリゴヌクレオチド、RNAオリゴヌクレオチド(例えば、SureSelect(商標)システムのためのベイト)、またはDNA/RNAオリゴヌクレオチドの組み合わせであり得る。ベイト配列と結合した配列の単離を容易にするために、ベイト配列は、親和性リガンド(例えば、ビオチン)と連結していてもよい。あるいは、ベイト配列は、固体担体に付着していてもよい。典型的には、濃縮実験において、目的の配列(標的配列)の周囲に1つまたは複数のベイト配列が設計される。ベイト配列は、標的配列とハイブリダイズする。ハイブリダイゼーションの後、ベイト配列は、結合した標的配列と共に、混合物から単離される。
【0020】
DNAライブラリーは、典型的には、多くのゲノムDNA断片を含む。本明細書において用いられる場合、「DNAライブラリー」は、増幅およびシークエンシングを容易にするためにDNA断片が特異的アダプターによって隣接されている、第二世代ゲノムライブラリーを言う場合がある。
【0021】
「濃縮」または「捕捉」は、1つまたは複数のベイト配列を用いてDNAライブラリーから標的配列を濃縮するプロセスを言う。1つまたは複数のベイト配列を用いることによる標的配列の濃縮後のDNAライブラリーは、「捕捉後ライブラリー」と呼ばれる。捕捉実験前のDNAライブラリーは、「捕捉前ライブラリー」と呼ばれ得る。したがって、配列(例えば、陽性対照配列または陰性対照配列)の量(数量)は、それが捕捉実験の前であるか後であるかに応じて、「捕捉前の量」または「捕捉後の量」と呼ばれ得る。
【0022】
本明細書において用いられる場合、「(1つまたは複数の)LINE」は、真核生物のゲノムにおいて多数見られる遺伝子エレメントの群である「(1つまたは複数の)長鎖散在エレメント」を言う。LINEの5’UTRは、典型的には、RNAポリメラーゼIIのプロモーター配列を含有するが、LINEの3’UTRは、ポリアデニル化シグナル(AATAAA)およびポリA尾部を含有する。したがって、LINEは、5’UTRにあるRNAポリメラーゼIIプロモーターを用いてRNAに転写され得る。LINEは逆転写酵素をコードし、多くのLINEはまたエンドヌクレアーゼ(RNase Hなど)をコードする。逆転写酵素は、他のRNAよりもLINEのRNAに対して高い特異性を有し、そして、新たな部位でゲノム内に組み込まれ得るRNAのDNAコピーを作製し得る。LINEは自律的にコピーし得るため、LINEは、ゲノムを増大し得る。ヒトゲノムは、例えば、約50万個のLINEを含有し、これはゲノムのおよそ17%である。
【0023】
本明細書において用いられる場合、「(1つまたは複数の)SINE」は、tRNA、rRNA、および他の低分子核内RNAなどのRNA分子から逆転写された短いDNA配列(500ベース未満)である「(1つまたは複数の)短鎖散在エレメント」を言う。霊長類における最も一般的なSINEは、Alu配列である。約150万個のコピーで、SINEは、ヒトゲノムの約11%を構成する。これらのうち、100万を超えるコピーが「Alu」エレメントであり、これは、ヒトゲノムの約10.7%を占める。
【0024】
SINEまたはLINEにおける反復配列は、「反復エレメント」と呼ばれ得る。「Alu配列」または「Aluエレメント」は、Alu制限エンドヌクレアーゼの作用によって最初に特徴付けされた短い一続きのDNAを言う。Alu配列は、通常、約300bp長である。Alu配列は、ヒトゲノムにおいて最も豊富な可動性エレメントであり、短鎖散在エレメント(SINE)として分類される。Aluエレメントの典型的な構造は、5’−部分A−A5TACA6−部分B−ポリA尾部−3’であり、式中、「部分A」および「部分B」は、類似の配列であるが、逆方向に配置されている。ポリA尾部の長さは、Aluファミリー間で異なる。Alu配列は、AluJおよびAluSとして知られている2つの主要なサブファミリーならびに多くのサブサブファミリーに分けられた。Alu配列(またはAluエレメント)の具体的な例は、AluJoである。
【0025】
本発明の実施形態に従うと、濃縮プロセスのモニタリングに用いるための「陰性対照配列」は、好ましくは、以下の特性の1つまたは複数を有する。まず、陰性対照配列は、濃縮の標的であってはならない。したがって、陰性対照配列は、濃縮実験において減少する。さらに、これらの陰性対照配列は、好ましくは、ほとんどのライブラリーにおいて見られる。陰性対照がほとんどのライブラリーにおいて見られるならば、このような陰性対照配列を用いる実験設計は、様々な濃縮目的で多くのライブラリーに適用可能となる。したがって、新たなライブラリーを用いる場合に陰性対照を再設計する必要はない。最後に、陰性対照配列は、好ましくは、モニタリングが容易である。
【0026】
これらの基準に基づいて、本発明の発明者らは、ゲノムにおいてしばしば見られる反復配列が、本発明の実施形態と共に用いるための良好な陰性対照配列であることを見出した。このような反復配列の例には、LINE(長鎖散在核内エレメント)、SINE(低分子散在反復エレメント)、および他の類似の配列が含まれ得る。これらの反復配列は、直接反復(例えば、全体的な直接反復、局所的な直接単純反復、局所的な直接反復、スペーサーを伴う局所的な直接反復など)または逆反復(例えば、全体的な逆反復、局所的な逆反復、スペーサーを伴う逆反復、パリンドローム反復など)であり得る。例えば、Usseryら、「Word Frequencies,Repeats,and Repeat−related Structures in Bacterial Genomes」、Computing for Comparative Microbial Genomics:Bioinformatics for Microbiologists、Computational Biology.8(第1版)、Springer、133〜144頁(2008)を参照されたい。これらの反復配列は、それらが生物学的機能を有していようがいまいが、本発明の実施形態に従った陰性対照配列として用いられ得る。
【0027】
これらの反復配列は濃縮実験における目的ではないため、これらは、通常、標的ライブラリーの設計の間に意図的に「マスキング」される。したがって、各標的濃縮実験のために陰性対照を具体的に設計する必要はない。したがって、このような反復配列を陰性対照のモニタリングに用いることは一般的に有用であり得、すなわち、様々なDNAライブラリーに適用可能である。
【0028】
上記のように、Alu反復は、ゲノムにおいて極めて豊富である。例えば、Alu反復についてのBLASTサーチでは、91,000超のヒットがヒト参照ゲノムにおいて得られた。Alu反復の実際の存在量は、約1Mコピー/細胞であると推定される。コピー/ゲノムが多数であることに起因して、このような反復は、ゲノムをシークエンシングする必要なくオンターゲット%と相関し得る、濃縮の敏感な尺度として作用し得る。
【0029】
SINEは、eArray(商標)による(RepeatMaskerアルゴリズムを用いる)ELID設計から自動的に排除されるため、捕捉の陰性対照として用いることができる。eArray(商標)は、SureSelect(商標)捕捉のためのベイトを設計するためのオンラインツールであり、Agilent Technologies,Inc.のウェブサイトから入手可能である。SINEは濃縮の標的ではないため、これらは残される(捕捉されない)はずで、濃縮されたライブラリーは、SINE配列の有意な低減を示すはずである。1つの実験において、Scripps Instituteと共同で、SureSelect(商標)濃縮の後に、SINEの含有量が12.6%から4.1%に低下することが見出された。このことは、ベイトの設計を通じてマスキングされた反復配列が濃縮(捕捉)実験において減少し得ることを裏付けるものである。さらに重要なことに、この結果は、濃縮効率を推定するために陰性対照配列のみを用い得る(すなわち、いかなる陽性対照も用いない)ことを示す。すなわち、陰性対照配列の減少の程度は、標的配列の濃縮の倍率を推定するために用いることができる。
【0030】
さらに、本発明の実施形態に従うと、陰性対照配列として用いられる反復配列(例えば、SINE配列またはLINE配列)は、非特異的な捕捉によって、最終的には、捕捉されたライブラリーとなるため、非特異的なDNAの捕捉の量(すなわち、オフターゲット%)を評価するためにも用いることができる。
【0031】
図2は、SINEでありヒトゲノムにおいて非常に豊富な、陰性対照配列AluJoの例を示す。図2において示されるように、AluJo配列は、311ヌクレオチド長(配列番号1)である。プライマー対(左プライマーおよび右プライマー)およびプローブオリゴヌクレオチド(それぞれ20nt)が、この陰性対照配列のqPCR分析(例えば、TaqMan(登録商標)アッセイ)のために設計される。TaqMan(登録商標)アッセイのためのプライマーおよびプローブの設計は、Applied Biosystems(Carlsbad、CA)のPrimer Express(登録商標)またはMassachusetts Institute of Technologies(Boston、MA)のWhitehead InstituteのPrimer3などの市販されているプログラムを用いて行うことができる。
【0032】
AluJo配列内の2つのプライマーおよびプローブオリゴヌクレオチドの位置を図2に示す。これらのオリゴヌクレオチドの配列は以下に示す通りである。
AluJo:配列番号1
1 AGCTGGGCGTGGTGGCTCACGCCTGTAATCCCAGAACTTTGGGAGGCTGAGACTGGCTGA
61 TTTCTTGAGCCCAGGAGTTTGAGACTAGCCTGGACAACATAGTGAGACCCCATCTTTACA
121 AAAAAATTAAAAAAAATTAGTGGACATGGTGGCATGCACCTCTAGTCCCAGTTACTCAGG
181 AGGCTGAGGTGGGAGGATCACCTGTGCCCAGGCTGAGGCTGCAGTGAGCCATGATCACGC
241 CACTGCACTCCAGCCTGCGTGACAGAGCAAGACCCTGTCTCAAAAGAAAAGAAAAAAAAA
301 GAAGAAAGAAA
左プライマー:GTGGCATGCACCTCTAGTCC 配列番号2
右プライマー:TGAGACAGGGTCTTGCTCTG 配列番号3
プローブ:TACTCAGGAGGCTGAGGTGG 配列番号4
【0033】
図2は、本発明の方法と共に用いるためのSINE陰性対照配列の設計の1つの例を示す。図3は、LINE配列である別の例(すなわち、L1MEe反復)を示す。このL1MEe反復(配列番号5)は、ヒトゲノムにおいて、AluJoほど豊富ではない。それでも、L1MEe反復は、良好な陰性対照配列でもある。L1MEe反復を陰性対照配列として用いるための、左プライマー(配列番号6)、右プライマー(配列番号7)、およびプローブ(配列番号8)の設計が、図3において説明される。これらのオリゴヌクレオチドの配列は以下の通りである。
L1MEe:配列番号5
1 ATGCTATTTACGAGAGAAGCATTTGCAACAAAATGCCAAAGAGAAGGTGAAAATAGCTGG
61 AAAAAAAATGCGCAAAGCAAATAACCAATAGAAAGAAAGCCAAGTTGGGCTAGCAAAATC
121 AGACAAAATAACCTTCGAGGTGCAAACAACTTT
左プライマー:GCGCAAAGCAAATAACCAAT 配列番号6
右プライマー:TGTTTGCACCTCGAAGGTTA 配列番号7
プローブ:TGGGCTAGCAAAATCAGACA 配列番号8
【0034】
図2および図3は、それぞれ、陰性対照配列として用いるためのSINE配列およびLINE配列の例、ならびにそれらのプライマーおよびプローブの設計を示す。当業者には、他の反復配列(LINEまたはSINE)が、本発明の実施形態に従った陰性対照配列として用いるために同様に設計され得ることが理解されよう。以下は、本発明の実施形態に従った陰性対照配列として用いられ得るいくつかのさらなる反復配列の例である。
【0035】
AluSx(Aluファミリー、SINE反復):配列番号9。
GGCTGGATGCAGTGGCTCGTGCCTGTAATCCCAACACTTTGGGAGGCTGA
GGCGGGTGGATCACCTGAGGTCAGGAGTTCGAGACCAGGCTGGCCAACAT
GGCAAAACCCCGCCTCTACTAAAAATACAAAAATTAGCCAGGCATAGTGG
TGCACGCCTGTAATCACAGCTACTCAAGAGGCTGAAGCAGGAGAATTGCT
TGAACTCAGGAGGTGGAGGTGGCAGTGAGCCAAGATCGTGCCACTGCACT
CCAGCCTCAGTGACAGAGCGAGACTCTGTCTCAAAAAATAAATAAATAAA
A
【0036】
AluY(Aluファミリー、SINE反復):配列番号10。
GGCCGGGCGCGGGGGCTCGCGCCTGTCATCCCAGCACTTTGGGAGGCCGA
GGCGGGCGGATCACGAGGTCAGGAGATCGAGACCATCCTGGCTAACACGG
GGAAACCCCGTCTCCACTAAAAATACAAAAAGTTAGCCGGGCGCGGTGGC
GGGCGCCTGCGGTCCCAGCTGCTGGGGAGGCCGAGGCGGGAGCATGGCGG
GAACCGGGAGGCGGAGCCTGCAGTGAGCCGAGATGGCGCCACCGCACTCC
AGCCTGGGCGACCCAGCGAGACTCCGCCTCAAAAAAAAAAAAAGAA
【0037】
L5(LTEファミリー、LINE反復):配列番号11。
TCTCTTTATTTGCTTCTGCTAATTAAAAAATCAGAGCTAAAGATACTTAA
ACACTACAGTTAAAATGCCATGGTTGTCTATTGGCTTAACGAATTCTCTT
ATGAAATCAACTCTAAAATGCTATCCATCATAAATCATGAAACGCAATTT
TTCTTATTCTCTTTAGAGCTTTACAATTCATCTTAAAGACCAGTGTTTAC
ACTCTCTTCTGTAGGTTGTACAATAACTTTTGGCGAGAAAAAATAAAAGT
CTGGCTTTCTGAC
【0038】
MER58A(hAT−Charlieファミリー、DNA反復):配列番号12。
GGAGGTGGTAAATTTGACTCATGGGACAAATCTTTTGTAAATAAAGTTTC
ACTGGAACCCAGTCACACTCATTTGTTTCTGTATTGTCTGTTGACAGTTT
TTATGCTACAATAAGAGTTGAGTAGTTATGACAGACACTCTAGGGCCTGT
AGAGCCTATAATATTTACTTTTGGCCTTTTACGGAAGAAGTTTACTGACC
【0039】
MLT1A(ERVL−MaLRファミリー、LTR反復):配列番号13。
CTCCTCTGTCTTTTCCCACCAAGTGAGGATGCGAAGAGAAGGTGGCTGTC
TGCAAACCAGGAAGAGAGCCCTCACCGGGAACCCGTCCAGCTGCCACCTT
GAACTTGGACTTCCAAGCCTCCAGAACTGTGAGGGATAAATGTATGATTT
TAAAGTCGCCCAGTGTGTGGTATTTTGTT
【0040】
本発明の実施形態に従うと、濃縮(捕捉)実験後の陰性対照配列の減少は、標的配列が濃縮されることの指標となる。濃縮実験における陰性対照配列の減少をモニタリングするための技術は、標的配列または陽性対照配列の濃縮をモニタリングするために用いられる技術と同様であり得る。典型的には、モニタリング技術は、試料の増幅と、その後の増幅された試料の定量を伴う。あるいは、増幅および定量は、同時に行うことができる。同時の増幅および定量のための1つのこのような技術は、定量PCR(qPCR)であり、これはリアルタイムPCRとしても知られている。
【0041】
qPCRプロセスは、通常のPCR技術を用いる、DNA試料における1つまたは複数の特定の配列の増幅を伴う。PCR産物は、反応混合物内に含まれるプローブ(典型的には、蛍光プローブ)を用いて、リアルタイムで定量される。蛍光プローブは、二本鎖DNA生成物の量に基づいてシグナルを発して、リアルタイムな定量をもたらす。
【0042】
上記のように、2つのタイプの蛍光プローブが、qPCR産物の定量において一般的に用いられる。第1のタイプは、配列非特異的な様式で二本鎖DNA分子内にインターカレートする非特異的な蛍光染料である。このような蛍光染料の例には、SYBR(登録商標)Green、エチジウムブロマイド、DAPI(49,6−ジアミジノ−2−フェニルインドール)、Hoechst 33342、SYTO(登録商標)−13(ビス−ベンズイミド蛍光染料)、YOYO(登録商標)−1、およびTOTO(登録商標)−1(チアゾールオレンジの二量体)が含まれる。SYTO(登録商標)−13、YOYO(登録商標)−1、およびTOTO(登録商標)−1は、Life Technolodies(Carlsbad、CA)から入手可能である。これらの蛍光プローブは、典型的には、それ自体で蛍光シグナルをほとんど発しないか全く発しない。しかし、それらが二本鎖DNA分子または二本鎖RNA分子内にインターカレートすると、塩基の積み重ねによって疎水性の環境がもたらされ、これによって、これらのプローブが増強した蛍光を有することが可能になる。これらの染料は配列非特異的な様式で二本鎖DNA分子または二本鎖RNA分子内にインターカレートするため、蛍光シグナルの強度は、二本鎖分子内にインターカレートするこれらの染料の量のみを反映する。したがって、このような蛍光染料の存在においてリアルタイムPCRにおいて検出される蛍光シグナルの強度は、二本鎖生成物の量を反映する。
【0043】
DNA生成物の量を推定するためのqPCRにおいて用いられる第2のタイプの蛍光プローブは、配列特異的なDNAプローブである。これらの配列特異的なDNAプローブは、典型的には、蛍光レポーター(フルオロフォア)で標識されたオリゴヌクレオチドである。さらに、これらの配列特異的なDNAプローブはそれぞれ、蛍光レポーターからの蛍光シグナルを抑制する蛍光クエンチャーを含む。クエンチャー分子が蛍光レポーターから切り離されて初めて、蛍光レポーターからのシグナルは実質的に増大する。これらの配列特異的なプローブは、混合物内の標的配列の量の定量に用いることができるため、混合物内に同様に存在する他の配列からの干渉を伴わずに特定の配列の量を推定するために特に有用である。このアプローチは、Applied Biosystems,Inc.(Carlsbad、CA)から入手可能なTaqMan(登録商標)アッセイにおいて用いられる。TaqMan(登録商標)アッセイは、米国特許第5,723,591号において記載されている。
【0044】
DNAライブラリーの迅速な定量のためのqPCRの使用が、最近実証されている(Buehlerら、「Rapid Quantification of DNA Libraries for Next−Generation Sequencing」、Methods、50(2010)、S15〜S18)。この刊行物において示されているように、qPCRによって、DNAライブラリーの正確な定量測定値を得ることができる。さらに、次世代ライブラリーアダプターを含有する断片のみが増幅されるため、qPCRは、このようなライブラリーにおけるDNA濃度の過大評価を最小にし得、すなわち、アダプターを有さないかまたは1つのアダプターを有する断片は増幅されない。
【0045】
DNAライブラリーにおける配列組成のモニタリングにおけるqPCRの有用性は、Daniel Airdら、「Analyzing and Minimizing PCR Amplification Bias in Illumina Sequencing Libraries」、Genome Biology、2011、12−R18によって最近実証された。この出版物において、著者は、DNAライブラリーの増幅において生じるバイアスを調査するためにqPCRを用いた。様々な要因(GC含有量を含む)は、PCR反応の効率に影響し得、異なるPCR機およびPCRプロトコルもまた、増幅されたライブラリーにおける配列のバイアスを生じさせ得る。バイアスを評価するために、著者は、増幅前後の様々な配列を定量するためにqPCRを用いて、配列が異なると濃縮される程度が異なるかどうかを観察した。このモニタリング技術を用いて、著者は、PCR増幅におけるバイアスを最小にするPCRプロトコルを設計することができた。この研究は、DNAライブラリーの配列組成分析におけるqPCRの有用性を立証するものである。
【0046】
本発明の実施形態に従うと、qPCRは、市販されている機器および販売者によって提供される標準的なプロトコルを用いて行うことができる。市販されているqPCR機器の例は、Agilent(Strategene)Mx3005P QPCR Systemである。このシステムは、Brilliant II SYBR(登録商標)Green QPCR Master MixまたはBrilliant III Ultra−Fast SYBR(登録商標)Green Master Mixを用い得る。Brilliant IIを用いるためのサイクル条件は、例えば、以下の通りであり得る。95℃で10分間の活性化、95℃で30秒、60℃で60秒を40サイクル、および70から95℃への融解曲線。Brilliant III Ultra−Fastのためのサイクル条件は、例えば、以下の通りであり得る。95/98℃で3分間の活性化、95/98℃で10秒、60℃で20秒、72℃で20秒を40サイクル、および72から98℃への融解曲線。
【0047】
SYBR(登録商標)Greenに基づくアッセイは、非特異的であり、全ての二本鎖DNA分子または二本鎖RNA分子を定量するために用いることができる。特異的配列の定量が必要である場合、TaqMan(登録商標)アッセイを用いることができる。TaqMan(登録商標)アッセイは、配列を増幅するために2つのプライマーを用い、蛍光シグナルを生じさせるために標的配列に特異的なプローブを用いる。各プローブは、フルオロフォアおよび蛍光クエンチャーを含む。蛍光クエンチャーは、フルオロフォアがシグナルを発することを妨げる。プローブが標的配列鋳型に結合すると、ポリメラーゼのエキソヌクレアーゼ活性は、一部をプローブから切断し、フルオロフォアを蛍光クエンチャーから分離させる。その結果、フルオロフォアからの蛍光シグナルは検出可能となる。当業者には、目的に応じて、非特異的なqPCRアッセイ(例えば、SYBR(登録商標)Greenに基づく方法)または配列特異的なqPCRアッセイ(例えば、TaqMan(登録商標)アッセイ)のいずれかが本発明の実施形態と共に用いられ得ることが理解されよう。さらに、他の類似のqPCR定量方法もまた、本発明の範囲から逸脱することなく用いることができる。
【0048】
例えば、メカニズムに基づくqPCR定量方法もまた、用いることができる。メカニズムに基づくqPCR方法は、定量のために標準曲線を必要としない。メカニズムに基づくqPCR方法、例えばPCRの二パラメータ質量作用動力学モデル(MAK2)は、標準曲線方法に等しい、またはさらに良い定量性能を有することが示されている。これらのメカニズムに基づく方法は、元の試料濃度を推定するために、ポリメラーゼ増幅プロセスについての知識を用いる。Boggy G.J.、Woolf P.J.(2010)、「A Mechanistic Model of PCR for Accurate Quantification of Quantitative PCR Data」、PLoS ONE 5(8):e12355.doi:10.1371/journal.pone.0012355を参照されたい。
【0049】
DNA分子またはRNA分子の定量は、本明細書において記載される実施例においてqPCRと共に示されているが、当業者には、これらの分子を定量するための他の技術もまた、本発明の範囲から逸脱することなく用いることができることが理解されよう。例えば、Agilent 2100 Bioanalyzer(登録商標)は、有用な代用品である。
【0050】
Agilent 2100 Bioanalyzer(商標)でHigh Sensitivity DNAキットを用いる、濃縮されたライブラリーの定量を、製造者の指示に従って行うことができる(Agilent Technologies,Inc.、Santa Clara、CAのウェブサイトから入手可能な「Agilent High Sensitivity DNA kit Guide」)。例えば、試験試料は、1:50および1:100に希釈され得、1μlを、サイズ決定および定量のためのDNAマーカーとともに、プライムされたチップ上でランされた。濃度は、Bioanalyzer(商標)ソフトウェアを用いて、160から400bpの断片サイズで決定することができる。データは、希釈について補正され、平均され得る。
【0051】
DNA濃度を定量するためにqPCR技術を用いる場合、標準曲線が必要である。標準曲線を作成するために、典型的には、一連の増幅は、既知の濃度の配列を用いて行われる。増幅産物が検出可能となる(例えば、閾値レベルを超える)ために必要なPCRサイクルの数は、閾値サイクル(Ct)と呼ばれ、これは、配列の最初の濃度に対して反比例する。したがって、最初の濃度の対数に対する閾値サイクル(Ct)のプロットは、線形関係を示す。
【0052】
図4は、3つの試験配列、644、1219、およびAluJoについての標準曲線の例を示す。図4に示される例において、3つの配列全ては、最初のコピー数(102から105のコピー)と閾値サイクル(Ct)との間の良好な線形の相関を示す。このような標準曲線があれば、閾値サイクル数(Ct)が分かっていれば、特定の配列についての最初のコピー数を推定することができる。
【0053】
図4はまた、AluJo配列がqPCR定量に対してさらに敏感であり、他の2つの試験配列(644および1219)よりも約5サイクル早く検出され得ることを示し、このことは、AluJoの検出感度が他の2つの配列よりも約32倍優れていることを示唆する。AluJo配列のより優れた感度は、反復配列の固有の配列含有量および/またはさらに良好なプライマー/プローブ設計の結果生じ得る。陰性対照配列のより優れた検出感度は、本発明の実施形態と共に用いるために望ましい。
【0054】
本発明の実施形態の有用性を説明するために、SINE配列を一連の濃縮実験における陰性対照配列として用いている。図5は、このような実験の結果である。濃縮(捕捉)プロセスの前に、SINEおよび5つの陽性対照配列(77、296、62、644、および1219)のコピー数は、標準曲線に基づいてほぼ同じに、すなわち、それぞれ1×103から1×104コピーの間に調節される。
【0055】
図5において示されるように、捕捉の後、陽性対照配列のコピー数は全て、それぞれ約1×106および1×107コピーに増大するが、陰性対照配列(SINE)は、約1×101および1×102コピーに低減する。すなわち、全ての陽性対照配列は、約103倍濃縮されるが、陰性対照配列は、約102倍低減する。したがって、捕捉の後に、SINE陰性対照配列と比較して約104〜105倍多い陽性対照配列が存在する。これらの結果は、陽性対照配列の濃縮が良好に機能すること、および陰性対照配列が実際に減少することを明らかに示す。配列分析はまた、オンターゲットのパーセンテージ(すなわち、捕捉後のライブラリーにおける標的配列のパーセンテージ)が約55%〜60%の範囲であることを明らかにする。
【0056】
上記のように、qPCRはまた、目的の配列を定量するために用いることができる。定量が望ましい場合、ならびに異なるライブラリーおよび/または機械の間の差異が関心事である場合には、アッセイに内部標準を含めることができる。例えば、図6Aおよび図6Bは、AluJo配列を陰性対照配列として用いて様々なライブラリーからの5つの陽性対照配列(すなわち、77、644、62、296、および1219)の濃縮をモニタリングする実験の結果を示す。図6Aは、濃縮前のライブラリーにおける様々な配列の相対量を示す。捕捉前のライブラリーにおいて、陽性対照配列および陰性対照配列は、ほぼ同じ量(約1×102〜1×103)で存在する。
【0057】
図6Bは、濃縮後の、ライブラリーにおける相対量の結果を示す。捕捉後のライブラリーにおいて、陽性対照配列の含有量は約1×103まで増大するが、陰性対照配列の含有量は、約1×101〜1×102まで低減する。捕捉前および捕捉後の存在量の間の比較は、陽性対照配列が有意に濃縮されることを明らかに示す。陰性対照配列に対する陽性対照配列の比率を基準として用いれば、濃縮は特に明らかである。
【0058】
図6Aおよび図6Bにおいて示される実験はまた、単一のAluJo陰性対照配列が様々なライブラリーと共に用いられ得ることを示し、このことは、本方法の広範な適用性を説明する。言い換えると、新たなライブラリーを用いる場合に、陰性対照配列を再設計する必要がない。
【0059】
本発明の実施形態に従った捕捉プロセスをモニタリングするための様々な条件を調べるために、5つのSureSelect(商標)ベイト(62、77、296、644、および1219)を陽性対照配列として用いAluJo配列を陰性対照配列として用いる一連の実験を、異なる条件下で、例えば、異なるハイブリダイゼーション条件、洗浄条件、および/または溶出条件の下で行う。これらの条件を、以下の表に示す。
【0060】
【表1】
【0061】
図7Aは、様々な捕捉実験についての濃縮の倍率のデータを示す。示されるデータは、5つの陽性対照標的全ての平均値である。様々な配列のオンターゲットのパーセンテージもまた示されている。捕捉されたプールにおける標的配列の量(%表示)であるオンターゲット%は、特定のベイト設計、用いられるベイトの量、捕捉条件(例えば、ハイブリダイゼーションの温度および時間)、洗浄条件(例えば、洗浄緩衝液、温度、および回数)、および溶出条件(例えば、溶出緩衝液および温度)で変化する。
【0062】
Cap#13(50×ベイト)とCap#17(200×ベイト)との間の比較によって、ベイトが増えても濃縮の倍率が増大しないことが明らかになる。しかし、ベイトが増えると、オンターゲット%が有意に向上する。Cap#41(48時間)とCap#45(4時間)とCap#49(2時間)との間の比較によって、ハイブリダイゼーション時間が長くなると濃縮の倍率およびオンターゲット%の両方が向上することが明らかになり、このことは、アニーリングが緩やかなプロセスであることを示唆する。
【0063】
図7Bは、陰性対照(AluJo)配列に対する5つの対照標的の平均値の比率に基づく濃縮の倍率のデータを示す。陽性/陰性の比率を見ると、濃縮の倍率がさらに大きいことは明らかである。例えば、図7Aにおいて、陽性配列での濃縮の倍率は約102から約103の範囲であるが、図7Bにおける濃縮の倍率は約103から約105である。したがって、比率は、濃縮のさらに敏感な測定をもたらす。
【0064】
図8は、本発明の1つの実施形態に従った方法800を説明するフローチャートを示す。この方法に従うと、そのうちの1つまたは複数の標的配列が濃縮されるライブラリーに、陰性対照配列を場合によって加えることができる(ステップ801)。しかし、ほとんどのケースにおいて、ライブラリー内に既に存在する1つまたは複数の反復配列(すなわち、内在性配列)を陰性対照配列として用いることができる。したがって、ステップ801は、ほとんどのケースでは不必要である。しかし、既に陰性対照配列ならびにそのプライマーおよびプローブが手の内にある場合には、このような外因性の陰性対照配列を用いることがさらに都合が良いか、または有利であり得る(例えば、濃度を制御することができる)。上記のように、本発明の実施形態と共に用いるための陰性配列は、好ましくは、SINEファミリーまたはLINEファミリーにおける反復エレメントから選択される。内在性であっても添加されたものであっても、DNAライブラリー内の陰性対照配列の量が不明の場合には、捕捉前ライブラリーにおける陰性対照配列の捕捉前の量を決定する(ステップ802)。この量の決定は、上記のqPCRで、またはあらゆる他の適切な方法で行うことができる。捕捉前ライブラリーに加えられた陰性対照配列の量が分かっている場合には、ステップ802を飛ばすことができる。このケースでは、陰性対照配列の量を「決定すること」は、このような情報を「得ること」を意味することが意図される。
【0065】
次に、(1つまたは複数の)標的配列の捕捉または濃縮を行う(ステップ803)。捕捉または濃縮は、市販されているシステムのいずれかを用いて、かつ製造者の手順に従って行うことができる。例えば、Illumina,Inc.のIllumina機器と組み合わせた、Agilent TechnologiesのSureSelect(商標)システム。
【0066】
捕捉の後、捕捉後ライブラリーにおける陰性対照配列の量が決定される(ステップ804)。ここでも、この量の決定は、qPCRまたはあらゆる他の適切な方法を用いることができる。
【0067】
最後に、捕捉(濃縮)効率が、陰性対照配列の捕捉前の量および捕捉後の量から決定され得る(ステップ805)。効率は、陰性対照配列の減少の程度に基づいて推定または決定され得る。
【0068】
例えば、上記のScripps Instituteとの共同実験では、SINEの含有量が12.6%から4.1%に低下することが見出された。これらの数は、この特定の実験についての濃縮の効率のおおまかな指標を提供するために用いることができる。陰性対照配列のみの捕捉前の量および捕捉後の量(すなわち、約3倍(12.6/4.1≒3.1))から推定される数は、濃縮の実際の効率の推計未満である可能性が最も高い。例えば、図6Aおよび図6Bにおける陰性対照配列の比較に基づいて、陰性対照配列の1×101〜1×102倍の低減の指標が得られる。しかし、陽性対照配列は、1×102〜1×103倍の濃縮を示す。この方法が濃縮の倍率の正確な量的推計をもたらさない場合があっても、この推計は少なくとも、濃縮が成功したかどうかの指標を提供する。
【0069】
濃縮の効率のさらに正確な推計を得るために、図9において示される方法900において説明されるように、1つまたは複数の陽性対照配列を含めるべきである。図9において示されるように、場合によって、1つもしくは複数の陰性対照配列および/または1つもしくは複数の陽性対照配列をDNAライブラリーに加えることができる(ステップ901)。ここでも、場合によって、1つもしくは複数の陰性対照配列を加えることができるか、または内在性反復配列を陰性対照として用いることができる。同様に、陽性対照配列は内在性であり得、すなわち、配列は、標的ライブラリー内に元々存在する。いくつかのケースにおいて、外因性の陽性対照配列を加えることが有利であり得る(例えば、既知の濃度)。陰性対照配列および陽性対照配列の量が不明の場合には、濃縮の前にこれらの捕捉前の量を決定する(ステップ902)。陰性対照配列および陽性対照配列の量が分かっているか、または両配列が同じ(またはほぼ同じ)量で加えられる場合には、ステップ902を飛ばすことができる。このケースでは、陰性対照配列および陽性対照配列の量を「決定すること」は、このような情報を「得ること」を意味することが意図される。決定は、qPCRまたはあらゆる他の適切な方法で行うことができる。
【0070】
次に、所望の標的配列の濃縮は、1つまたは複数のベイト配列を用いて行われる(ステップ903)。ここでも、濃縮は、あらゆる市販されているシステムおよび機器を用いて行うことができる。
【0071】
濃縮の後、陰性対照配列および陽性対照配列の量が決定される(ステップ904)。最後に、濃縮の効率が、陰性対照配列および陽性対照配列の捕捉前の量および捕捉後の量に基づいて決定される(ステップ905)。
【0072】
捕捉前の量および捕捉後の量に基づいて濃縮効率を決定するために、いくつかのアプローチが存在する。まず、陰性対照および陽性対照の量がほぼ同じ量でステップ901において加えられる場合、陰性配列および陽性配列の捕捉後の量のみを用いて効率を推定することができる。具体的には、陰性対照配列の捕捉後の量に対する陽性対照配列の捕捉後の量の比率が、濃縮効率の良好な指標を提供する。このアプローチの1つの例を図7Bに示す。
【0073】
別のアプローチ(陰性対照配列および陽性対照配列の捕捉前の量が(ほぼ)同じでない場合に有用な)において、陰性対照配列の捕捉前の量に対する陽性対照配列の捕捉前の量の第1の比率および陰性対照配列の捕捉後の量に対する陽性対照配列の捕捉後の量の第2の比率を導き出すことができる。次に、第1の比率および第2の比率の比較によって、濃縮の効率の推計が得られる。
【0074】
<ライブラリーの調製>
本発明の実施形態と共に用いられるライブラリーは、市販されているライブラリーであり得るか、または実験室において調製され得る。DNAライブラリーの調製は、ペアエンドシークエンシングのための標準的なプロトコルに従って、様々な販売者(例えば、Illumina,Inc.)から入手可能な市販のキットを用いることができる(例えば、Illumina,Inc.、San Diego、CA.から入手可能な「Paired−End Sequencing Sample Preparation Guide」)。例えば、ゲノムDNA(Coriell、3μg)を適切なサイズ(例えば、200〜500bp)に断片化することができる(例えば、せん断、噴霧化、または超音波処理によって)。例えば、せん断は、Covaris E210機器を用いて中央断片サイズ(例えば、200〜250bp)まで実施することができる。これらの断片の末端は、フィルイン反応およびエキソヌクレアーゼ活性の組み合わせで修復されて、平滑末端となる。次に、3’非鋳型A’を平滑末端に付加する。その後、ペアエンドアダプターをDNA断片にライゲーションする。Illumina(登録商標)システムのための5’末端アダプターおよび3’末端アダプターを以下に示す。このように調製されたライブラリーに、アガロースゲル(例えば、4%Nusieve(登録商標)3:1アガロースゲル)上でサイズ選択を施し、QiaQuick(登録商標)ゲル抽出を用いて精製することができる。次に、ライブラリーを数サイクル(例えば、6〜8サイクル)のPCRによって増幅することができる。
【0075】
Illuminaアダプター:
P5:AATGATACGGCGACCACCGA 配列番号14
P7:CAAGCAGAAGACGGCATACGA 配列番号15
【0076】
<標的配列の濃縮>
本発明の実施形態に従うと、当技術分野において知られているあらゆる濃縮システムを用いることができる。標的配列の濃縮のために、Illumina,Inc.のIllumina(登録商標)システムおよびAgilentのSureSelect(商標)システムなどの、いくつかの機器が販売者から入手可能である。本発明の実施形態は、いかなる特定の手順または機器によっても限定されない。Agilent SureSelect(商標)Target Enrichment Systemは、ユーザー定義のゲノムサブセットの特異的な濃縮を提供する(Gnirkeら、Nat.Biotechnol.27、(2009)、182〜189頁を参照されたい)。この方法は、図1において説明されるように、ゲノムDNAライブラリーの、特別注文のビオチン化されたRNAプローブ(典型的には、120merのRNAプローブ)に対するハイブリダイゼーション、およびその後の磁気ビーズへの固定に基づくものであり、その後、洗浄ステップおよび溶出ステップがある。このプロセスは、ヒトX染色体、全てのヒトエキソン、または4番染色体上の領域に特異的な異なるRNA捕捉プローブセットを用いる、いくつかのライブラリーの濃縮において検証されている。捕捉されたDNA断片の溶出の後、ライブラリーは、SureSelect(商標)Illumina(登録商標)特異的なプライマー(配列番号14および配列番号15)を用いて、数サイクル(例えば、12〜14サイクル)のPCR分、再増幅され得る。増幅によって、シークエンシングの前に、Bioanalyzer High SensitivityチップまたはqPCRを用いる正確な定量が可能になる。
【0077】
本発明の実施形態の利点には、以下の1つまたは複数が含まれ得る。陰性対照を用いる本発明の実施形態は、全体的に適用可能である。特異的な陰性対照は不必要である。その代わりに、ほとんどのゲノムにおいて通常見られる反復配列を、陰性対照として用いることができる。逆に、1つのライブラリーのために特異的に設計される陰性対照は、異なるプローブライブラリーに用いることができない。このような特異的な「陰性対照」エレメントはプローブライブラリーから除去されるため、陰性対照が新たなライブラリー内に存在する可能性は低い。したがって、そのたびに、新たな陰性対照を設計する必要がある。
【0078】
本発明の実施形態はまた、陰性対照に対する陽性対照の比率を提供するために用いることができる。上記に示されるように、このような比率は、濃縮後の試料のみを用いて濃縮を推定するために用いることができる。濃縮前の試料は必要ではないため、このような濃縮実験における時間およびコストを節約することができる。
【0079】
本発明は限られた数の実施形態に関して記載されてきたが、本開示の利益を享受する当業者には、本明細書において開示される本発明の範囲から逸脱しない他の実施形態が考え出され得ることが理解されよう。したがって、本発明の範囲は、添付の特許請求の範囲によってのみ限定されるべきである。
【特許請求の範囲】
【請求項1】
DNAライブラリーからの標的濃縮の効率を決定するための方法(900)であって、
陰性対照配列および/もしくは陽性対照配列をDNAライブラリーに加える、または陰性対照配列および/もしくは陽性対照配列をDNAライブラリーから選択するステップ(901)と、
DNAライブラリーにおける陰性対照配列の捕捉前の量および陽性対照配列の捕捉前の量を決定するステップ(902)と、
捕捉後ライブラリーを作製するために、少なくとも1つのベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップ(903)と、
捕捉後ライブラリーにおける陰性対照配列の捕捉後の量および陽性対照配列の捕捉後の量を決定するステップ(904)と、
陰性対照配列の捕捉後の量に対する陽性対照配列の捕捉後の量の比率に基づいて、または
(i)陽性対照配列の捕捉前の量および陰性対照配列の捕捉前の量の第1の比率と(ii)陽性対照配列の捕捉後の量および陰性対照配列の捕捉後の量の第2の比率との比較に基づいて、
標的濃縮の効率を決定するステップ(905)と
を含む方法。
【請求項2】
前記陰性対照配列が、長鎖散在エレメント(LINE)または短鎖散在エレメント(SINE)から選択される反復エレメントである、請求項1に記載の方法。
【請求項3】
前記反復エレメントがAluエレメントである、請求項2に記載の方法。
【請求項4】
前記反復エレメントが、配列番号1の配列を有するAluJoである、請求項3に記載の方法。
【請求項5】
前記反復エレメントが、配列番号5の配列を有するL1MEeである、請求項2に記載の方法。
【請求項6】
前記ベイト配列が、リボ核酸(RNA)のオリゴマーを含む、請求項1に記載の方法。
【請求項7】
前記ベイト配列が、親和性リガンドまたは固体担体に付着している、請求項1に記載の方法。
【請求項8】
前記親和性リガンドがビオチンである、請求項7に記載の方法。
【請求項9】
DNAライブラリーからの標的濃縮の効率を決定するための方法(800)であって、
陰性対照配列をDNAライブラリーに加える、または陰性対照配列をDNAライブラリーから選択するステップ(801)と、
DNAライブラリーにおける陰性対照配列の捕捉前の量を決定するステップ(802)と、
捕捉後ライブラリーを作製するために、少なくとも1つのベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップ(803)と、
捕捉後ライブラリーにおける陰性対照配列の捕捉後の量を決定するステップ(804)と、
陰性対照配列の捕捉前の量と陰性対照配列の捕捉後の量とを比較することによって、標的濃縮の効率を決定するステップ(805)と
を含む方法。
【請求項10】
前記陰性対照配列が、長鎖散在エレメント(LINE)または短鎖散在エレメント(SINE)から選択される反復エレメントである、請求項9に記載の方法。
【請求項11】
前記反復エレメントがAluエレメントである、請求項10に記載の方法。
【請求項12】
前記反復エレメントが、配列番号1の配列を有するAluJoである、請求項11に記載の方法。
【請求項13】
前記反復エレメントが、配列番号5の配列を有するL1MEeである、請求項10に記載の方法。
【請求項14】
前記ベイト配列が、リボ核酸(RNA)のオリゴマーを含む、請求項9に記載の方法。
【請求項15】
前記ベイト配列が、親和性リガンドまたは固体担体に付着している、請求項9に記載の方法。
【請求項16】
前記親和性リガンドがビオチンである、請求項15に記載の方法。
【請求項1】
DNAライブラリーからの標的濃縮の効率を決定するための方法(900)であって、
陰性対照配列および/もしくは陽性対照配列をDNAライブラリーに加える、または陰性対照配列および/もしくは陽性対照配列をDNAライブラリーから選択するステップ(901)と、
DNAライブラリーにおける陰性対照配列の捕捉前の量および陽性対照配列の捕捉前の量を決定するステップ(902)と、
捕捉後ライブラリーを作製するために、少なくとも1つのベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップ(903)と、
捕捉後ライブラリーにおける陰性対照配列の捕捉後の量および陽性対照配列の捕捉後の量を決定するステップ(904)と、
陰性対照配列の捕捉後の量に対する陽性対照配列の捕捉後の量の比率に基づいて、または
(i)陽性対照配列の捕捉前の量および陰性対照配列の捕捉前の量の第1の比率と(ii)陽性対照配列の捕捉後の量および陰性対照配列の捕捉後の量の第2の比率との比較に基づいて、
標的濃縮の効率を決定するステップ(905)と
を含む方法。
【請求項2】
前記陰性対照配列が、長鎖散在エレメント(LINE)または短鎖散在エレメント(SINE)から選択される反復エレメントである、請求項1に記載の方法。
【請求項3】
前記反復エレメントがAluエレメントである、請求項2に記載の方法。
【請求項4】
前記反復エレメントが、配列番号1の配列を有するAluJoである、請求項3に記載の方法。
【請求項5】
前記反復エレメントが、配列番号5の配列を有するL1MEeである、請求項2に記載の方法。
【請求項6】
前記ベイト配列が、リボ核酸(RNA)のオリゴマーを含む、請求項1に記載の方法。
【請求項7】
前記ベイト配列が、親和性リガンドまたは固体担体に付着している、請求項1に記載の方法。
【請求項8】
前記親和性リガンドがビオチンである、請求項7に記載の方法。
【請求項9】
DNAライブラリーからの標的濃縮の効率を決定するための方法(800)であって、
陰性対照配列をDNAライブラリーに加える、または陰性対照配列をDNAライブラリーから選択するステップ(801)と、
DNAライブラリーにおける陰性対照配列の捕捉前の量を決定するステップ(802)と、
捕捉後ライブラリーを作製するために、少なくとも1つのベイト配列を用いてDNAライブラリーからの標的配列の濃縮を行うステップ(803)と、
捕捉後ライブラリーにおける陰性対照配列の捕捉後の量を決定するステップ(804)と、
陰性対照配列の捕捉前の量と陰性対照配列の捕捉後の量とを比較することによって、標的濃縮の効率を決定するステップ(805)と
を含む方法。
【請求項10】
前記陰性対照配列が、長鎖散在エレメント(LINE)または短鎖散在エレメント(SINE)から選択される反復エレメントである、請求項9に記載の方法。
【請求項11】
前記反復エレメントがAluエレメントである、請求項10に記載の方法。
【請求項12】
前記反復エレメントが、配列番号1の配列を有するAluJoである、請求項11に記載の方法。
【請求項13】
前記反復エレメントが、配列番号5の配列を有するL1MEeである、請求項10に記載の方法。
【請求項14】
前記ベイト配列が、リボ核酸(RNA)のオリゴマーを含む、請求項9に記載の方法。
【請求項15】
前記ベイト配列が、親和性リガンドまたは固体担体に付着している、請求項9に記載の方法。
【請求項16】
前記親和性リガンドがビオチンである、請求項15に記載の方法。
【図2】
【図3】
【図4】
【図7A】
【図8】
【図9】
【図1】
【図5】
【図6A】
【図6B】
【図7B】
【図3】
【図4】
【図7A】
【図8】
【図9】
【図1】
【図5】
【図6A】
【図6B】
【図7B】
【公開番号】特開2013−111081(P2013−111081A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2012−238870(P2012−238870)
【出願日】平成24年10月30日(2012.10.30)
【出願人】(399117121)アジレント・テクノロジーズ・インク (710)
【氏名又は名称原語表記】AGILENT TECHNOLOGIES, INC.
【Fターム(参考)】
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願日】平成24年10月30日(2012.10.30)
【出願人】(399117121)アジレント・テクノロジーズ・インク (710)
【氏名又は名称原語表記】AGILENT TECHNOLOGIES, INC.
【Fターム(参考)】
[ Back to top ]