説明

両末端配列決定(pairedendsequencing)

【課題】両末端配列決定アプローチおよび他の核酸技術に有用な新規の方法、システムおよび組成物を提供する。
【解決手段】本発明は、核酸の大きいフラグメントの両方の末端を単離および配列決定するための迅速でありかつ費用対効果の高い方法を提供し、この方法は、迅速であり、かつ自動化に適しており、そしてDNAの大きいフラグメントの配列決定および連鎖を可能にする。本発明の方法は、DNAフラグメントのライブラリーを産生するために使用され得、そのフラグメントは、DNAのより大きいフラグメント由来の末端を含む。

【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の参照)
本願は、米国仮特許出願第60/688,042号(2005年6月6日出願)、同第60/717,964号(2005年9月16日出願)、および同第60/771,818号(2006年2月8日出願)(これらの内容は、本明細書中に参考として援用される)に基づく優先権を主張する。
【0002】
この本文中に引用された出願および特許の各々、ならびにその出願および特許の各々に引用された各文書または参考文献(それぞれの取得された特許の遂行の間を含む;「出願引用文書」)、ならびに任意のこれらの出願および特許に対応しそして/またはそれらに基づく優先権を主張する米国および外国の出願または特許の各々、ならびに出願引用文書の各々において引用または参照された文書の各々は、本明細書によって参考として本明細書中に明確に援用される。より一般に、文書または参考文献は、添付の参考文献一覧(Reference List)またはこの本文自体のいずれかにおいてこの本文に引用され;そして、これらの文書または参考文献(「本明細書中に引用された参考文献」)の各々、および本明細書中に引用された参考文献の各々において引用されたそれぞれの文書または参考文献(任意の製造業者の仕様書、説明書などを含む)は、本明細書によって参考として本明細書中に明確に援用される。参考としてこの本文中に援用された文書は、本発明の実施に利用され得る。
【0003】
(政府の権利)
本発明は、NIHによって授与された助成金番号R01 HG003562の下で米国政府支援によって行なわれた。米国政府は、本発明において特定の権利を有し得る。
【0004】
(発明の分野)
本発明は、核酸配列決定、ゲノム配列決定、およびその配列決定結果の隣接する配列へのアセンブリ(assembly)の分野に関する。
【背景技術】
【0005】
(発明の背景)
大きい標的核酸(例えば、ヒトゲノム)を配列決定する1つのアプローチは、ショットガン配列決定の使用である。ショットガン配列決定において、上記標的核酸は、一連のオーバーラップする核酸フラグメントを生成し、そしてこれらのフラグメントの配列を決定するために、断片化またはサブクローニングされる。オーバーラップおよび各フラグメントの配列の知見に基づいて、標的核酸の完全な配列が、アセンブリされ得る。
【0006】
ショットガンアプローチの配列決定に対する1つの不利益は、標的核酸配列が多くの小さな反復(縦列反復または逆方向反復)を含む場合に、アセンブリが困難であり得ることである。反復領域においてゲノム配列をアセンブリできないことは、アセンブリされた配列においてギャップを生じる。したがって、核酸配列の最初のアセンブリの後、配列包括度(sequence coverage)におけるギャップは、埋められる必要があり、そしてアセンブリにおける不確実性は、解消される必要がある。
【0007】
これらのギャップを解消する1つの方法は、配列決定のためにより大きいクローンまたはフラグメントを使用することである。なぜならば、これらのより大きいフラグメントは、上記反復領域を補うのに十分に長いからである。しかし、核酸の大きいフラグメントの配列決定は、より困難であり、かつ現在の配列決定装置ではより時間を浪費する。
上記配列中のギャップを補う別のアプローチは、大きいフラグメントの両方の末端の配列を決定することである。ショットガン配列決定フラグメントの一方の末端の単一の配列読み取りとは対照的に、両方の末端からの配列読み取りの対は、公知のスペーシングおよび方向を有する。比較的長いフラグメントの使用はまた、散在反復エレメントを含む配列のアセンブリに役立つ。この型のアプローチ(非特許文献1)は、両末端配列決定として当該分野において公知である。本発明は、両末端配列決定アプローチおよび他の核酸技術に有用な新規の方法、システムおよび組成物を包含する。
【先行技術文献】
【非特許文献】
【0008】
【非特許文献1】Smith,M.W.ら、Nature Genetics、1994年、第7巻、p.40−47
【発明の概要】
【課題を解決するための手段】
【0009】
(発明の概要)
本発明の1つの実施形態は、生物体のゲノム由来の大きいセグメントであり得る標的核酸の2つの末端領域を含むDNA構築物を得るための方法に関する。その方法は、以下の工程:
(a)標的核酸を生成するために、大きい核酸分子を断片化する工程;
(b)第1の環状核酸分子を形成するために、上記標的核酸に捕捉エレメントをライゲーションする工程;
(c)上記捕捉エレメントによって分割された上記標的核酸の2つの末端を含む直鎖状核酸を生成ために、上記標的核酸を切断するが上記捕捉エレメントを切断しない制限エンドヌクレアーゼによって上記第1の環状核酸を消化する工程;
(d)第2の環状核酸を形成するために、分割エレメントを有する上記直鎖状核酸をライゲーションする工程;
(e)上記第2の環状核酸を環状の一本鎖核酸に変換する工程;
(f)一本鎖のローリングサークル型増幅(rolling circle amplification)産物を生成するために、第1のオリゴヌクレオチドを上記環状の一本鎖核酸にアニーリングさせそしてローリングサークル型増幅によって上記環状の一本鎖核酸を増幅する工程;
(g)上記一本鎖のローリング型増幅産物中に複数の二本鎖領域を形成するために、第2のオリゴヌクレオチドを上記一本鎖のローリングサークル型増幅産物にアニーリングさせる工程;および
(h)標的核酸の2つの末端領域を含む上記DNA構築物を生成するために、上記複数の二本鎖領域を切断する制限エンドヌクレアーゼによって上記一本鎖のローリングサークル型増幅産物を小さいフラグメントへと消化する工程;
を包含する。
【0010】
本発明の別の実施形態は、標的核酸の2つの末端領域を含むDNA構築物を得るための第2の方法に関する。その方法は、以下の工程:
(a)標的核酸を生成するために、大きい核酸分子を断片化する工程;
(b)アダプターを上記標的核酸の各末端にライゲーションする工程;
(c)環状核酸分子を形成するために、表示タグを上記標的核酸にライゲーションする工程;
(d)標的核酸の2つの末端領域を含む上記DNA構築物を生成するために、上記標的核酸を切断するが上記アダプターまたは上記表示タグを切断しない制限エンドヌクレアーゼによって環状核酸を消化する工程;
を包含する。
【0011】
本発明の方法は、DNAの大きいフラグメント由来の末端を含むDNA構築物のライブラリーを産生するために、複数の標的DNAフラグメントにおいて同時に行われ得る。本発明の1つの利点は、ライブラリーが原核生物宿主細胞または真核生物宿主細胞を使用することなくインビトロで構築され得ることである。
本発明は例えば、以下の項目を提供する:
(項目1)
標的核酸の2つの末端領域を含むDNA構築物を得るための方法であって、
(a)標的核酸を生成するために、大きい核酸分子を断片化する工程;
(b)第1の環状核酸分子を形成するために、該標的核酸に捕捉エレメントをライゲーションする工程;
(c)該捕捉エレメントによって分割された該標的核酸の2つの末端を含む直鎖状核酸を生成ために、該標的核酸を切断するが該捕捉エレメントを切断しない制限エンドヌクレアーゼによって該第1の環状核酸を消化する工程;
(d)第2の環状核酸を形成するために、分割エレメントを有する該直鎖状核酸をライゲーションする工程;
(e)該第2の環状核酸を環状の一本鎖核酸に変換する工程;
(f)一本鎖のローリングサークル型増幅産物を生成するために、第1のオリゴヌクレオチドを該環状の一本鎖核酸にアニーリングさせそしてローリングサークル型増幅によって該環状の一本鎖核酸を増幅する工程;
(g)該一本鎖のローリング型増幅産物中に複数の二本鎖領域を形成するために、第2のオリゴヌクレオチドを該一本鎖のローリングサークル型増幅産物にアニーリングさせる工程;および
(h)標的核酸の2つの末端領域を含む該DNA構築物を生成するために、該複数の二本鎖領域を切断する制限エンドヌクレアーゼによって該一本鎖のローリングサークル型増幅産物を小さいフラグメントへと消化する工程;
を包含する、方法。
(項目2)
前記断片化する工程の後に、前記標的核酸フラグメントをサイズ分画し、そして好ましいサイズの標的核酸フラグメントを選択する工程をさらに包含する、項目1に記載の方法。
(項目3)
前記第1のオリゴヌクレオチドが、前記捕捉エレメントまたは前記分割エレメントにアニーリングする、項目1に記載の方法。
(項目4)
前記第2のオリゴヌクレオチドが、前記捕捉エレメントまたは前記分割エレメントにアニーリングする、項目1に記載の方法。
(項目5)
前記制限エンドヌクレアーゼが、I型制限エンドヌクレアーゼまたはIIS型制限エンドヌクレアーゼである、項目1に記載の方法。
(項目6)
前記標的核酸は、少なくとも50kb、少なくとも20kb、少なくとも10kbまたは少なくとも5kbである、項目1に記載の方法。
(項目7)
前記標的核酸は、50kbと3kbとの間、20kbと3kbとの間、または10kbと3kbとの間である、項目1に記載の方法。
(項目8)
前記捕捉エレメントまたは前記分割エレメントは、マーカー遺伝子を含む、項目1に記載の方法。
(項目9)
前記マーカー遺伝子は、抗生物質耐性遺伝子である、項目8に記載の方法。
(項目10)
前記捕捉エレメントまたは前記分割エレメントは、真核生物の複製起点または原核生物の複製起点を含む、項目1に記載の方法。
(項目11)
前記捕捉エレメントまたは前記分割エレメントは、ビオチン化される、項目1に記載の方法。
(項目12)
前記消化する工程の後に、捕捉エレメントを含む核酸フラグメントを単離する工程をさらに包含する、項目11に記載の方法。
(項目13)
標的核酸の2つの末端領域を含むDNA構築物を得るための方法であって、
(a)標的核酸を生成するために、大きい核酸分子を断片化する工程;
(b)アダプターを該標的核酸の各末端にライゲーションする工程;
(c)環状核酸分子を形成するために、表示タグを該標的核酸にライゲーションする工程;
(d)標的核酸の2つの末端領域を含む該DNA構築物を生成するために、該標的核酸を切断するが該アダプターまたは該表示タグを切断しない制限エンドヌクレアーゼによって環状核酸を消化する工程;
を包含する、方法。
(項目14)
前記断片化する工程の後に、前記標的核酸フラグメントをサイズ分画し、そして好ましいサイズの標的核酸フラグメントを選択する工程をさらに包含する、項目13に記載の方法。
(項目15)
前記工程(d)の後に、前記DNA構築物を増幅する工程をさらに包含する、項目13に記載の方法。
(項目16)
前記増幅が、
(e)アダプターを前記DNA構築物の末端にライゲーションする工程;および
(f)該DNA構築物をPCRによって増幅する工程;
によって行なわれる、項目15に記載の方法。
(項目17)
前記制限エンドヌクレアーゼが、I型制限エンドヌクレアーゼまたはIIS型制限エンドヌクレアーゼである、項目13に記載の方法。
(項目18)
前記標的核酸は、少なくとも50kb、少なくとも20kb、少なくとも10kbまたは少なくとも5kbである、項目13に記載の方法。
(項目19)
前記標的核酸は、50kbと3kbとの間、20kbと3kbとの間、または10kbと3kbとの間である、項目13に記載の方法。
(項目20)
前記表示タグは、マーカー遺伝子または複製起点を含む、項目13に記載の方法。
(項目21)
前記アダプターまたは前記表示タグは、ビオチン化される、項目1に記載の方法。
(項目22)
前記消化する工程の後に、表示タグまたはアダプターを含む核酸フラグメントを単離する工程をさらに包含する、項目21に記載の方法。
(項目23)
標的核酸の2つの末端領域を含むDNA構築物を得るための方法であって、
(a)標的核酸を生成するために、大きい核酸分子を断片化する工程;
(b)アダプターでタグ化された標的核酸を形成するために、第1のアダプターを該標的核酸の一方の末端にライゲーションし、そして第2のアダプターを該標的核酸の第2の末端にライゲーションする工程;
(c)標的核酸領域およびアダプター領域を含む環状核酸分子を形成するために、該第1のアダプターを該第2のアダプターにライゲーションすることによって該アダプターでタグ化された標的核酸を環化する工程;
(d)標的核酸の2つの末端領域を含む該DNA構築物を生成するために、該標的核酸領域にて該環状核酸分子を断片化する工程;
を包含する、方法。
(項目24)
前記大きい核酸または前記標的核酸が、工程(b)の前にメチラーゼによってメチル化される、項目23に記載の方法。
(項目25)
前記メチル化は、1種以上の制限エンドヌクレアーゼによる前記標的核酸の制限エンドヌクレアーゼ切断を防ぐ、項目24に記載の方法。
(項目26)
前記アダプターは、ヘアピンアダプターである、項目23に記載の方法。
(項目27)
(b1)両方の末端でヘアピンアダプターにライゲーションされていないあらゆる標的核酸を消化するために、前記アダプターでタグ化された標的核酸をエキソヌクレアーゼによって処理する工程;
(b2)該エキソヌクレアーゼを該アダプターでタグ化された標的核酸から除去する工程;
を工程(b)の後にさらに包含する、項目26に記載の方法。
(項目28)
(b3)両方の末端に切断されたアダプターを有するアダプターでタグ化された標的核酸を産生するために、前記第1のアダプターおよび前記第2のアダプターを切断しかつ前記標的核酸を切断しない制限エンドヌクレアーゼによって、前記アダプターでタグ化された標的核酸を消化する工程;
を工程(b)と工程(c)との間にさらに包含する、項目23に記載の方法。
(項目29)
環化されていない標的核酸を除去する工程を工程(c)の後にさら包含する、項目23に記載の方法。
(項目30)
前記環化されていない標的核酸を除去する工程が、該標的核酸とエキソヌクレアーゼとを接触させる工程を包含する、項目29に記載の方法。
(項目31)
工程(d)が、機械的せん断によって行なわれる、項目23に記載の方法。
(項目32)
前記アダプターは、ビオチン化される、項目23に記載の方法。
(項目33)
アビジンまたはストレプトアビジンでコーティングされた固体支持体を用いたアフィニティー精製によって前記アダプターでタグ化された標的核酸を精製する工程を工程(b)の後にさらに包含する、項目32に記載の方法。
(項目34)
アビジンまたはストレプトアビジンでコーティングされた固体支持体を用いたアフィニティー精製によって前記DNA構築物を精製する工程を工程(d)の後にさらに包含する、項目32に記載の方法。
(項目35)
前記標的核酸は、少なくとも50kb、少なくとも20kb、少なくとも10kbまたは少なくとも5kbである、項目23に記載の方法。
(項目36)
前記標的核酸は、50kbと3kbとの間、20kbと3kbとの間、または10kbと3kbとの間である、項目23に記載の方法。
(項目37)
前記標的核酸は、少なくとも500bp〜1kbの間、1kbと3kbとの間または500bpと3kbとの間である、項目23に記載の方法。
(項目38)
標的核酸の2つの末端領域を含む前記DNA構築物は、10kb未満のサイズである、項目23に記載の方法。
(項目39)
標的核酸の2つの末端領域を含む前記DNA構築物は、20kb未満のサイズである、項目23に記載の方法。
(項目40)
標的核酸の2つの末端領域を含む前記DNA構築物は、40kb未満のサイズである、項目23に記載の方法。
(項目41)
標的核酸の2つの末端領域を含む前記DNA構築物は、5kb未満のサイズである、項目23に記載の方法。
(項目42)
標的核酸の2つの末端領域を含む前記DNA構築物は、3kb未満のサイズである、項目23に記載の方法。
(項目43)
標的核酸の2つの末端領域を含む前記DNA構築物は、1kb未満のサイズである、項目23に記載の方法。
(項目44)
標的核酸の2つの末端領域を含む前記DNA構築物は、500bp未満のサイズである、項目23に記載の方法。
(項目45)
標的核酸の2つの末端領域を含む前記DNA構築物は、300bp未満のサイズである、項目23に記載の方法。
(項目46)
標的核酸の2つの末端領域を含むDNA構築物を得るための方法であって、
(a)標的核酸を生成するために、大きい核酸分子を断片化する工程;
(b)環状核酸分子を形成するために、捕捉エレメントを該標的核酸にライゲーションする工程;
(c)該捕捉エレメントによって分割された標的核酸の2つの末端領域を含む該DNA構築物を生成するために、該標的核酸を切断するが該捕捉エレメントを切断しない制限エンドヌクレアーゼによって該環状核酸を消化する工程;
を包含する、方法。
(項目47)
前記捕捉エレメントは、結合対の1つのメンバーを含む核酸である、項目46に記載の方法。
(項目48)
前記結合対は、FLAG/抗FLAG抗体、ビオチン/アビジン、およびビオチン/ストレプトアビジンからなる群より選択される、項目47に記載の方法。
(項目49)
前記捕捉エレメントは、ビオチン化される、項目47に記載の方法。
(項目50)
前記結合対の第2のメンバーを備える固体支持体を使用するアフィニティー精製によって前記DNA構築物を濃縮する工程をさらに包含する、項目47に記載の方法。
(項目51)
前記大きい核酸または前記標的核酸は、工程(b)の前にメチラーゼによってメチル化される、項目46に記載の方法。
(項目52)
前記メチル化は、1種以上の制限エンドヌクレアーゼによる前記標的核酸の制限エンドヌクレアーゼ切断を防ぐ、項目51に記載の方法。
(項目53)
環化されていない標的核酸を除去する工程を工程(b)の後にさらに包含する、項目46に記載の方法。
(項目54)
前記環化されていない標的核酸を除去する工程が、該標的核酸とエキソヌクレアーゼとを接触させる工程を包含する、項目53に記載の方法。
(項目55)
前記標的核酸は、少なくとも50kb、少なくとも20kb、少なくとも10kbまたは少なくとも5kbである、項目46に記載の方法。
(項目56)
前記標的核酸は、50kbと3kbとの間、20kbと3kbとの間、または10kbと3kbとの間である、項目46に記載の方法。
(項目57)
標的核酸の2つの末端領域を含む前記DNA構築物は、5kb未満のサイズである、項目46に記載の方法。
(項目58)
標的核酸の2つの末端領域を含む前記DNA構築物は、3kb未満のサイズである、項目46に記載の方法。
(項目59)
標的核酸の2つの末端領域を含む前記DNA構築物は、1kb未満のサイズである、項目46に記載の方法。
(項目60)
標的核酸の2つの末端領域を含む前記DNA構築物は、500bp未満のサイズである、項目46に記載の方法。
(項目61)
標的核酸の2つの末端領域を含む前記DNA構築物は、300bp未満のサイズである、項目46に記載の方法。
(項目62)
前記標的核酸は、少なくとも500bp〜1kbの間、1kbと3kbとの間または500bpと3kbとの間、項目46に記載の方法。
(項目63)
標的核酸の2つの末端領域を含む前記DNA構築物は、10kb未満のサイズである、項目46に記載の方法。
(項目64)
標的核酸の2つの末端領域を含む前記DNA構築物は、20kb未満のサイズである、項目46に記載の方法。
(項目65)
標的核酸の2つの末端領域を含む前記DNA構築物は、40kb未満のサイズである、項目46に記載の方法。
(項目66)
直鎖状ポリヌクレオチド分子を環化する方法であって、該方法は、
a)水溶液中に該直鎖状ポリヌクレオチド分子を提供する工程;
b)油中に該水溶液を乳化する工程;および
c)該直鎖状ポリヌクレオチド分子の末端を共有結合させ、それによって該直鎖状ポリヌクレオチド分子を環化する工程;
を包含する、方法。
(項目67)
前記直鎖状ポリヌクレオチド分子は、一本鎖DNA、二本鎖DNA、一本鎖RNAおよび二本鎖RNAからなる群より選択される、項目66に記載の方法。
(項目68)
前記直鎖状ポリヌクレオチド分子の2つの末端は、ライゲーションに適した適合性末端を有する、項目66に記載の方法。
(項目69)
前記直鎖状ポリヌクレオチド分子の末端は、ライゲーションによって結合される、項目66に記載の方法。
(項目70)
前記油は、1種以上の界面活性剤と混合される、項目66に記載の方法。
(項目71)
直鎖状ポリヌクレオチド分子を環化する方法であって、該方法は、
a)水溶液中に直鎖状ポリヌクレオチド分子の集団を提供する工程;
b)複数の水性マイクロリアクターを生成するために、油中に該水溶液を乳化する工程;および
c)少なくとも1つのマイクロリアクター中の該直鎖状ポリヌクレオチド分子の末端を共有結合させる工程;
を包含し、それら工程によって該直鎖状ポリヌクレオチド分子を環化する、方法。
(項目72)
複数のマイクロリアクターは、正確に1つのポリヌクレオチド分子を含む、項目71に記載の方法。
(項目73)
前記複数のマイクロリアクターは、油中水型エマルションを含む、項目71に記載の方法。
(項目74)
工程(d)において、前記環状核酸分子は、制限エンドヌクレアーゼを用いた消化によって断片化される、項目23に記載の方法。
(項目75)
前記制限エンドヌクレアーゼは、MmeIである、項目17、46または74のいずれか1つに記載の方法。
(項目76)
MmeI制限酵素認識部位を含むキャリアDNAが、MmeI消化の間に添加される、項目75に記載の方法。
(項目77)
キャリアDNAの量は、前記環状核酸を上回るモルで添加される、項目76に記載の方法。
(項目78)
MmeI酵素および前記キャリアDNA中のMmeI部位は、化学量論の量で存在する、項目76に記載の方法。
(項目79)
(b4)両方の末端に切断されたアダプターを有するアダプターでタグ化された標的核酸を産生するために、前記第1のヘアピンアダプターおよび前記第2のヘアピンアダプターを切断しかつ前記標的核酸を切断しないエンドヌクレアーゼによって前記アダプターでタグ化された標的核酸を消化する工程;
を工程(b)と工程(c)との間にさらに包含する、項目26に記載の方法。
(項目80)
前記ヘアピンアダプターは、それらの二本鎖領域の各鎖中に少なくとも1個のデオキシイノシンを有し、そして前記エンドヌクレアーゼは、エンドヌクレアーゼVである、項目79に記載の方法。
【0012】
これらの実施形態および他の実施形態は、以下の詳細な説明によって開示されるか、または以下の詳細な説明から明らかであり、そしてそれらの実施形態は、以下の詳細な説明によって包含される。
【図面の簡単な説明】
【0013】
以下の詳細な説明は、例として与えられるが、記載される特定の実施形態に本発明を限定することを意図せず、以下の詳細な説明は、参考として本明細書中に援用される添付の図面と組み合わせて理解され得る。
【図1−1】図1は、両末端配列決定ストラテジーの1つの実施形態の概略図を示す。数値的な標識は、核酸の由来を示す。「101」は、例えば、図3Aの左側に示される捕捉エレメントの1つのフランキング(flanking)領域を示す。「102」は、例えば、図3Aの右側に示される捕捉エレメントの第2のフランキング領域を示す。「103」は、捕捉エレメントを示す。「104」は、断片化(および必要に応じて、サイズ分画)された出発核酸を示す。「105」は、分割エレメントを示す。「106」は、ポリメラーゼを示す。
【図1−2】図1は、両末端配列決定ストラテジーの1つの実施形態の概略図を示す。数値的な標識は、核酸の由来を示す。「101」は、例えば、図3Aの左側に示される捕捉エレメントの1つのフランキング(flanking)領域を示す。「102」は、例えば、図3Aの右側に示される捕捉エレメントの第2のフランキング領域を示す。「103」は、捕捉エレメントを示す。「104」は、断片化(および必要に応じて、サイズ分画)された出発核酸を示す。「105」は、分割エレメントを示す。「106」は、ポリメラーゼを示す。
【図1−3】図1は、両末端配列決定ストラテジーの1つの実施形態の概略図を示す。数値的な標識は、核酸の由来を示す。「101」は、例えば、図3Aの左側に示される捕捉エレメントの1つのフランキング(flanking)領域を示す。「102」は、例えば、図3Aの右側に示される捕捉エレメントの第2のフランキング領域を示す。「103」は、捕捉エレメントを示す。「104」は、断片化(および必要に応じて、サイズ分画)された出発核酸を示す。「105」は、分割エレメントを示す。「106」は、ポリメラーゼを示す。
【図1−4】図1は、両末端配列決定ストラテジーの1つの実施形態の概略図を示す。数値的な標識は、核酸の由来を示す。「101」は、例えば、図3Aの左側に示される捕捉エレメントの1つのフランキング(flanking)領域を示す。「102」は、例えば、図3Aの右側に示される捕捉エレメントの第2のフランキング領域を示す。「103」は、捕捉エレメントを示す。「104」は、断片化(および必要に応じて、サイズ分画)された出発核酸を示す。「105」は、分割エレメントを示す。「106」は、ポリメラーゼを示す。
【図1−5】図1は、両末端配列決定ストラテジーの1つの実施形態の概略図を示す。数値的な標識は、核酸の由来を示す。「101」は、例えば、図3Aの左側に示される捕捉エレメントの1つのフランキング(flanking)領域を示す。「102」は、例えば、図3Aの右側に示される捕捉エレメントの第2のフランキング領域を示す。「103」は、捕捉エレメントを示す。「104」は、断片化(および必要に応じて、サイズ分画)された出発核酸を示す。「105」は、分割エレメントを示す。「106」は、ポリメラーゼを示す。
【図2】図2は、両末端配列決定ストラテジーの第2の実施形態の概略図を示す。
【図3】図3は、捕捉フラグメントの配列および設計を示す。その配列の識別は、以下の通りである:両末端捕捉フラグメント産物 配列番号1オリゴ1 配列番号2オリゴ2 配列番号3オリゴ3 配列番号4オリゴ4 配列番号5両末端捕捉フラグメント産物(IIS型、MmeI) 配列番号6短いアダプター両末端捕捉フラグメント 配列番号7短いアダプター両末端捕捉フラグメント(IIS型、MmeI) 配列番号8。
【図4】図4は、REフラグメントの1つの実施形態を示す。
【図5】図5は、REフラグメントの別の実施形態を示す。
【図6−A】図6は、ヘアピンアダプターを使用する両末端読み取りアプローチを示す。そのヘアピンアダプターは、以下の配列を有する:
【化2】

上記ヘアピンアダプターは、上記の4つの領域へと分割されるように示される1つの連続した核酸配列である。上記4つの領域は、左から右へ、ヘアピン領域、制限エンドヌクレアーゼ認識部位、ビオチン化領域、およびIIS型制限エンドヌクレアーゼ認識部位である。「601」は、上記ヘアピンアダプターを示す。「603」は、ゲノムDNAを示す。Metは、メチル化DNAを示す。「602」は、ヘアピンアダプターダイマーを示す。「604」は、制限エンドヌクレアーゼによって切断されたヘアピンアダプターを示す。「605」は、制限エンドヌクレアーゼによって切断され、そして再度ライゲーションされた2つのヘアピンアダプターを示す。SAは、ストレプトアビジンビーズを示す。Bioは、ビオチン(例えば、ビオチン化DNA)を示す。
【図6−B】図6は、ヘアピンアダプターを使用する両末端読み取りアプローチを示す。そのヘアピンアダプターは、以下の配列を有する:
【化3】

上記ヘアピンアダプターは、上記の4つの領域へと分割されるように示される1つの連続した核酸配列である。上記4つの領域は、左から右へ、ヘアピン領域、制限エンドヌクレアーゼ認識部位、ビオチン化領域、およびIIS型制限エンドヌクレアーゼ認識部位である。「601」は、上記ヘアピンアダプターを示す。「603」は、ゲノムDNAを示す。Metは、メチル化DNAを示す。「602」は、ヘアピンアダプターダイマーを示す。「604」は、制限エンドヌクレアーゼによって切断されたヘアピンアダプターを示す。「605」は、制限エンドヌクレアーゼによって切断され、そして再度ライゲーションされた2つのヘアピンアダプターを示す。SAは、ストレプトアビジンビーズを示す。Bioは、ビオチン(例えば、ビオチン化DNA)を示す。
【図6−C】図6は、ヘアピンアダプターを使用する両末端読み取りアプローチを示す。そのヘアピンアダプターは、以下の配列を有する:
【化4】

上記ヘアピンアダプターは、上記の4つの領域へと分割されるように示される1つの連続した核酸配列である。上記4つの領域は、左から右へ、ヘアピン領域、制限エンドヌクレアーゼ認識部位、ビオチン化領域、およびIIS型制限エンドヌクレアーゼ認識部位である。「601」は、上記ヘアピンアダプターを示す。「603」は、ゲノムDNAを示す。Metは、メチル化DNAを示す。「602」は、ヘアピンアダプターダイマーを示す。「604」は、制限エンドヌクレアーゼによって切断されたヘアピンアダプターを示す。「605」は、制限エンドヌクレアーゼによって切断され、そして再度ライゲーションされた2つのヘアピンアダプターを示す。SAは、ストレプトアビジンビーズを示す。Bioは、ビオチン(例えば、ビオチン化DNA)を示す。
【図6−D】図6は、ヘアピンアダプターを使用する両末端読み取りアプローチを示す。そのヘアピンアダプターは、以下の配列を有する:
【化5】

上記ヘアピンアダプターは、上記の4つの領域へと分割されるように示される1つの連続した核酸配列である。上記4つの領域は、左から右へ、ヘアピン領域、制限エンドヌクレアーゼ認識部位、ビオチン化領域、およびIIS型制限エンドヌクレアーゼ認識部位である。「601」は、上記ヘアピンアダプターを示す。「603」は、ゲノムDNAを示す。Metは、メチル化DNAを示す。「602」は、ヘアピンアダプターダイマーを示す。「604」は、制限エンドヌクレアーゼによって切断されたヘアピンアダプターを示す。「605」は、制限エンドヌクレアーゼによって切断され、そして再度ライゲーションされた2つのヘアピンアダプターを示す。SAは、ストレプトアビジンビーズを示す。Bioは、ビオチン(例えば、ビオチン化DNA)を示す。
【図6−E】図6は、ヘアピンアダプターを使用する両末端読み取りアプローチを示す。そのヘアピンアダプターは、以下の配列を有する:
【化6】

上記ヘアピンアダプターは、上記の4つの領域へと分割されるように示される1つの連続した核酸配列である。上記4つの領域は、左から右へ、ヘアピン領域、制限エンドヌクレアーゼ認識部位、ビオチン化領域、およびIIS型制限エンドヌクレアーゼ認識部位である。「601」は、上記ヘアピンアダプターを示す。「603」は、ゲノムDNAを示す。Metは、メチル化DNAを示す。「602」は、ヘアピンアダプターダイマーを示す。「604」は、制限エンドヌクレアーゼによって切断されたヘアピンアダプターを示す。「605」は、制限エンドヌクレアーゼによって切断され、そして再度ライゲーションされた2つのヘアピンアダプターを示す。SAは、ストレプトアビジンビーズを示す。Bioは、ビオチン(例えば、ビオチン化DNA)を示す。
【図6−F】図6は、ヘアピンアダプターを使用する両末端読み取りアプローチを示す。そのヘアピンアダプターは、以下の配列を有する:
【化7】

上記ヘアピンアダプターは、上記の4つの領域へと分割されるように示される1つの連続した核酸配列である。上記4つの領域は、左から右へ、ヘアピン領域、制限エンドヌクレアーゼ認識部位、ビオチン化領域、およびIIS型制限エンドヌクレアーゼ認識部位である。「601」は、上記ヘアピンアダプターを示す。「603」は、ゲノムDNAを示す。Metは、メチル化DNAを示す。「602」は、ヘアピンアダプターダイマーを示す。「604」は、制限エンドヌクレアーゼによって切断されたヘアピンアダプターを示す。「605」は、制限エンドヌクレアーゼによって切断され、そして再度ライゲーションされた2つのヘアピンアダプターを示す。SAは、ストレプトアビジンビーズを示す。Bioは、ビオチン(例えば、ビオチン化DNA)を示す。
【図7】図7は、両末端手順に対する改良を示す。
【図8−1】図8は、突出アダプターを有する両末端読み取りアプローチを示す。
【図8−2】図8は、突出アダプターを有する両末端読み取りアプローチを示す。
【図8−3】図8は、突出アダプターを有する両末端読み取りアプローチを示す。
【図8−4】図8は、突出アダプターを有する両末端読み取りアプローチを示す。
【図8−5】図8は、突出アダプターを有する両末端読み取りアプローチを示す。
【図8−6】図8は、突出アダプターを有する両末端読み取りアプローチを示す。
【図9】図9は、本発明の産物を配列決定するための1つの方法である「タグがプライムした(tag primed)」二末端の配列決定を示す。
【図10】図10は、アダプターが連結した環化を示す。
【図11】図11は、ssDNAベースの環化を示す。
【図12−1】図12は、両末端配列決定ストラテジー−両末端読み取りPETランダム断片化の別の実施形態の概略図を示す。SPRIは、可逆的固定法を指す。
【図12−2】図12は、両末端配列決定ストラテジー−両末端読み取りPETランダム断片化の別の実施形態の概略図を示す。SPRIは、可逆的固定法を指す。
【図12−3】図12は、両末端配列決定ストラテジー−両末端読み取りPETランダム断片化の別の実施形態の概略図を示す。SPRIは、可逆的固定法を指す。
【図12−4】図12は、両末端配列決定ストラテジー−両末端読み取りPETランダム断片化の別の実施形態の概略図を示す。SPRIは、可逆的固定法を指す。
【図12−5】図12は、両末端配列決定ストラテジー−両末端読み取りPETランダム断片化の別の実施形態の概略図を示す。SPRIは、可逆的固定法を指す。
【図12−6】図12は、両末端配列決定ストラテジー−両末端読み取りPETランダム断片化の別の実施形態の概略図を示す。SPRIは、可逆的固定法を指す。
【図13】図13は、E.Coli K12を配列決定することによる両末端読み取りPETランダム断片化配列決定データを示す。
【図14−1】図14は、E.coliエンドヌクレアーゼVによって切断された二本鎖DNAの種々の方法を示す。囲まれたヌクレオチド「I」は、デオキシイノシンである。図14Aは、二本鎖DNAのヌクレオチド配列が3’一本鎖パリンドロームの突出を生じる様式におけるE.coliエンドヌクレアーゼVによる二本鎖切断を指向する方法を示す。3’一本鎖突出がデオキシイノシン残基を含むことに留意すること。図14Bは、二本鎖DNAのヌクレオチド配列が3’一本鎖非パリンドロームの突出を生じる様式におけるE.coliエンドヌクレアーゼVによる二本鎖切断を指向する方法を示す。3’一本鎖突出がデオキシイノシン残基を含むことに留意すること。
【図14−2】図14は、E.coliエンドヌクレアーゼVによって切断された二本鎖DNAの種々の方法を示す。囲まれたヌクレオチド「I」は、デオキシイノシンである。図14Cは、二本鎖DNAのヌクレオチド配列が5’一本鎖パリンドロームの突出を生じる様式におけるE.coliエンドヌクレアーゼVによる二本鎖切断を指向する方法を示す。5’一本鎖突出がデオキシイノシン残基を含まないことに留意すること。図14Dは、二本鎖DNAのヌクレオチド配列が5’一本鎖非パリンドロームの突出を生じる様式におけるE.coliエンドヌクレアーゼVによる二本鎖切断を指向する方法を示す。5’一本鎖突出がデオキシイノシン残基を含まないことに留意すること。
【図14−3】図14は、E.coliエンドヌクレアーゼVによって切断された二本鎖DNAの種々の方法を示す。囲まれたヌクレオチド「I」は、デオキシイノシンである。図14Eは、二本鎖DNAのヌクレオチド配列が平滑末端を生じる様式におけるE.coliエンドヌクレアーゼVによる二本鎖切断を指向する方法を示す。
【図15−1】図15は、対向する鎖にデオキシイノシンを有するヘアピンアダプター(デオキシイノシンヘアピンアダプター)のE.coliエンドヌクレアーゼVによる二本鎖切断を用いた両末端配列決定ストラテジーの別の実施形態の概略図を示す。
【図15−2】図15は、対向する鎖にデオキシイノシンを有するヘアピンアダプター(デオキシイノシンヘアピンアダプター)のE.coliエンドヌクレアーゼVによる二本鎖切断を用いた両末端配列決定ストラテジーの別の実施形態の概略図を示す。
【図15−3】図15は、対向する鎖にデオキシイノシンを有するヘアピンアダプター(デオキシイノシンヘアピンアダプター)のE.coliエンドヌクレアーゼVによる二本鎖切断を用いた両末端配列決定ストラテジーの別の実施形態の概略図を示す。
【図15−4】図15は、対向する鎖にデオキシイノシンを有するヘアピンアダプター(デオキシイノシンヘアピンアダプター)のE.coliエンドヌクレアーゼVによる二本鎖切断を用いた両末端配列決定ストラテジーの別の実施形態の概略図を示す。
【図15−5】図15は、対向する鎖にデオキシイノシンを有するヘアピンアダプター(デオキシイノシンヘアピンアダプター)のE.coliエンドヌクレアーゼVによる二本鎖切断を用いた両末端配列決定ストラテジーの別の実施形態の概略図を示す。
【図15−6】図15は、対向する鎖にデオキシイノシンを有するヘアピンアダプター(デオキシイノシンヘアピンアダプター)のE.coliエンドヌクレアーゼVによる二本鎖切断を用いた両末端配列決定ストラテジーの別の実施形態の概略図を示す。
【図16】図16は、図15に示されるデオキシイノシンヘアピンアダプター方法を使用するE.coli K12ゲノムDNAの配列決定から得られた両末端読み取り距離の分布を示す。
【図17】図17は、本発明の両末端配列決定法の別の実施形態の概略図を示す。ヘアピンアダプター、両末端アダプター(「A」および「B」)ならびにPCRプライマー「F−PCR」および「R−PCR」のヌクレオチド配列は、図18に示される。両末端アダプターの各々は、図18に示されるような二本鎖部分および一本鎖部分を有する。「Bio」は、ビオチンを示す。「Met」は、メチル化塩基を示す。「SA−ビーズ」は、ストレプトアビジンコーティングされた微粒子を示す。「EcoRI」および「MmeI」は、それぞれ、制限エンドヌクレアーゼEcoRIおよびMmeIに対する認識部位を示す。
【図18】図18は、図17に示されるアダプターおよびプライマーオリゴヌクレオチドのヌクレオチド配列および改変を示す。図18Aは、ヘアピンアダプター配列を示す。「iBiodT」は、内部のビオチン標識デオキシチミンを示す。「Bio」は、ビオチンを示す。「EcoRI」および「MmeI」は、それぞれ、制限エンドヌクレアーゼEcoRIおよびMmeIに対する認識部位を示す。図18Bは、両末端アダプター配列およびPCRプライマーヌクレオチド配列を示す。両末端アダプターの各々(「A」および「B」)は、2つの一本鎖オリゴヌクレオチドのアニーリング(「A先端部」および「A底部」、「B先端部」および「B底部」)によって生成される。図18Bに示されるポリヌクレオチド配列の5’末端は、リン酸化されていない。
【図19】図19は、油中水型エマルションにおけるポリヌクレオチドライゲーションのための方法の1つの実施形態の概略図を示す。
【図20】図20は、MmeI部位含有キャリアDNAを伴ってかまたは伴わずに得られた両末端配列決定データによって達成されたE.coli K12ゲノムDNAの包括度の深さのグラフを示す。
【発明を実施するための形態】
【0014】
(発明の詳細な説明)
他に定義されない限り、本明細書中で使用される全ての技術用語および科学用語は、本発明が関連する分野の当業者によって一般的に理解される意味と同じ意味を有する。本明細書中に記載されるものと類似するかまたは等価である多くの方法および材料が、本発明の実施において使用され得るが、好ましい材料および方法は、本明細書中に記載される。
【0015】
本発明は、核酸の大きいフラグメントの両方の末端を単離および配列決定するための迅速でありかつ費用対効果の高い方法に関する。その方法は、迅速であり、かつ自動化に適しており、そしてDNAの大きいフラグメントの配列決定および連鎖を可能にする。
【0016】
両末端配列決定は、従来の階層的ショットガン配列決定法(clone−by−clone shutgun sequencing)と比較して多くの重要な利点を保持し、そして両末端配列決定は、実際に、ショットガン配列決定を補完する。これらの利点の間で最も重要なものは、ゲノムが反復エレメントによって分散される場合でさえ大きいゲノムの骨格形成(scaffolding)を迅速にもたらす能力である。本発明の方法は、DNAフラグメントのライブラリーを産生するために使用され得、そのフラグメントは、DNAのより大きいフラグメント由来の末端を含む。
【0017】
(第1の方法)
1つの実施形態において、両末端配列決定は、以下の工程において行われ得る:
(工程1A)
出発材料は、任意の核酸であり得、それらとしては、例えば、ゲノムDNA、cDNA、RNA、PCR産物、エピソームなどが挙げられる。本発明の方法が、核酸出発材料の長いストレッチ(stretch)に対して特に有効である一方で、本発明はまた、小さい核酸(例えば、コスミド、プラスミド、小さいPCR産物、ミトコンドリアDNAなど)に対して適用可能である。
【0018】
上記DNAは、任意の供給源由来であり得る。例えば、上記DNAは、そのDNA配列が未知であるかまたは完全に知られていない生物体のゲノム由来であり得る。別の例として、上記DNAは、そのDNA配列が公知である生物体のゲノム由来であり得る。公知のゲノムのDNAを配列決定することは、研究者がゲノムの多型についてのデータを収集し、そして疾患に関する遺伝子型との相互関係を示すことを可能にする。
【0019】
上記核酸出発材料は、公知のサイズまたは公知の範囲のサイズの核酸出発材料であり得る。例えば、上記出発材料は、平均の挿入部分サイズおよび分布が公知であるcDNAライブラリーまたはゲノムライブラリーであり得る。
【0020】
あるいは、上記核酸出発材料は、多くの一般的に使用される方法のうちのいずれか1つによって断片化され得(図1A)、その方法としては、噴霧化、音波破砕、HydroShear、超音波による断片化、酵素的切断(例えば、限定DNase処理(limited DNase treatment)を含むDNase処理、RNase処理(限定RNase処理(limited RNase treatment)を含む)、および制限エンドヌクレアーゼによる消化)、予め断片化されたライブラリー(prefragmented library)(cDNAライブラリーにおけるような)、および化学物質(例えば、NaOH)誘導性の断片化、熱誘導性の断片化、およびDNAサンプル全体に切断部位(例えば、制限エンドヌクレアーゼ切断部位)を導入し得るトランスポゾン誘導性の変異が挙げられる。Goryshin I.Y.およびReznikoff W.S.、J Biol Chem.1998年3月27日;273(13):7367−74;Reznikoff W.S.ら、Methods Mol Biol.2004年;260:83−96;Oscar R.ら、Journal of Bacteriology、2001年4月、p.2384−2388、第183巻、第7号;Pelicic,V.ら、Journal of Bacteriology、2000年10月、p.5391−5398、第182巻を参照のこと。
【0021】
いくつかの断片化方法(例えば、噴霧化)は、2だけのサイズとして異なる標的DNAフラグメントの集団を産生し得る。他の断片化方法(例えば、制限酵素消化)は、より広い範囲のサイズをもたらす。さらに他の方法(例えば、HydroShearing)は、大きい核酸フラグメントが所望される場合に好まれ得る。HydroShearing(Genomic Solutions、Ann Arbor、MI、USA)において、溶液中のDNAは、急激な収縮によってチューブに通され得る。その溶液が収縮に臨む場合、その流体は、収縮のより小さい領域によって体積流量を維持するように加速する。この加速の間、抵抗力は、DNAを、それが切れる(snap)まで伸ばす。DNAフラグメントは、その部分がせん断には短すぎるようになるまで、強制的に化学結合を破壊される。上記流体の流量および収縮の大きさは、最終的なDNAフラグメントのサイズを決定する。核酸出発材料を調製するためのさらなる方法は、国際特許出願第WO04/070007号(これは、その全体が参考として本明細書によって援用される)に見出され得る。
【0022】
使用される断片化方法に依存して、DNAの末端は、研磨(polishing)を必要とし得る。すなわち、二本鎖DNAの末端は、それらを平滑末端にし、そしてライゲーションに適するように処理される必要があり得る。この工程は、断片化方法に依存して当該分野で公知の様式で変化する。例えば、機械的にせん断されたDNAは、配列の突出(overhang)を切断するためにBal31を使用して研磨され得、そしてポリメラーゼ(例えば、クレノウ、T4ポリメラーゼ)およびdNTPは、充填して平滑末端を生成するために使用され得る。
【0023】
(工程1B)
上記フラグメントのサイズが、所望されるよりも変えられる場合、その核酸フラグメントは、このサイズのバリエーションを減少させるためにサイズ分画(size fractionation)され得る。
【0024】
サイズ分画は、多くの当該分野で公知の方法論によって行われ得る必要に応じた工程である。サイズ分画サイズ分画のための方法としては、ゲル方法(例えば、パルスゲル電気泳動)、およびスクロース勾配または塩化セシウム勾配による沈降、およびサイズ排除クロマトグラフィー(ゲル透過クロマトグラフィー)が挙げられる。選択されたサイズ範囲の選択は、両末端配列決定によって測定される領域の長さに基づく。
【0025】
サイズ分画のための1つの好ましい技術は、ゲル電気泳動である(図1Bを参照のこと)。好ましい実施形態において、サイズ分画されたDNAフラグメントは、互いの25%以内であるサイズ分布を有する。例えば、5Kbサイズの分画は、5Kb +/− 1kb(すなわち、4Kb〜6Kb)であるフラグメントを含み、そして50Kbサイズの分画は、50Kb +/− 10kb(すなわち、40Kb〜60Kb)であるフラグメントを含む。
【0026】
(工程1C)
この工程において、「捕捉エレメント」が、調製される。捕捉エレメントは、先の工程由来の核酸フラグメントをライゲーションするために使用される一本鎖末端または二本鎖末端を有し得る直鎖状二本鎖核酸である。「捕捉エレメント」は、順方向アダプター末端および逆方向アダプター末端(円の厚い領域として図1Cに示される)を含む環状核酸(例えば、図1Cに示されるようなプラスミド)として増殖され得る。この環状プラスミドは、上記捕捉エレメントが使用される前に切断され得る。これらのアダプター末端は、その後の工程において可能性のあるPCRプライマーおよび配列決定プライマーに対するハイブリダイゼーション部位として機能し得る核酸配列を含む。
【0027】
2つのアダプター末端の間に、上記捕捉エレメントは、さらなるエレメント(例えば、制限エンドヌクレアーゼ認識部位および/または制限エンドヌクレアーゼ切断部位、抗生物質耐性マーカー、原核生物または真核生物の複製起点、あるいはこれらのエレメントの組み合わせ)を含み得る。このような抗生物質耐性マーカーの例としては、とりわけ、アンピシリン、テトラサイクリン、ネオマイシン、カナマイシン、ストレプトマイシン、ブレオマイシン、ゼオシン(zeocin)、クロラムフェニコールに対する耐性を与える遺伝子が挙げられるが、これらに限定されない。原核生物の複製起点としては、とりわけ、OriCおよびOriVが挙げられ得る。真核生物の複製起点としては、自律複製配列(ARS)が挙げられ得るが、これらの配列に限定されない。さらに、上記捕捉エレメントは、その後の核酸産物(工程L)を小さい増幅可能(PCRによって)なフラグメントへと消化するために使用され得る制限エンドヌクレアーゼ認識部位および/または制限エンドヌクレアーゼ切断部位(例えば、固有かつ稀な部位が好ましい)を含み得る。捕捉エレメントはまた、両末端配列決定のための上記核酸の容易な精製または濃縮のためにマーカーまたはタグ(例えば、ビオチン)を含み得る。
【0028】
(工程1D)
上記捕捉エレメントは、制限エンドヌクレアーゼ消化などの公知の技術を使用して直鎖状にされる(平滑末端または粘着末端は、異なるフラグメントの調製のために使用され得る;以下および図1Dを参照のこと)。コンカテマー形成(すなわち、互いに対する複数の捕捉エレメントのライゲーション)を防止するために、上記捕捉エレメントは、TAクローニング用のトポイソメラーゼによって脱リン酸化または改変され得る。
【0029】
(工程1E)
上記捕捉エレメントは、1つの捕捉エレメントと標的DNAの1つのフラグメントとを含む環状核酸を形成するために、工程Aまたは工程Bのフラグメント(またはサイズ分画されたフラグメント)にライゲーションされる(図1E)。上記捕捉エレメントおよび標的DNAは、周知の方法論(例えば、DNAリガーゼによるライゲーション)またはトポイソメラーゼクローニングストラテジーによって連結される。
【0030】
(工程1F)
先の工程の結果は、かなりのサイズのDNAフラグメントにライゲーションされた捕捉エレメントの収集物(collection)をもたらす。本工程は、標的DNAフラグメントの大きい内部領域を削除して、自動化されたDNA配列決定に対してより適切であり得るサイズのクローニングされた挿入部分をもたらすために使用される(図1F)。
【0031】
この工程において、捕捉されたゲノムDNA(すなわち、工程Eによって生成された環状核酸)は、そのゲノムDNA内に1つ以上の切断部位を有し得る1種以上の制限エンドヌクレアーゼによって消化される。一般に、任意の制限エンドヌクレアーゼは、その制限エンドヌクレアーゼが上記捕捉エレメント内を切断しない限り「内部切断」のために使用され得る。内部切断とは、上記標的DNAに対して内部であり、かつ上記捕捉エレメントを切断しない切断をいう。内部切断制限酵素は、捕捉エレメントが選択された制限エンドヌクレアーゼの切断部位を含まないように捕捉エレメントを設計することによって選択され得る。制限エンドヌクレアーゼおよびそれらの使用は、当該分野において周知であり、そしてその使用は、本発明の方法に対して容易に適用され得る。さらに、複数の制限酵素(各々は内部切断に対して制限する)の組み合わせが、標的DNAフラグメントのサイズをさらに減少させるために使用され得る。
【0032】
好ましい実施形態において、上記ゲノムDNAは、これらの制限エンドヌクレアーゼの1種以上によって上記捕捉エレメントから50〜150塩基の範囲内に切断される。
【0033】
(工程1G)
この工程において、公知の配列の二本鎖核酸である「分割エレメント」は、環状核酸を形成するために、先の工程の消化されたゲノム材料の末端の間にライゲーションされる(図1G)。この「分割エレメント」は、2つの目的を果たす。第1に、上記分割エレメントは、ミニサークル(minicircle)のローリングサークル型増幅のためのプライミング部位(priming site)を含み得る(以下、工程Iを参照のこと)。第2に、上記分割エレメントの配列は、公知であるので、その分割エレメントは、対応した(paired)ゲノム末端の末端を標識する同定因子として機能し得る(連結した末端のトリミングおよび容易なソフトフェア分析を可能にするため)。すなわち、ゲノムフラグメントのその後の配列決定の間、上記分割エレメントの配列は、そのゲノムフラグメント全体が配列決定されたこと示す。このような分割エレメントはまた、さらなるエレメント(例えば、制限エンドヌクレアーゼ認識部位および/または制限エンドヌクレアーゼ切断部位、抗生物質耐性マーカー、原核生物または真核生物の複製起点あるいはこれらのエレメントの組み合わせを含み得る。抗生物質耐性マーカーおよび複製起点のようなエレメントの必要に応じた存在にもかかわらず、本発明の方法の利点の1つは、この方法が核酸のクローニング、増幅または他の操作のために宿主細胞(例えば、E.coli)の使用を必要としないことである。上記分割エレメントはまた、両配列末端配列決定法のために、ビオチン化される得るか、あるいはそうでなければ容易な精製または核酸濃縮のためのマーカーまたはタグによってタグ化され得る。
【0034】
(工程1H)
最後の工程から産生された環状核酸(すなわち、ミニサークル)は、一本鎖核酸を生じる傾向にある一本鎖である。これは、溶液の塩、温度またはpHを変えることによる標準的なDNA編成技術を使用して行なわれる。他のDNA変性技術は、当該分野において公知である。変性の後、おなじミニサークル由来のDNA環は、依然として連結しているが、これは、本発明の方法に影響を及ぼさない(図1H)。
【0035】
(工程1I)
プライマーは、そのプライマーにアニーリングされ得る配列をを含む分割エレメントにアニーリングする。したがって、この分割配列は、ローリングサークル型増幅のためのイニシエーターとして機能する(図1I)。
【0036】
(工程1J)
上記サンプルは、長い一本鎖産物を産生するために、ローリングサークル型増幅によって増幅される(図1J)。このローリングサークル型増幅工程の1つの利点は、分割エレメントを含まないエレメントが増幅されずかつ環が閉じていないエレメントがほとんど増幅されないことである。
【0037】
(工程1K)
1つ以上のキャッピングオリゴは、順方向アダプターおよび逆方向アダプター(それらをこれらの領域において二本鎖にする)に隣接(flank)する一本鎖の制限酵素認識部位にアニーリングされる(図1L)。キャッピングオリゴは、上記捕捉エレメントの少なくとも一部、アダプター領域の少なくとも一部、またはそれらの両方と相補的であり得る。
【0038】
(工程1L)
キャッピングされた一本鎖DNAは、キャッピングされた部位にて小さいフラグメントへと切断される(図1M)。これらの小さいフラグメントは、公知の配列の末端を有し、そして従来の増幅技術(例えば、PCR)を使用して容易に増幅され得る。
【0039】
(第2の方法)
第2の実施形態において、両末端配列決定は、以下の工程において行われ得る:
(工程2A−サンプルDNAの断片化)
標的核酸の断片化およびサイズ分画サイズ分画は、先の実施形態に関するものと同じである。
【0040】
(工程2B−メチル化および末端研磨)
所望される場合、断片化された標的核酸は、任意のメチラーゼによってメチル化され得る。好ましいメチラーゼは、制限エンドヌクレアーゼ消化に影響を及ぼすものである。メチラーゼは、少なくとも2つの異なるストラテジーにおいて使用され得る。1つの好ましい実施形態において、メチラーゼは、メチル化された制限酵素認識部位のみを切断する制限エンドヌクレアーゼによる切断を可能にする。別の好ましい実施形態において、メチラーゼは、メチル化されていないDNAを切断するだけの制限エンドヌクレアーゼによる切断を防止する。
【0041】
末端研磨の工程は、第1の方法において記載されるものと同じである。
【0042】
(工程2C−タグアダプターのライゲーション)
この工程において、アダプターが、両方の末端にアダプターを有するフラグメントを生成するために、標的核酸フラグメントの末端にライゲーションされる(図2、I)。上記アダプターは任意のサイズであり得るが、10〜30塩基のサイズが好ましく、そして12〜15塩基のサイズがより好ましい。アダプターおよび/または標的核酸フラグメントのコンカテマーの形成を防止するために、上記アダプターは、平滑末端および適合しない粘着末端(すなわち、5’突出または3’突出を有する末端)を含み得る。上記アダプターが上記DNAフラグメントにライゲーションされ、そしてリガーゼが除去された後、上記粘着末端は、ポリメラーゼおよびdNTPを用いて充填され得る。
【0043】
この節のアダプターは、捕捉フラグメントであり得る。捕捉フラグメントの例は、図4および図5に示される。
【0044】
コンカテマー形成を防止するために、上記アダプターは、ヘアピンアダプターであり得る(図6A)。ヘアピンアダプターの使用(例えば、図6)は、ヘアピンアダプターがダイマーよりも大きい任意のマルチマーを形成できないのでコンカテマーを防止する。コンカテマーを防止するための別の方法は、一方または両方の鎖の5’末端がリン酸化されていないアダプターを使用することである。
【0045】
使用され得る他のアダプターは、より少ない処理工程を使用する利点を有するが、またキナーゼを利用するリン酸化工程を必要とするリン酸化されていないアダプターを含む。
【0046】
本開示において他で考察される通り、アダプターは、メチル化されてもビオチン化されてもそれらの両方であってもよい。
【0047】
(工程2D−エキソヌクレアーゼ消化およびゲル精製)
2つのヘアピンアダプターにライゲーションされるDNAフラグメントは、エキソヌクレアーゼを使用して精製され得る。このエキソヌクレアーゼ精製は、両方の末端上でヘアピンアダプターにライゲーションした二本鎖DNAが露出した5’末端または3’末端を有さないDNA分子であるという利点をとる。ライゲーション混合物中の他のDNA(例えば、一方のみがヘアピンアダプターにライゲーションされた二本鎖DNAフラグメント、ライゲーションされていないDNAフラグメントおよびライゲーションされていないアダプター)は、エキソヌクレアーゼに感受性である(図6B)。したがって、エキソヌクレアーゼに対する上記ライゲーション混合物の曝露は、2つのヘアピンアダプターおよびヘアピンアダプターダイマーにライゲーションしたDNAフラグメントを除くほとんどのDNAを除去する。ヘアピンアダプターダイマーは、そのDNAフラグメントと著しく類似するので、そのヘアピンアダプターダイマーは、サイズ分画サイズ分画カラム(例えば、スピンカラム)またはアガロースゲル電気泳動もしくはアクリルアミドゲル電気泳動などの公知の技術、あるいは当該分野において公知でありそして/または本開示において他で考察される他のポリヌクレオチドのサイズを区別する方法のうちの1つを使用して除去され得る。
【0048】
1つの実施形態において、上記アダプターは、タグを保有するフラグメントの単離/濃縮を容易にするために、ビオチン化され得る。
【0049】
別の実施形態において、上記アダプターを含むフラグメントは、そのフラグメントに、上記タグ配列と相補的な捕捉オリゴヌクレオチドをアニーリングさせることによって精製され得る。
【0050】
(工程2E−環化のためのフラグメントの調製)
標的核酸フラグメントの両方の末端に対してアダプターを付加した後、そのフラグメントは、環化される。
【0051】
自己環化のための標的核酸を調製するために、アダプター領域における切断は、多くの理由により望まれ得る。例えば、ヘアピンアダプターが使用される場合、上記DNAフラグメントは、自由(free)ではない5’末端または3’末端が存在するので自己環化しない。別の例として、上記アダプターが、平滑末端を有するDNAフラグメントを残す場合、切断は、アダプターが5’突出または3’突出を有することを可能にし、そしてこれらの突出(「粘着末端」とも称される)は、ライゲーション効率を大きく促す。さらに、アダプター領域における消化は、2つのアダプター(各末端に1つのアダプターがライゲーションされる)を有するDNAフラグメントの選択を可能にする。これは、上記アダプターが制限エンドヌクレアーゼによる切断が適合する粘着末端を残すように設計され得るからである。アダプター領域における切断の後、1つのアダプターのみを有するDNAフラグメント(望ましくない化学種(species))は、1つの粘着末端および1つの平滑末端を有し、そしてそのDNAフラグメントは、自己環化における困難性を有する。したがって、両方の末端にアダプターを有するDNAフラグメントのみが、環化される。
【0052】
アダプターに対する切断を制限することは、多くの方法によって達成され得る。1つの方法において、上記アダプターは、メチル化され、そしてそのアダプターは、メチル化されていないDNAにライゲーションされる。次いで、その構築物は、メチル化されたDNAのみを切断する制限エンドヌクレアーゼによって消化される。上記アダプターのみがメチル化されるので、上記アダプターのみが切断される。
【0053】
別の方法において、上記DNAフラグメントは、メチル化され得、そして上記アダプターは、メチル化されない。メチル化されていないDNAのみを認識しかつそれをそれを切断する制限エンドヌクレアーゼによる切断は、上記アダプターに対する切断を制限する。これは、最初から既にメチル化されているDNAを使用することによってか、またはインビトロでのメチル化することによって達成され得る。
【0054】
アダプターの消化はいくつかの状況において必要とされないことが、理解される。例えば、先の工程由来のフラグメントが、平滑末端のみを含む場合、上記アダプターの消化は、任意である。
【0055】
上記DNAフラグメントがライゲーション/環化を容易にするように処理され得るがまた、理解される。例えば、上記アダプターが、ブロックされるか、または5’リン酸を含まない場合、そのブロック基が、除去され得るか、またはリン酸が、ライゲーションできるようにそのフラグメントに付加され得る。
【0056】
(工程2F 環化されたフラグメントを形成するための末端のライゲーション)
多くの方法が、環化のために使用され得る。
【0057】
1つの実施形態において、リガーゼが、適切なリガーゼ緩衝液との反応混合物に添加され、そして上記DNAフラグメントが、再環化され得る。
【0058】
1つの実施形態において、ライゲーションは、自己ライゲーションを促進するため、そしてコンカテマーの形成を妨害するために、希薄なDNA濃度にて行なわれる。
【0059】
別の実施形態において、ライゲーションは、油中水型エマルション中で行われ、その水性の液滴は、本開示において他で記載されるように環化されたほぼ1つのフラグメントを含む。
【0060】
1つの実施形態において、表示タグは、標的核酸フラグメントにライゲーションされ、そしてそのフラグメントは、自己環化する(図2を参照のこと)。上記表示タグは、24〜30塩基対の間の二本鎖核酸配列である。この「表示タグ」は、それが、対応したゲノム末端の末端を標識する同定因子として機能し得る(連結した末端のトリミングおよび容易なソフトフェア分析を可能にするため)先の実施形態の「分割エレメント」と同様である。ゲノムフラグメントのその後の配列決定の間において、上記表示タグの配列は、標的核酸配列の2つの末端の間の境界を示す。
【0061】
(工程2G)
表示タグの付加および自己環化の後において、上記標的核酸フラグメントは、さらに消化または断片化される。断片化は、本開示において列挙される任意の断片化手順を使用して行なわれ得る。例えば、上記の工程1Aを参照のこと。あるいは、1種以上の制限エンドヌクレアーゼは、標的DNAを消化してフラグメントを生成するために使用され得る。
【0062】
1つの好ましい実施形態において、噴霧化は、平均フラグメントサイズが約200〜300bpになるまで上記核酸を断片化するために使用される。図2に示されるように、これらのフラグメントのいくつかは、表示タグを含むが、他のフラグメントは、表示タグを含まない。
【0063】
この点において、上記核酸フラグメントは、標準的な方法を使用して配列決定され得る。核酸フラグメントを配列決定するための方法は、公知である。配列決定の1つの好ましい方法は、国際特許出願第WO 05/003375号(2004年1月28日出願)に記載される。
【0064】
(工程2H)
必要に応じた工程において、上記表示タグを含むフラグメントは、表示タグを有さないフラグメントに対して濃縮され得る。濃縮ための1つの方法は、サンプル調製工程においてビオチン化された表示タグの使用を含む。断片化の後に、上記表示タグを含むフラグメントは、ビオチン化される、そしてそのフラグメントは、溶液中のストレプトアビジンカラムまたはストレプトアビジンビーズを使用して精製され得る。
【0065】
濃縮の後、上記核酸フラグメントは、国際特許出願第WO 05/003375号(2004年1月28日出願)に記載もののような自動化された技術を含む標準的な技術を使用して配列決定され得る。
【0066】
(第3の方法)
両末端配列決定は、第3の方法によって行なわれ得る。
【0067】
(工程3A〜工程3E)
この方法において、工程A〜工程Eは、第2の方法において記載された通り(すなわち、工程2A〜工程2Eの通り)に行われ得る。さらに、第3の方法において、各アダプターは、制限エンドヌクレアーゼ認識部位から約15〜25bp離れて直接DNAを切断し得るIIS型制限エンドヌクレアーゼ部位を含む。異なるIIS型制限エンドヌクレアーゼがエンドヌクレアーゼ認識部位からの種々の距離にて切断すること、およびこの距離に適応する異なるIIS型制限エンドヌクレアーゼの使用が企図されることが、公知である。
【0068】
(工程3F 環化されたフラグメントを形成するための末端のライゲーション)
工程3Fは、表示タグが使用されないことを除いて第2の方法(工程2F)に従って行われ得る(図6Dを参照のこと)。
【0069】
(必要に応じた濃縮工程))
本発明の任意の方法において、エキソヌクレアーゼは、環化されていないフラグメントを除去するため、そしてコンカテマーになったフラグメントの存在を減少させるために、ライゲーション後に使用され得る。適切に再環化されたDNAフラグメントは、露出した5’末端または露出した3’末端を有さないので、そのDNAフラグメントは、エキソヌクレアーゼ消化に対して抵抗性である。さらに、より大きいコンカテマーは、ニックに起因して、露出した5’末端または露出した3’末端を有するより高い機会を有する。エキソヌクレアーゼ処理はまた、ニックを有するこれらのコンカテマーを除去する。
【0070】
(必要に応じたローリングサークル型増幅)
上記環化されたDNAは、ローリングサークル型増幅によって増幅され得る。簡単にいうと、オリゴヌクレオチドが、上記再環化されたDNAの一方の鎖にハイブリダイズさせるために使用され得る。このオリゴヌクレオチドプライマーは、ポリメラーゼによって伸長される。鋳型は、環状であるので、上記ポリメラーゼは、標的DNAの複数の反復を有する一本鎖コンカテマーを産生する。この一本鎖コンカテマーは、第2のプライマーをそれにハイブリダイズさせ、そしてこの第2のプライマーから伸長させることによって二本鎖になり得る。例えば、この第2のプライマーは、この一本鎖コンカテマーのアダプター配列と相補的であり得る。得られた二本鎖コンカテマーは、次の工程に直接使用され得る。
【0071】
(工程3G DNAの消化/フラグメント)
この工程において、ローリングサークル型増幅由来の環化された核酸またはコンカテマーになった核酸は、IIS型制限エンドヌクレアーゼによって消化される(図6D)。工程3Aについて記載される通り、各アダプターは、少なくとも1つのIIS型制限エンドヌクレアーゼ切断部位を含む。IIS型制限エンドヌクレアーゼは、上記アダプター上のIIS型制限エンドヌクレアーゼ切断部位を認識し、そして約10〜20塩基対離れて核酸を切断する。IIS型制限エンドヌクレアーゼの例は、MmeI(約20bp)、EcoP151(25bp)またはBpmI(14bp)を含む。
【0072】
この工程は、2つの末端の間にアダプター領域を有するより大きいDNAフラグメントの2つの末端を含むDNAの短いフラグメント(10〜100bp)を生成する(図6E)。同じ構造を生成するための代替的な方法は、本開示において他に記載される(例えば、工程1Aに記載される)ような多くのDNA断片化方法のいずれかを使用して上記環化された核酸をランダムに断片化することである。これは、任意のサイズ(100bp、150bp、200bp、250bp、300bp以上)のフラグメントが作製されることを可能にする。
【0073】
いずれかの方法によって、その中間にアダプター領域を有さない他のDNAフラグメントもまた、生成される(図6E)。しかし、上記アダプター領域は、ビオチン化されるので、アダプター領域を含むDNAは、例えば、ストレプトアビジンビーズ、アビジンビーズ、BCCPビーズなどのビオチンに対する親和性を有する固体支持体を使用して選択的に精製され得る。
【0074】
(工程3H.配列決定)
本発明の任意の方法の産物は、手動か、または自動化された配列決定技術によって配列決定され得る。サンガー配列決定法またはまきサム−ギルバート配列決定法のような方法による手動の配列決定法は、周知である。自動化された配列決定法は、例えば、454 Life Sciences Corporation(Branford、CT)によって開発された454 SequencingTMのような自動化された配列決定法(これはまた、出願WO/05003375(2004年1月28日出願)ならびに同時係属中の米国特許出願USSN:10/767,779(2004年1月28日出願)、同USSN:60/476,602(2003年6月6日出願);同USSN:60/476,504(2003年6月6日出願);同USSN:60/443,471(2003年1月29日出願);同USSN:60/476,313(2003年6月6日出願);同USSN:60/476,592(2003年6月6日出願);同USSN:60/465,071(23、2003年4月23日出願);および同USSN:60/497,985(25、2003年8月25日出願)に記載される))を使用することによって行なわれ得る。
【0075】
簡単にいうと、自動化された配列決定手順(例えば、454 Life Sciences Corp.によって開発された配列決定手順)において、1つの配列決定アダプター(配列決定アダプターA)は、上記DNAフラグメントの1つの末端にライゲーションされ得、そして第2の配列決定アダプター(配列決定アダプターB)は、そのDNAフラグメントの第2の末端にライゲーションされ得る。ライゲーションの後、上記DNAフラグメントは、ビオチンを固体支持体に結合することによってあらゆるライゲーションされていない配列決定アダプターから精製され得る。上記単離された核酸フラグメントは、個々の反応チャンバー中におかれ得、そして配列決定アダプターAおよび配列決定アダプターBに対して特異的なプライマーを使用したPCRによってさらに増幅され得る。AアダプターまたはBアダプターのいずれかにビオチンを結合させることによって、優勢にA−Bフラグメントから構成される一本鎖DNAが、単離され得る。この増幅された核酸は、上記2つの末端の間に位置する配列決定アダプターA、配列決定アダプターBに特異的な配列決定プライマーまたはそれらのアダプターに特異的な配列決定プライマー(例えば、ヘアピンアダプター)を使用して配列決定され得る。
【0076】
一旦より大きいDNAフラグメントの末端を含む複数のこれらのフラグメントが調製されると、それらは、配列決定され得、そしてその両末端配列情報は、ゲノムの部分的かまたは完全な配列地図を作成するためにアセンブリされ得る。
【0077】
(第4の方法)
両末端配列決定は、図12に概説されるような両末端読み取りPETランダム断片化(Paired−Read PET Random Fragmentation)と称される上記に記載された方法のバリエーションを使用して行なわれ得る。この第4の方法に従う実験からの結果は、図13に示される。
【0078】
(工程4A〜工程4E)
この方法において、工程A〜工程Dは、第2の方法または第3の方法(すなわち、工程2A〜工程2Dまたは工程3A〜工程3D)において記載される通りに行われ得る。代替として、工程4Dは、エキソヌクレアーゼ処理したフラグメントを精製するために、SPRI(可逆的固定法(solid−phase reversible immobilization))を使用して行なわれ得る。例えば、図12中の核酸フラグメントは、ビオチン化されたプライマーにライゲーションされ、そしてその核酸フラグメントは、例えば、ストレプトアビジンでコーティングされたビーズ、アビジンでコーティングされたビーズ、減少した親和性のストレプトアビジンでコーティングされたビーズまたは減少した親和性のアビジンでコーティングされたビーズを使用して精製され得る。
【0079】
工程4Eは、工程2Eまたは工程3Eに記載される通りに行われ得る。
【0080】
工程4Fは、工程3Fに記載される通りに行われ得る。簡単にいうと、最後の工程において産生された直鎖状DNAフラグメントは、工程2Fまたは工程3Fに関して上記に記載されるような環化の任意の公知の方法を使用して環化され得る。
【0081】
さらに、上記の工程3Fに記載されるような必要に応じた濃縮工程は、環状核酸について濃縮するために行われ得る。簡単にいうと、環化されない核酸は、自由な末端を有する核酸を分解するエキソヌクレアーゼによって除去され得る。共有結合で閉じた環状核酸は、自由な末端を有さず、そしてエキソヌクレアーゼの攻撃に対して抵抗性である。これに起因して、エキソヌクレアーゼによる処理は、直鎖状核酸を除去しつつ環状核酸を濃縮する。
【0082】
(工程4G)
自己環化の後、断片化は、本開示に列挙される任意の断片化手順を使用して行なわれ得る。1つの好ましい方法は、フラグメント上記環状核酸を機械的せん断を使用して断片化することである。機械的せん断は、例えば、ボルテックスすることによってか、小さい開口部を通して溶液中の核酸に力を銜えることによってか、または本開示において他で記載される他の類似する手順によって行なわれ得る。機械的せん断の1つの利点は、異なる長さの核酸が生成され得ることである(図12における工程Gの後の核酸を参照のこと)。
【0083】
その中間にアダプター領域を有さないDNAフラグメントもまた、生成される。図12を参照のこと。しかし、上記アダプター領域はビオチン化されるので、アダプター領域を含むDNAは、例えば、ストレプトアビジンビーズ、アビジンビーズ、BCCPビーズなどのようなビオチンに対する親和性を有する固体支持体または半固体支持体を使用して選択的に精製され得る。
【0084】
(工程4H)
方法4の産物は、利用可能な任意の手動または自動の方法を使用して配列決定され得る。このような方法は、上記の工程3Hにおいて詳細に記載される。
【0085】
上に記載されそして図12に概説されるような両末端読み取りPETランダム断片化は、多くの利点を提供する。第1に、方法4は、アセンブリにおける、より高い信頼性を可能にする。なぜならば、機械的せん断は、より長いフラグメントを生じ得、そのフラグメントは、次に、より長い読み取りを可能にするからである。より長い読み取りは、より高い信頼性を有する標的配列のアセンブリを可能にする。第2に、機械的せん断によって可能な作製されるより長いフラグメントは、核酸のより長い領域を測定する両末端(paired end)読み取りを生じる。核酸のより長い領域を測定することによって、方法4は、ギャップ閉鎖(gap closure)を容易にし、そしてまた、分析が困難である核酸の領域を測定するより高い可能性を有する。これらの困難な領域は、例えば、反復領域または高いGC含量の領域であり得る。この様式において、方法4は、改善されたギャップ閉鎖性能の利点を提供する。第3に、方法4は、ギャップ閉鎖を提供するその能力に起因して、それぞれの個々の末端がアセンブリを構築するために使用され得る場合に、完全なゲノムを配列決定するために専ら使用され得る。
【0086】
方法4の利点の例は、図13において見られ得る。図13は、方法4を使用して配列決定されたE.Coli K12ゲノムDNAを示す。見られ得る通り、顕著により長い読み取り長さの分布(50未満〜約400)は、この方法を使用して可能である。さらに、約3kbのフラグメント長が、生成され得、そしてそれらの末端が、配列決定され得る。これは、方法4が他の方法と比較して優れたギャップ閉鎖性能を提供することを示す。
【0087】
(第5の方法)
両末端配列決定は、図15において概説されるような上に記載された方法のバリエーションを使用して行なわれ得る。
【0088】
この方法において、上記アダプターは、ヘアピンの二本鎖領域の逆鎖上にデオキシイノシンヌクレオチド(本明細書中でイノシンとも称される)を組み込むデオキシイノシンヘアピンアダプターとして設計され得る。E.coliエンドヌクレアーゼV(EndoV)は、イノシンヌクレオチドから2番目のヌクレオチドの3’と3番目のヌクレオチドの3’との間に一本鎖切断(ニック)を導入する(Yao MおよびKow YW;J Biol Chem.1995、270(48):28609−16; Yao MおよびKow YW、J Biol Chem.1994、269(50):31390−6;Yao Mら、Ann N Y Acad Sci.1994、726:315−6;Yao Mら、J Biol Chem.1994,269(23):16260−8)。
【0089】
図14に示される通り、上記ヘアピンアダプター中のイノシンの相対配置は、3’一本鎖突出(図14Aおよび図14B)、5’一本鎖突出(図14Cおよび図14D)、または平滑末端(突出なし)(図14E)が両方の鎖のEndoV切断の際に産生されるか否かを決定する。上記ヘアピンアダプターの配列はまた、EndoV切断の際に非パリンドローム(図14Aおよび図14B)またはパリンドローム(図14Aおよび図14C)の一本鎖突出を生成するように設計され得る。デオキシイノシンが4種の塩基(A、G、CおよびT)のいずれかおよびデオキシイノシン自体と対形成することは、当該分野において周知である(WatkinsおよびSantaLucia、2005、Nucleic Acids Res.33(19):6258−67)。さらに、上記アダプターは、本開示において他で開示されるように、IIS型制限エンドヌクレアーゼ認識部位(例えば、MmeI)を含み得る。
【0090】
(工程5A(図15 工程A))
この方法において、工程Aは、実質的に、工程1Aに関して記載されるように行なわれ得る。標的DNAは、上に記載されるように、当該分野において公知である任意の物理的方法または生化学的方法によって断片化され得る。必要に応じて、得られたフラグメントは、本開示において他で記載される任意のサイズ分画方法によってサイズ分画され得る。
【0091】
(工程5Bおよび工程5C(図15 工程B+工程C))
標的DNAの末端は、本明細書中に記載される任意の研磨方法によって研磨され得、そしてその末端は、アダプターでタグ化された標的DNAを形成するために、上に記載されるデオキシイノシンヘアピンアダプターにライゲーションされ得る。
【0092】
(工程5D(図15 工程D))
上記ライゲーション反応は、1種以上のエキソヌクレアーゼ(本明細書中で他に考察されるような)によって処理され得、そして所望の反応産物を濃縮するために、本明細書中で記載される任意の方法によってサイズ分画され得る。
【0093】
(工程5E(図15 工程E))
上記アダプターでタグ化された標的核酸は、EndoVによって切断される。切断反応についての条件は、Yaoらによって記載される条件のいずれか(Yao MおよびKowYW、J Biol Chem.1995、270(48):28609−16;Yao MおよびKow YW、J Biol Chem.1994、269(50):31390−6;Yao Mら、Ann N Y Acad Sci.1994、726:315−6;ならびにYao Mら、J Biol Chem.1994、269(23):16260−8)であり得る。当業者は、同様の条件がまた使用され得ることを認識する。
【0094】
(工程5F〜工程5H(図15 工程F〜工程5H))
この第5の方法において、工程F〜工程Hは、第2の方法、第3の方法、または第4の方法において記載される(すなわち、工程2F〜工程2Hまたは工程3F〜工程3Hまたは工程4F〜工程4H)ように行なわれ得る。
【0095】
上記第5の方法のデオキシイノシンヘアピンアダプターは、有益である。なぜならば、EndoVは、DNA中のイノシンまたは損傷もしくは塩基の誤対合の特定の部位の存在下においてのみ切断するからである。したがって、標的核酸は、上記EndoV処理によって切断されない。したがって、EndoV部位が、上記アダプターに特有である場合、標的DNAは、いくつかの上記の実施形態におけるようなメチル化によって保護されない。上記メチル化工程の排除は、時間を節約し、そして標的DNAの不完全なメチル化に関する問題が、排除される。さらに、EndoV消化は、EcoRI消化と比較して非常に迅速であり、したがってこの方法を実施するのに必要とされる時間を短縮する。
【0096】
デオキシイノシンヘアピンアダプターアプローチによって得られる両末端読み取りの結果の例は、図16に示される。E.coli K12ゲノムDNAは、第5の方法に従って調製および配列決定された(図15)。両末端読み取りの間の平均距離は、2070bp(標準偏差=594)であった。
【0097】
(第6の方法)
さらなる実施形態において、両末端配列決定は、図17および図18において記載される通り、以下の工程のいくつかまたは全てを包含する方法によって行なわれ得る。
【0098】
(工程6A−標的DNAの断片化(図17A))
第6の方法に従って、標的DNAサンプル(例えば、ゲノムDNA)のポリヌクレオチド分子は、約500塩基より長いか、約1000塩基より長いか、約2000塩基より長いか、約5000塩基より長いか、約10000塩基より長いか、約20,000塩基より長いか、約50,000塩基より長いか、約100,000塩基より長いか、約250,000塩基より長いか、約100万塩基より長いか、または約500万塩基より長い分子へと断片化される。好ましい実施形態において、上記フラグメントは、約1.5kb長〜約5kb長の範囲である。上記断片化は、本開示において他で記載される任意の物理的方法および/または生化学的方法によって達成され得る。好ましい実施形態において、標的DNAは、物理的な力(例えば、HydroShear(登録商標)装置(Genomic Solutions)の使用)によってランダムにせん断される。上記せん断されたDNAは、次いで、所望のフラグメントサイズに関して精製され得る。この必要に応じたサイズ選択は、当該分野において公知でありそして本明細書中に記載される任意のサイズ選択方法(例えば、電気泳動および/または液体クロマトグラフィー)によって達成され得る。好ましい実施形態において、上記せん断されたDNAサンプルは、SPRI(登録商標)サイズ排除ビース(Agencourt;Hawkinsら、Nucleic Acids Res.1995(23):4742−4743)における精製によってサイズについて選択される。例えば、約2〜2.5kbのフラグメントの末端(対である)を配列決定することは、代表的な細菌ゲノム配列決定実験においてコンティグの順序付けを可能にし得る。より大きいフラグメントは、より高等な生物体(例えば、真菌、植物および動物)のゲノムの配列決定に有益であり得る。
【0099】
(工程6B−特定の制限酵素認識部位のメチル化(図17B))
下に記載されるように、標的DNAフラグメントに対するアダプターのライゲーションの後、そのアダプターは、環化のための調製において1種以上の制限酵素によって切断され得る。選択した制限酵素による標的DNAの消化を防止するために、その標的DNAは、対応するメチラーゼを用いた改変によって消化に対して保護される。好ましい実施形態において、上記アダプターは、ヘアピンアダプターであり、そしてそのアダプターは、EcoRI制限酵素認識部位を保有する(図18A)。したがって、好ましい実施形態において、サンプルDNAフラグメントに存在するEcoRI制限酵素認識部位は、EcoRI付着末端が上記ヘアピンアダプターから産生される場合、それらの完全性を保存するために、ライゲーションによる環化の前にEcoRIメチラーゼを使用してメチル化される。
【0100】
(工程6C−フラグメント末端の研磨およびリン酸化(図17C))
DNAの流体力学的なせん断は、磨り減った末端(一本鎖突出)を有するいくつかのフラグメントをもたらす。平滑末端は、その後のアダプターライゲーションに好ましい。したがって、必要に応じて、任意の磨り減った末端は、酵素的にDNAポリメラーゼを用いて「充填(filling−in)」するかそして/またはエキソヌクレアーゼ(例えば、Mung Beanヌクレアーゼ)を用いて「チューイングバック(chewing−back)」するかのいずれかによって、平ら(blunt)にされ得、そしてライゲーションのために準備され得る。有益には、いくつかのDNAポリメラーゼは、エキソヌクレアーゼ活性も有する。必要に応じて、平滑化反応に次いで、好ましくは上記フラグメントの5’末端は、ポリヌクレオチドキナーゼによってリン酸化される。好ましい実施形態において、T4 DNAポリメラーゼおよびT4ポリヌクレオチドキナーゼ(T4 PNK)は、それぞれ、充填およびリン酸化のために使用される。T4 DNAポリメラーゼは、その5’→3’ポリメラーゼ活性によってDNAの3’−陥凹末端(5’−突出)を「充填する」ために使用されるが、その一本鎖3’→5’エキソヌクレアーゼ活性は、3’−突出末端を除去する。T4 PNKのキナーゼ活性は、5’−ヒドロキシ末端にリン酸基を付加する。
【0101】
(工程6D−ヘアピンアダプターライゲーション(図17Dおよび図18A))
本発明に従って、二本鎖オリゴヌクレオチドアダプターは、標的DNAフラグメントの末端にライゲーションされる。好ましい実施形態において、上記アダプターは、ヘアピンアダプターである(図18A)。ヘアピンアダプターの1つの利点は、アダプター−アダプターライゲーション事象がアダプターダイマーのみを生じる(すなわち、マルチマーアダプターコンカテマーの形成が防止される)ことである。さらに、それらのヘアピン構造は、ライゲーションしていないフラグメントを除去するために使用されるエキソヌクレアーゼ消化からサンプルフラグメントを保護する(工程6E)。図18Aに示される1つの好ましいヘアピンアダプターの設計は、EcoRI制限酵素認識部位およびMmeI制限酵素認識部位を含む。EcoRIは、各フラグメントの末端上に付着末端を形成して(工程6F)、それらの環化を可能にする(工程6G)ために使用され得、MmeIは、その認識部位から20bp離れてDNAを切断するIIs型制限酵素である;それは、環化されたサンプルフラグメントの末端に切込みを入れて配列決定される両末端タグを産生するために使用される。当業者は、EcoRIが、上記アダプターオリゴヌクレオチドのヌクレオチド配列における同時変化、および標的DNAフラグメントの保護のための適切なメチラーゼの使用を伴って任意の多数の他のエンドヌクレアーゼによって置換され得ることを、認識する。同様に、MmeIは、選択した酵素が、下流配列のアセンブリに十分な長さである両末端を産生するのに十分なその制限酵素認識部位からの距離にて切断する限り、他のIIs型制限酵素によって置換され得る。好ましい実施形態において、上記ヘアピンアダプターは、例えば、図18Aに示される部位にてビオチン化される。他のビオチン化部位もまた、適切であり、そしてそのビオチン化部位は、当業者によって選択され得る。上記ビオチン部分は、両末端アダプターのライゲーションの間、充填反応(フラグメントの修復)の間、および両末端ライブラリーの増幅の間に、アダプターを含有する両末端フラグメントの必要に応じた選択および両末端ライブラリーフラグメント(MmeI消化後)の必要に応じた固定化を可能にする。
【0102】
(工程6E−エキソヌクレアーゼ選択(図17E))
好ましくは、エキソヌクレアーゼ消化は、両方の末端にてヘアピンアダプターと適切に適合していないあらゆるDNAを除去するために、ヘアピンアダプターのライゲーションに続き;そしてSPRIサイズ排除ビーズにおける精製は、小さな望まれない分子種(例えば、アダプター−アダプターダイマー)を除去する。上記エキソヌクレアーゼ消化は、当該分野において周知である種々のエキソヌクレアーゼの1種以上によって行なわれ得る。好ましくは、その消化は、3’→5’方向および5’→3’方向の両方において一本鎖DNAおよび二本鎖DNAの消化を同時に可能にする活性の組み合わせによって達成される。好ましい実施形態において、エキソヌクレアーゼ混合物は、E.coliエキソヌクレアーゼI(3’→5’一本鎖エキソヌクレアーゼ)、ファージλエキソヌクレアーゼ(5’→3’一本鎖エキソヌクレアーゼおよび5’→3’二本鎖エキソヌクレアーゼ)およびファージT7エキソヌクレアーゼ(5’→3’二本鎖エキソヌクレアーゼ、ギャップおよびニックにて開始され得る)を含む。
【0103】
(工程6F−EcoRI消化(図17F))
好ましい実施形態において、EcoRlによるエンドヌクレアーゼ的切断は、上記ヘアピンアダプターを切断すること(図18A)によって各フラグメントの末端上に付着末端を形成し、そしてフラグメントの環化を可能にするために使用される。EcoRIによる消化は、上記フラグメントの末端においてヘアピン構造を除去し、付着末端を残す。サンプルDNAに存在する内部のEcoRI部位は、工程6Bにおいてより早期に行なわれるメチル化によって保護される。
【0104】
(工程6G−環化(図17G))
次いで上記フラグメントは、それらの付着EcoRI末端の分子内ライゲーション環化される。したがって、上記ライゲーションの部位は、2つの部分的なヘアピンアダプター(再構成されたEcoRI部位と直結する;合計44bp)を有し、それらの部分的なヘアピンアダプターは、サンプルフラグメントの末端によっていずれかの側においてフランキングされる(flanked)。別のエキソヌクレアーゼ消化は、あらゆる環化されていないDNAを除去するために行なわれる。
【0105】
(工程6H−MmeI消化(図17H))
次いで上記環化されたDNAフラグメントは、MmeIによって制限される。このIIs型制限酵素は、その制限酵素認識部位から約20bp離れて切断する(2ntの3’−突出を残す、すなわちその切り口は、20/18ntにある;その酵素はまた、その部位から19〜22bpの範囲の切り口を有するいくつかの少数の産物を産生する)。MmeI部位は、サンプルDNAフラグメントにライゲーションされるヘアピンアダプターの末端に存在する(図18A);これらの部位における制限は、両末端DNAライブラリーフラグメントを産生し、その両末端DNAライブラリーフラグメントは、それぞれ、ライゲーションされた「二重(double)」ヘアピンアダプター(44bp)およびサンプルフラグメントの2つの20bp末端(合計で84bpの長さにわたる)を含む。
【0106】
(工程6I−ストレプトアビジンビーズによる単離(図17I))
ビオチンタグを欠如することで、ライゲーションされた「二重」ヘアピンアダプターを有さないMmeI制限フラグメントは、必要に応じて、この工程において排除され得る。両末端フラグメントのライブラリーは、ストレプトアビジンビーズまたはアビジンビーズに対する上記ヘアピンアダプターに存在するビオチンタグの結合によって、固定化され得る(そして、他のMmeI制限フラグメントから単離され得る)。
【0107】
(工程6J−両末端アダプターのライゲーション(図17J))
この工程において、工程6Hにおいて産生され、そして必要に応じて工程6Iにおいて精製された両末端ライブラリーフラグメントの末端は、両末端ライブラリーアダプターまたは両末端アダプターと称される二本鎖アダプターにライゲーションされる(図18B)。これらの両末端アダプターは、増幅およびヌクレオチド配列決定の両方を補助するプライミング領域を提供し、そしてその両末端アダプターはまた、454 SequencingTM System上で良好に見出すために有用な短い(例えば、4ヌクレオチド)「配列決定キー(sequencing key)」配列を含み得る。上記アダプターは、「縮合(degenerate)」した2塩基の一本鎖3’突出を有し得る。縮合は、2つの突出する塩基がランダムである(すなわち、それらが、それぞれ、G、A、T、またはCのいずれかであり得る)ことを意味する。MmeI以外の酵素が使用された場合、当業者は、他の酵素と適合性である両末端アダプターを容易に設計し得る。図18Bに示される例示のアダプターは、各アダプターを有する両末端ライブラリーフラグメントに対する指向性ライゲーションを強力に指示するように設計され、その各アダプターは、MmeIによって産生された両末端ライブラリーフラグメントの末端に専らライゲーションし得る、それらの3’末端における縮合した2bpの3’−突出を含む(但し、そのアダプターの5’末端は、リン酸化されていない、以下を参照のこと)。アダプターは、両末端ライブラリーフラグメントの利用を最大化すること、および両末端ライブラリーフラグメントのコンカテマーを形成する可能性を最小化することの両方のために、大きく過剰なモルのアダプター(15:1のアダプター:フラグメント比)を含むライゲーション反応において両末端ライブラリーフラグメントと合わせられ得る。上記アダプター自体は、アダプターダイマーの形成を最小化するために、リン酸化されない可能性があるが、結果として、ライゲーション産物は、次いで、充填反応(工程6K)によって修復されなければならない。
【0108】
(工程6K−充填反応(図6K))
工程6Jにおいてライゲーションされた両末端アダプターが、リン酸化されていない場合、ギャップが、両末端ライブラリーDNAフラグメントとのそれらの3’結合部に存在する。これらの2つの「ギャップ」または「ニック」は、鎖置換型DNAポリメラーゼを使用して修復され得、ここでそのポリメラーゼは、そのニックを認識し、ニックを有する鎖を(各アダプターの自由な3’末端に)置換し、そしてニックの修復および完全長dsDNAの形成を生じる様式でその鎖を伸長する。好ましい実施形態において、Bst DNAポリメラーゼ(ラージフラグメント(Large Fragment))が、使用される。当該分野において公知である他の鎖置換型DNAポリメラーゼもまた、この工程に適している(例えば、phi29 DNAポリメラーゼ、DNAポリメラーゼI(クレノウフラグメント)、またはVent(登録商標)DNAポリメラーゼ)。
【0109】
(工程6L−増幅(図6L))
必要に応じて、「適合した(adapted)」両末端DNAライブラリーは、増幅され得る。好ましくは、その増幅は、PCRによって行なわれるが、当該分野において公知でありそして/または本明細書中に記載される他の核酸増幅方法もまた、使用され得る。好ましくは、図18Bに示されるF−PCRおよびR−PCRのオリゴヌクレオチドは、PCRプライマーとして使用され得る。
【0110】
次いで、「適合した」両末端DNAライブラリーは、増幅される(上の段落に記載されるように)か否かにかかわらず、配列決定される。好ましくは、上記ライブラリー由来の個々の分子が、配列決定される。選択したDNA配列決定方法が、それぞれ個々の配列決定反応において複数の同一の鋳型分子を必要とする場合、上記ライブラリー由来の分子は、クローン的に増幅され得る。好ましくは、そのクローン増幅(clonal amplification)は、国際特許出願第WO 2005/003375号、同第WO 2004/069849号、同第WO 2005/073410号(各々は、全部で参考として本明細書中に援用される)に記載されるようなビーズエマルションPCRによって行なわれる。
【0111】
上に記載される6個の方法の対応する工程の任意の組み合わせもまた企図され、そして本発明に包含されることが、理解されるべきである。
【0112】
上記の開示から理解され得るように、類似性が、方法1と、方法2と、方法3と、方法4と、方法5と、方法6との間に存在する。特に、方法2、方法3、方法4、方法5および方法6のうちの類似する工程は、特に類似しており、そしてそれらの工程は、等価な結果または好ましい結果をもたらすために、それらの方法の間において、組み合わせられ得、そして交換され得る。
【0113】
両末端配列決定の一般的な方法が記載されているので、この方法のバリエーションが記載される。
【0114】
1つのバリエーションにおいて、上記ヘアピンアダプターは、突出アダプターによって置換され得る(図8)。上記突出アダプターは、ビオチン化される得、そしてその突出アダプターは、例えば、以下の構造を有し得る:
【0115】
【化1】

上の鎖(配列番号28)の6個の3’末端ヌクレオチド(すなわち、TCCAAC)は下の鎖(配列番号29)の相補ヌクレオチドと組み合わせて、II S型制限酵素MmeIに対する認識部位を形成する。
【0116】
バリエーションは、方法3と同様の様式で行われる。第1のゲノムDNA(図8A)は、断片化および研磨され(図8B)、そして突出アダプターは、そのフラグメントの末端にライゲーションされる(図8C)。突出アダプターのダイマーは、サイズ分画クロマトグラフィー(すなわち、スピンカラム)または電荷ベースのクロマトグラフィーによって除去され得る。突出アダプターのより高いコンカテマーは、5’突出におけるリン酸の欠如に起因して形成されない可能性がある。上記突出プライマーダイマーの除去後(図8D)、上記フラグメントは、キナーゼを用いた処理によって自己ライゲーションに効果がある(図8E)。自己ライゲーション(すなわち、環化)が、実施され、次いでエキソヌクレアーゼ消化が、ライゲーションされていない非環状DNAを除去するために実施され得る。Since突出アダプターにライゲーションされないDNAフラグメントは、研磨に起因して平滑末端を有するので、それらは、それぞれの側にライゲーションされた2つの突出アダプターを有するフラグメントの5’突出末端(粘着末端)と同程度に効率的にライゲーションするとは期待されない。環化の後、MmeI消化は、上記突出アダプターより遠位のDNA を除去し(図8Fを参照のこと)、ライゲーションされた突出アダプターのそれぞれの側に元のゲノムDNAのうちの約20塩基を残す(図8G)ために使用される。突出アダプターを有するフラグメントは、ビオチン化されたアダプターに結合するストレプトアビジンを使用して精製される(図8H)。
【0117】
得られたフラグメントは、例えば、本開示において提供される方法(例えば、工程3H)のような利用可能な任意の方法によって配列決定され得る。
【0118】
本発明の方法によって産生された核酸は、その配列の末端と相補的な1つ以上のプライマーを使用して配列決定され得る。すなわち、工程3Hに記載される配列決定プロトコルにおいて、配列決定アダプターAおよび配列決定アダプターBは、フラグメントが配列決定される前にフラグメントの末端にライゲーションされる。上記フラグメントの末端配列は配列決定アダプターAまたは配列決定アダプターBのいずれかであることが公知であるので、配列決定アダプターAまたは配列決定アダプターBに相補的な配列決定プライマーは、そのフラグメントを配列決定するために使用され得る。さらに、ライゲーションされたアダプターを含む各フラグメントの中間にある配列は、公知である(例えば、図7の703を参照のこと)。配列決定はまた、この中間領域に相補的なプライマーを使用して中間から始まり得る。さらに、末端領域由来の配列決定プライマーおよび中間領域由来の配列決定プライマーは、同時に配列決定されるようにフラグメントにハイブリダイズされ得る(図9を参照のこと)。一方のプライマーは、保護されるが、他方のプライマーは、保護されない。図9において、末端にハイブリダイズしたプライマーは、リン酸基によって保護される。配列決定の第1ラウンドは、上記保護されていないプライマー(図9、中間プライマー)から始まる。配列決定の第1ラウンドの後、上記第1のプライマーの伸長は、必要に応じて、例えば、相補ジデオキシヌクレオチドの組み込みによって終結され得る。あるいは、上記第1のプライマーの伸長は、鋳型鎖の末端へと進み、不必要な終結を行い得る。上記第2の保護されたプライマーは、上記フラグメントの末端から配列を決定するために、配列決定の第2ラウンドにおいて脱保護および伸長され得る。この方法は、一本鎖であり得る単一の鋳型からの2つの長い両末端配列決定の読み取りを可能にする。
【0119】
第2のバリエーションにおいて、断片化された出発DNA(図10A)は、3’CC突出および必要に応じて、内部のIIS型制限エンドヌクレアーゼ部位を有するアダプターにライゲーションされる。ライゲーションされたフラグメントは、自己ライゲーションも自己環状もできない。なぜならば、それらの末端が、適合性ではない(相補的でない)からである。しかし、これらのフラグメントは、両側に5’GG突出を有するリンカーを使用してライゲーションされ得る(図10B)。ライゲーションの後、上記核酸フラグメントは、上で考察される標準的なゲルクロマトグラフィーおよびカラムクロマトグラフィーによってか、または環化されていない分子を切断するエキソヌクレアーゼ消化によって、非環状DNAから精製され得る。得られた環状DNA(図10D)は、他の方法におけるようにMmeIによって切断され得、そして得られたDNAは、配列決定され得る。
【0120】
別のバリエーションにおいて、本発明の方法は、ssDNAに適合されるA/Bを生成するために、使用され得る(図11、工程1)。この一本鎖フラグメントは、A/Bアダプターに相補的な配列を含むオリゴへのハイブリダイゼーションによって環化され得(図11、工程2)、そしてリガーゼの存在下においてライゲーションされ得る。ライゲーションを容易にすることに加えて、上記オリゴは、環化されたssDNAのローリングサークル型増幅(図11、工程3)を容易にするために、プライマーとして使用され得る。ローリングサークル型増幅されたDNAは、方法1、工程1Kおよび工程1L(図1Lおよび図1M)に関して記載されるように切断され得る。増幅の後、標準的なライブラリー調製技術および配列決定技術は、その産物に適用され得る(図11、工程4)。
【0121】
本発明のいくつかの実施形態は、E.coli K12株ゲノムの両末端配列決定実験における驚くべき知見に基づき、ここでその実験プロトコルは、本明細書中に記載される方法に従うMmeI切断の使用を含み、そのゲノムにわたる読み取り包括度(read coverage)の深さは、大きく変化した(図20、「キャリアなし(−)」)。実質的にゲノムの同じ領域に対してマッピングされる配列読み取りの数が、深さによって意味される。この深さのバリエーションは、ゲノムにわたるMmeI部位の密度に相関した(図20)。予想外でありかつ驚くべきことに、本発明者らは、MmeI部位を含むことが既知である二本鎖DNA(図20において示された「(+)」)(すなわち、E.Coli B株DNA(「EcoliBStrain(+)」)、サケ精子DNA(「SalSprmDNA(+)」)、またはMmeI部位を含むことが既知であるPCR増幅産物(「AmpPosMmeI(+)」))の付加がゲノムにわたる包括度の深さのバリエーションを大きく減少およびランダム化したことを発見した。しかし、MmeI部位を欠く二本鎖DNA(図20において示された「(−)」)(すなわち、ポリ(dIdC)(「dIdC(−)」)、またはMmeI部位を含まないことが既知であるPCR増幅産物(「AmpNegMmeI(−)」))の付加は、「キャリアなし」のコントロールと比較してゲノムにわたる包括度の深さのバリエーションのパターンを変えなかった。したがって、MmeIポジティブキャリアDNAの使用は、有益であるゲノムにわたる両末端読み取りのさらなる分布を提供した。これらの驚くべき知見は、以下の表に示されるデータによってさらに具体化される:
(表1.両末端読み取りの深さ分布および長さに対するMmeIキャリアDNAの効果)
【0122】
【表1】

表1は、E.Coli K12についての包括度統計(coverage statistics)の深さを示す。上側3つのサンプル(行)は、付加されたMmeIポジティブキャリアDNAを有した一方で、下側3つのサンプルは、付加されたMmeIネガティブキャリアDNAを有した。列の見出しは、以下を示す:「深さAve」=平均の深さ;「深さSTDEV」=深さの標準偏差;「深さ%CV」=深さAveによって除算された深さSTDEV(この商は、平均の深さによって補正された深さにおけるバリエーションを示す);「長さAve」=ゲノムにおける両末端読み取り(paired read)の平均距離;「長さSTDEV」=ゲノムにおける両末端読み取りの距離の標準偏差;「長さ%CV」=長さAveによって除算された長さSTDEV。
【0123】
表1は、図20にしたがって、E.coli K12ゲノムにわたる包括度の深さにおけるバリエーションがMmeIポジティブキャリアDNAの付加によって大きく低下したことを示す(深さSTDEVおよび深さ%CVの値を参照のこと;より小さい深さSTDEVおよび深さ%CVの値が、有益である)。これは、ゲノムにわたる両末端読み取りのより均一な分布をもたらす。この均一な分布は、有益である。
【0124】
(表2.E.Coli K12のゲノム骨格形成に対するMmeIポジティブキャリアDNAを有する両末端配列決定の効果)
【0125】
【表2】

表2は、ショットガンのコンティグの骨格形成に対するMmeIポジティブキャリアDNAによって得られた両末端配列決定データの効果を示す。GS20配列決定装置(454 Life Sciences、Branford、CT、USA)におけるE.Coli K12ゲノムDNAのショットガン配列決定によって得られた121の大きいコンティグが、両末端配列決定の読み取りによってアセンブリされた場合、骨格(すなわち、より大きい骨格)のより低い数(19〜25)は、キャリアDNAを用いずにか、またはMmeI部位を欠くキャリアDNA(48〜56の骨格)によってもたらされた両末端配列決定の読み取りと比較して、MmeIポジティブキャリアDNAによってもたらされた両末端配列決定の読み取り(列「Stratagene SS dsDNA(+)」、「E.Coli B株(+)」および「増幅されたポジティブ(+)」)から生じた。したがって、MmeIポジティブキャリアDNAの使用は、本発明に従って行われる両末端配列決定によって達成されるゲノムアセンブリ性能を改善する。
【0126】
いくつかの実施形態において、本発明の方法は、制限エンドヌクレアーゼMmeIによるDNA切断を含む任意の工程における二本鎖「キャリアDNA」の使用を包含する。上記キャリアDNAは、MmeI部位を含まなくてはならない。MmeIによるエンドヌクレアーゼ的な切断は、MmeI酵素分子のモル数がDNAサンプルに存在するMmeI部位のモル数とほぼ等しい場合、最も効率的に起きる(New England Biolabs、Ipswich、MA、USAの製品カタログ)。本発明の方法において、MmeI部位の数は、確実に測定するのが困難でありかつ時間がかかる低いDNA濃度(代表的に、数ナノグラム〜数十ナノグラムの桁である)、そしてまた、配列決定される標的DNAに基づくMmeI部位の数におけるバリエーションに起因して、推定することが困難である。したがって、(化学量論の濃度を達成するように)反応に添加されるMmeI酵素の量の正確な計算には、問題がある。この困難性を克服するため、そしてMmeI部位の数とMmeI酵素分子の数との均衡に対する必要性を満たすために、本発明のいくつかの方法は、過剰(サンプルDNAとの関係において)のキャリアDNAの添加を包含する。この方法において、上記反応に添加されるMmeI酵素の量が、既知の量のキャリアDNAに基づいて算出され得る一方で、(環状)サンプルDNA中のMmeI部位の数は、ごく僅かになる。したがって、サンプルDNAのDNA濃度の測定は、必要なくなる。これは、速度を改善し、そして本方法に必要とされるコストおよび時間を減少させる。キャリアDNAの量は、サンプルDNAを、数倍〜約10倍、約100倍、約1000倍、またはそれ以上で上回り得る。好ましい実施形態において、2マイクログラムの音波破砕された二本鎖サケ精子DNAは、100マイクロリットルの容量において、2ユニットのMmeIおよび全ての必要とされる試薬(例えば、1×NEBuffer 4(New England Biolabs)および50μMのS−アデノシルメチオニン(SAM))と一緒にサンプルDNAに添加され、そして約37℃にて約15分間インキュベートされる。当業者は、反応温度および持続時間が実用範囲内で調整され得ることを認識する。
【0127】
上に記載されるような、ほぼ化学量論の量のMmeI酵素と組み合わせたMmeI制限消化における過剰のMmeI部位含有キャリアDNAの使用は、必要に応じて、本開示(例えば、第6の方法の工程6H)において記載されるMmeI消化(図17H)を含む任意の方法に組み込まれ得る。当業者はまた、MmeI部位を含む「キャリアDNA」を添加するストラテジーが任意のMmeI制限消化反応(特に、サンプルDNA量が低くそして/またはサンプルDNA中のMmeI部位の数が未知である反応)において有用であることを認識する。
【0128】
(油中水型エマルションにおけるライゲーション)
本発明はまた、核酸分子の環化のための方法を包含する。一般的に、核酸分子の環化は、低い核酸濃度におけるライゲーションによって達成される。低濃度は、二次(またはより高次)反応速度論に従う分子間事象よりも、一次反応速度論に従う所望の分子内ライゲーション反応(すなわち環化)に有利に機能する(F.M.Ausubelら(編)、2001、Current Protocols in Molecular Biology、John Wiley & Sons Inc.)。しかし、高い希釈度においてさえ、分子間事象を、防止できず、そして核酸の極端な希釈度は、実用的ではない。分子間ライゲーション(コンカテマー、二重の環(double−circle)など)の発生は、所望の分子内環化事象の産生を減少させる。いくつかのシナリオにおいて、分子間ライゲーション産物は、下流の適用に不利であり得る。要約すると、従来のアプローチは、少なくとも2つの主要な欠点を有する。第1に、出発核酸を希釈する必要性は、反応容量および関連する試薬のコストを増大させる。高い希釈度はまた、反応産物の効率的な回収を困難にする。第2に、多数の分子間ライゲーション事象が、起こり、所望の分子内ライゲーション産物の産生を減少させる。
【0129】
本発明は、上に記載される従来の環化アプローチに関連する問題を大きく排除する方法を包含する。例えば、本発明に従って、高い希釈度(すなわち、低い核酸濃度)にて上記ライゲーション反応を行う必要性は、存在しない。1つの実施形態において、適合性のライゲーション可能な末端(例えば、平滑末端またはねじれ型(staggered)(「粘着」)末端)を有する個々の直鎖状の二本鎖DNA分子は、物理的に隔離された反応環境においてライゲーションされる。ライゲーションされるDNAと上記ライゲーション反応に必要な全ての試薬(例えば、DNAリガーゼ、リガーゼ緩衝液、ATPなど)とを含む水溶液は、油中(好ましくは、エマルションを安定化するように機能する界面活性剤の存在下において)に乳化される。エマルションを形成するための適切な組成物および方法は、下でより詳細に考察される。得られた油中水型エマルションは、微小滴(マイクロリアクター(micr oreactor))を含み、それぞれの微小滴は、0個、1個、またはそれ以上のDNA分子を含む。1つのマイクロリアクターあたりのDNA分子の数は、DNA濃度および微小滴のサイズを改変することによって調整され得る。当業者に対して、核酸濃度、ポリヌクレオチドのサイズ(塩基の数として測定される長さ)、および微小滴の平均体積に基づいて適切な条件を算出することは、慣用的な最適化の問題である。理想的な微小滴は、単一のライゲーション可能なDNA分子を含む。しかし、マイクロリアクターの集団において、1つのマイクロリアクターあたりのDNA分子の数は、部分的に、マイクロリアクターのサイズの可変性およびDNA分子のランダムな分布に依存することが、理解される。したがって、いくつかのマイクロリアクターは、DNA分子を含まない可能性があり、いくつかは、1個のDNA分子を含み得、そしていくつかは、2個以上のDNA分子を含み得る。当業者は、収量およびコスト(試薬の使用)が、必要とされる場合に、1つのマイクロリアクターあたりのDNA分子の平均数を変えることによって均衡を保たれ得ることを、認識する。
【0130】
好ましくは、ライゲーション混合物は、そのライゲーション混合物がアセンブリされている間、そして乳化工程が完了するまで冷たく(例えば、0〜4℃)保たれる。これは、上記ライゲーション反応が、所望のエマルション環境が形成される前に進行するのを防ぎ、したがって、望ましくない分子間結合の形成を防止する。次いで、乳化されたライゲーション反応は、ライゲーション反応が許容される温度にてインキュベートされる。そのインキュベーション時間は、数分間〜1時間、数時間、一晩、または24時間あるいは1日より長い範囲であり得る。このインキュベーションの後であるが上記エマルションの破壊の前、その間、およびその後、上記ライゲーション反応は、合わせたライゲーション反応において望ましくない分子間ライゲーションを防止するために停止され得る。上記ライゲーション反応は、約0〜4℃まで温度を下げること(氷水)、リガーゼの熱失活、EDTAの添加、リガーゼインヒビターの添加などまたはこのような方法の任意の組み合わせによって停止され得る。
【0131】
当業者は、本発明の上記の方法を一本鎖RNAもしくは二本鎖RNA、または一本鎖DNAもしくは二本鎖DNAの環化に対して容易に適用する。例えば、直鎖状一本鎖ポリヌクレオチド分子の末端は、方法1の工程1Kにおいて記載されるように、その直鎖状一本鎖ポリヌクレオチド分子の各末端に相補的な部分を有するキャッピングオリゴヌクレオチド(架橋オリゴヌクレオチドとも称される)にアニーリングさせることによって直接並置させ得る(図1Lおよび図11を参照のこと)。
【0132】
上記乳化されたライゲーション反応は、次いで、適切な温度にてインキュベートされ得る。例えば、T4 DNAリガーゼによる「粘着末端」ライゲーションについて、適切なインキュベーション温度は、16℃であるが、広範な温度が、受容可能である。DNAおよび他の分子のライゲーションについての条件は、幅広く当該分野において公知である。エマルションにおいて環化反応を行う1つの利点は、延長された反応時間が上記手順の成功に対して中立であるかまたは有益でさえあることである。例えば、1つのマイクロリアクターあたりに1個より多いDNA分子を有さない理想的なシナリオにおいて、インキュベーション時間は、ほとんどのDNA分子が環化されるまで延長され得る。対照的に、上に記載されるような従来の非エマルション方法を使用することによって、長いインキュベーション時間は、より高い割合の分子間ライゲーション産物をもたらし得る。本発明のエマルションベースのライゲーション方法の別の利点は、分子間ライゲーションの発生を増大させることなく比較的長い時間にわたってその反応を継続させる能力である。このような増大したインキュベーション時間は、分子間ライゲーションが起きる増大した危険性を伴わずにより多い数の環化された産物を可能にする。さらに、上記分子は、物理的手段によって単離されるものでありかつ濃度依存的様式ではないので、その反応容量は、同じ数のライゲーション事象についてずっと小さいものであり得(すなわち、水相における核酸の核酸濃度は、ずっと高いものであり得る)、その小さい反応容量は、試薬に関するコストを低下させ、そしてサンプルを処理する容易性を増大させる。当業者は、所与の微小滴においてライゲーションが起きるために、その微小滴がリガーゼ酵素の少なくとも1個の分子を含む十分な試薬を含まなければならないことを理解する。
【0133】
(エマルションの破壊および環化されたDNAの単離)
ライゲーションの後、そのライゲーション反応は、停止され得、そしてエマルションは、「破壊される」(当該分野において「脱乳化(demulsification)」とも称される)。エマルションを破壊する多くの方法(例えば、米国特許第5,989,892号およびその中に引用された参考文献を参照のこと)が、存在し、そして当業者は、適切な方法を選択し得る。脱乳化に次いで、核酸を単離するための任意の適切な方法によって行われ得る核酸単離工程が行われ得る。一旦核酸が単離されると、ライゲーションされていない材料は、この課題に適した任意の方法によって除去され得、その方法の1つは、サンプルのエキソヌクレアーゼ消化を行うことである。使用される特定のエキソヌクレアーゼ酵素は、部分的に、作用される分子の型(一本鎖または二本鎖、DNAまたはRNA)および他の考慮(例えば、その工程に都合よく組み込まれる反応温度)に依存する。上記環化された材料は、上記エキソヌクレアーゼ処理の後に当該分野において公知である多くの手順(例えば、フェノール/クロロホルム抽出またはこの目的に適した任意の市販の精製キット)のうちの1つによって精製されるなければならない。
【0134】
上に記載される従来の希釈ベースの環化プロトコルを使用すると、所望の環状産物の回収は直鎖状の投入したDNA分子の長さの増大に伴って減少することが、観察されている。本発明のエマルションライゲーション方法は、長いポリヌクレオチド分子(例えば、約500塩基より長いか、約1000塩基より長いか、約2000塩基より長いか、約5000塩基より長いか、約10000塩基より長いか、約20,000塩基より長いか、約50,000塩基より長いか、約100,000塩基より長いか、約250,000塩基より長いか、約100万塩基より長いか、または約500万塩基より長い分子、あるいは目的の実験プロトコルに望ましいと考えられる事実上任意のサイズ)の環化において特に有用である。
【0135】
本明細書中に記載されるエマルションライゲーション方法は、それらが環化をもたらすか否かにかかわらず、広範な種々のライゲーション反応において有用である。したがって、上に記載されるエマルションライゲーションは、本明細書中に記載される種々の方法の任意のライゲーション工程(特に、投入した核酸の環化が望まれるライゲーション反応)において使用され得る。
【0136】
(乳化)
エマルションは、他の相に顕微鏡的かまたはコロイド的なサイズではない液滴として分散される1つのを含む2つの不混和性液相の不均一な系である。本発明のエマルションは、マイクロカプセル(マイクロリアクター)の形成を可能にしなければならない。エマルションは、不混和性液体の任意の適切な組み合わせから産生され得る。本発明のエマルションは、微細に分かれた液滴の形態で存在する相(分散する、内部相または不連続相)として親水性の相(生化学的成分を含む)を有し、かつこれらの液滴が懸濁されるマトリックス(分散しない、連続相または外部相)として疎水性の不混和性液体(「油」)を有する。このようなエマルションは、「油中水型」(W/O)と称される。これは、生化学的成分を含む水相全体が分離した液滴(内部相)に区分されるという利点を有する。疎水性の油である外部相は、一般に、生化学的成分を含まず、したがって不活性である。
【0137】
いくつかの実施形態において、マイクロリアクターは、核酸ライゲーションに必要な試薬を含む。複数のマイクロリアクターは、それぞれ、正確に1個のポリヌクレオチド分子を含み得る。特定の実施形態において、例えば、リガーゼの熱失活が上記反応後に行われる場合またはライゲーションが耐熱性リガーゼ(例えば、Taq DNAリガーゼ)を使用して高い温度で行われる場合、耐熱性の油中水型エマルションが、望ましい。上記エマルションは、当該分野において公知である任意の適切な方法によって形成され得る。エマルションを形成する1つの方法は、下に記載されるが、エマルションを作製するための任意の方法が、使用され得る。これらの方法は、当該分野において公知であり、そしてその方法としては、アジュバント法(adjuvant method)、向流法(counter−flow method)、逆流法(cross−current method)、振盪、回転ドラム法(rotating drum method)、およびメンブレン法(membrane method)が挙げられる。さらに、上記マイクロプセルのサイズは、成分の流量および速度を変えることによって調整され得る。例えば、滴下において、液滴のサイズおよび送達の合計時間は、変えられ得る。いくつかの実施形態において、上記微小滴は、例えば、Linkら(Angew.Chem.Int.編、2006、45、2556−2560(全体が本明細書によって参考として援用される))によって記載されるようなマイクロ流体デバイス内で形成され得る。
【0138】
上記マイクロリアクターの少なくともいくつかは、十分な核酸および他のライゲーション試薬を含むために、十分に大きいべきである。しかし、上記マイクロリアクターの少なくともいくつかは、そのマイクロリアクター集団の一部が単一の自己ライゲーション可能なポリヌクレオチド分子を含むように十分に小さいべきである。いくつかの実施形態において、上記エマルションは、熱安定性である。好ましくは、形成される液滴は、直径が約100ナノメートル〜約500マイクロメートル(より好ましくは、約1マイクロメートル〜約100マイクロメートル)のサイズの範囲である。有利には、直交流流体混合(cross−flow fluid mixing)(必要に応じて、電場と組み合わせられる)は、液滴形成の制御および液滴サイズの均一性を可能にする。
【0139】
生物学的反応に適した種々のエマルションは、GriffithsおよびTawfik、EMBO、22、pp.24−35(2003);Ghadessyら、Proc.Natl.Acad.Sci.USA 98、pp.4552−4557(2001);米国特許第6,489,103号およびWO 02/22869(それぞれは、参考として本明細書中に完全に援用される)において言及される。好ましい実施形態において、上記油は、シリコーンオイルである。
【0140】
(界面活性剤)
本発明のエマルションは、1種以上の表面活性剤(エマルション安定化剤;界面活性剤)の添加によって安定化され得る。これらの界面活性剤は、乳化剤とも称され、そして相の分離を防止する(または少なくとも遅延させる)ように水/油界面にて作用する。多くの油および多くの乳化剤は、油中水型エマルションの産生に使用され得る;最近の編集物は、16,000種を超える界面活性剤を記載し、それらの多くは、乳化剤として使用される(Ash,M.およびAsh,I.(1993)Handbook of industrial surfactants.Gower、Aldershot)。本発明の方法において使用されるエマルション安定化剤としては、Atlox 4912、モノソルビタンモノオレエート(Span80;ICI)、ポリオキシエチレンソルビタンモノオレエート(Tween80;ICI)ならびに他の認識された適切な安定化剤および市販の適切な安定化剤が挙げられる。種々の実施形態において、上記界面活性剤は、0.5〜50%、好ましくは、10〜45%、より好ましくは、30〜40%のエマルションの油相中のv/v濃度にて提供される。
【0141】
いくつかの実施形態において、化学的に不活性なシリコーンベースの界面活性剤(例えば、シリコーンコポリマー)が、使用される。1つの実施形態において、使用されるシリコーンコポリマーは、ポリシロキサン−ポリセチル−ポリエチレングリコールコポリマー(セチルジメチコンコポリオール)(例えば、Abil(登録商標)EM90(Goldschmidt)である。
【0142】
化学的に不活性なシリコーンベースの界面活性剤は、エマルション組成における唯一の界面活性剤として提供され得るか、または数種の界面活性剤の1つとして提供され得る。したがって、異なる界面活性剤の混合物が、使用され得る。
【0143】
特定の実施形態において、使用される1つの界面活性剤は、Dow Coming(登録商標)749 Fluid(1〜50% w/w、好ましくは、10〜45% w/w、より好ましくは25〜35% w/wにて使用される)である。他の特定の実施形態において、使用される1つの界面活性剤は、Dow Corning(登録商標)5225C Formulation Aid(1〜50% w/w、好ましくは、10〜45% w/w、より好ましくは35〜45% w/wにて使用される)である。好ましい実施形態において、油/界面活性剤混合物は、40%(w/w)Dow Coming(登録商標)5225C Formulation Aid、30%(w/w)Dow Corning(登録商標)749 Fluid、および30%(w/w)シリコーンオイルからなる。
【0144】
本発明の方法は、現在の方法を上回る複数の利益および利点を提供する。先行技術を上回る現在の方法の1つの利点は、真核生物または原核生物における調製されるフラグメントのクローニングおよび増殖が必要とされないことである。これは、標的配列が宿主細胞におけるエピソームとしての増殖の間に再配列され得る複数の反復を含む場合、特に有用である。
【0145】
本開示の方法の別の利点は、それが、コンティグ配列だけでなく、100bpを超えるか、300bpを超えるか、500bpを超えるか、1kbを超えるか、5kbを超えるか、10kbを超えるか、100kbを超えるか、1Mbを超えるか、10Mbを超えるか、またはより大きい長さを有し得る長いコンティグの末端配列および末端配列の方向性も提供することによってゲノムアセンブリを容易にし得ることである。この配列情報および方向性情報は、ゲノムアセンブリを容易にするため、そしてギャップ閉鎖を提供するために使用され得る。
【0146】
さらに、両末端読み取りは、ゲノムのアセンブリにおける信頼度の第2のレベルを提供する。例えば、両末端配列決定および定型的なコンティグ配列決定が、ほぼ一致したDNA配列である場合、その配列の信頼度のレベルは、増大される。あるいは、2つの配列データが、互いに矛盾する場合、その信頼度は、減少し、そしてさらなる分析および/または配列決定は、不一致の供給源を見出すために必要である。
【0147】
両末端読み取りにおける読み取り枠の存在または非存在はまた、読み取り枠の位置についての方向を提供する。例えば、コンティグの両方の配列決定された末端が、読み取り枠を含む場合、完全なコンティグが読み取り枠である機会が、存在する。これは、標準的な配列決定技術によって確認され得る。あるいは、2つの末端の知見によって、特異的PCRプライマーが、その2つの末端を増幅するために構築され得、そしてその増幅された領域は、読み取り枠の存在を決定するために配列決定され得る。
【0148】
本発明の方法はまた、ゲノムの組織化および構造の理解を改善する。両末端配列決定は、配列決定が困難である領域を測定する能力を有するので、ゲノムの構造は、これらの領域が配列決定されない場合でさえ推定され得る。配列決定が困難な領域は、例えば、反復領域および二次構造の領域であり得る。この場合において、これらの困難な領域の数および位置は、これらの領域の配列が公知でない場合でさえゲノムにおいてマッピングされ得る。
【0149】
本発明の方法はまた、延長した距離にわたってゲノムのハロタイプ分類(haplotyping)を可能にする。例えば、特異的プライマーが、長い距離によって連結された2つのSNPを含むゲノムの領域を増幅するために作製され得る。この増幅された領域の2つの末端は、上記2つのSNPの間の核酸を配列決定することなくハロタイプを決定するために、本発明の方法を使用して配列決定され得る。この方法は、上記2つのSNPが配列決定するのが非経済的な領域にわたる場合に、特に有用である。これらの領域は、長い領域、反復を有する領域、または二次構造の領域を含む。
【0150】
本方法のビオチン化されるアダプターは、さらなる利点を提供する(図7)。図7Aは、配列決定できる状態である様式で配列決定プライマーAおよび配列決定プライマーBにライゲーションされた核酸を示す。上記核酸のいくつかは、単一のコンティグ領域(701)の2つの末端を含まない夾雑核酸である。コンティグの両方の末端を含む核酸フラグメントは、702として示される。核酸702は、ビオチンを含む核酸の唯一の化学種(species)であるので、この化学種は、ストレプトアビジンビーズを使用して精製され得る(図7B)。この化学種は、精製後に配列決定する状態になっている。アフィニティー精製を使用することによって、有用な情報をもたらす配列の分画は、実質的に増大され得る。
【0151】
これは、夾雑DNA(701)が長い場合(例えば、図7Dにおける夾雑核酸(701)の各々が、数kb長である場合)に、特に有用である。これらの夾雑物を配列決定することは、計画に投入された試薬、人的資源、およびコンピュータの処理能力のかなりの部分を消費する。この場合において、アフィニティークロマトグラフィーによる適切なフラグメントの事前の精製(図7E)は、実質的な労力および試薬の節約を提供する。
【0152】
当業者は、逆鎖のイノシンを含む任意の二本鎖DNAのEndoVによるエンドヌクレアーゼ的な切断(図14に示されるような、ヘアピンを有するかまたはヘアピンを有さない)が一本鎖突出(粘着末端)を生成し得ることを、即座に認識し、ここでその突出は、実質的に任意のヌクレオチド配列を有し得る。本発明はまた、実質的に図14に類似するがヘアピンを有さないポリヌクレオチド設計および方法を含む。さらに、上に記載されるような図14に示される(ヘアピンを有するかまたはヘアピンを有さない)本発明の方法および組成物は、固有のエンドヌクレアーゼ部位の導入が望ましい多数の分子生物学技術および組換えDNA技術において有用である。このような技術としては、DNAライブラリーおよびcDNAライブラリーの構築、種々のサブクローニングストラテジー、またはプライマー、アダプター、もしくはリンカー中の固有のエンドヌクレアーゼ部位から利益を受ける任意の方法論が挙げられるが、これらに限定されない。
【0153】
本明細書中に記載される方法のいずれかによって生成される両末端核酸構築物は、当該分野において公知である任意の配列決定方法によって配列決定され得る。標準的な配列決定方法(例えば、Sanger配列決定法またはMaxam−Gilbert配列決定法)は、幅広く当該分野において公知である。配列決定はまた、例えば、454(登録商標)Life Sciences Corporation(Branford、CT、USA)によって開発された454 SequencingTMとして公知である自動化された配列決定方法(例えば、国際出願番号WO/05003375(2004年1月28日出願)ならびに米国特許出願第10/767,779号(2004年1月28日出願)、同第60/476,602号(2003年6月6日出願);同第60/476,504号(2003年6月6日出願);同第60/443,471号(2003年1月29日出願);同第60/476,313号(2003年6月6日出願);同第60/476,592号(2003年6月6日出願);同第60/465,071号(2003年4月23日出願);および同第60/497,985号(2003年8月25日出願)に記載される)を使用することによって行われ得る。当該分野において公知であるさらなる配列決定方法(例えば、Metzger(Genome Res.2005年12月;15(12):1767−76、本明細書によって参考として援用される)によって概説されるような任意の合成による配列決定(sequencing−by−synthesis)方法またはライゲーションによる配列決定(sequencing−by−ligation)方法もまた、企図され、そして本発明の両末端配列決定法において使用され得る。
【0154】
本開示全体を通して、用語「ビオチン」、「アビジン」または「ストレプトアビジン」は、結合対のメンバーを記載するために使用されている。これらの用語は結合対を使用するための1つの方法を単に例示することが、理解される。したがって、用語「ビオチン」、「アビジン」、または「ストレプトアビジン」は、結合対の任意の1つのメンバーによって置換され得る。結合対は、互いに対する特異的結合を示す任意の2つの分子であり得、そしてその結合対としては、少なくとも、FLAG/抗FLAG抗体;ビオチン/アビジン、ビオチン/ストレプトアビジン、レセプター/リガンド、抗原/抗体、レセプター/リガンド、ポリHlS/ニッケル、プロテインA/抗体およびそれらの誘導体などの結合対が挙げられる。他の結合対は、公知であり、そして文献において公開される。
【0155】
本開示中の任意の場所で引用される全ての特許、特許出願および参考文献は、その全体が参考として本明細書によって援用される。
【0156】
本発明は、ここで、以下の非限定的な実施例によってさらに記載される。
【実施例】
【0157】
(実施例1:オリゴヌクレオチド設計)
この実験において使用されるオリゴヌクレオチドは、以下の通りに設計および合成される。
【0158】
図3Aの上部に示される捕捉エレメントオリゴヌクレオチドを、UA3アダプターおよびUA3キーを含むように設計する。NotI部位を、上記アダプターの間に配置する。完全な構築物(捕捉エレメント)を、ネステッドオリゴおよびネステッドPCRを使用して形成し得る。最終産物の配列を、合成およびクローニングする。
【0159】
図3Aの下部に示されるIIS型捕捉フラグメントオリゴヌクレオチドは、IIS型制限エンドヌクレアーゼ部位(例えば、MmeI)を示す配列をキー配列後の捕捉フラグメント中に含むことを除いて上に記載する捕捉フラグメントと同様である。これらのIIS型制限エンドヌクレアーゼ切断部位は、IIS型制限エンドヌクレアーゼによって切断されるこれらの捕捉エレメントを用いて作製される任意の構築物の切断を可能にする。当該分野において公知であるように、IIS型制限エンドヌクレアーゼは、その認識部位から種々の距離(MmeIの場合において、20/18塩基)にてDNAを切断する。
【0160】
短いアダプター捕捉フラグメントオリゴヌクレオチドを、SAD1アダプターおよびSAD1キーを含むように設計した(図3B)。NotI部位をまた、上記アダプターの間においた。このオリゴヌクレオチドを、上記キー配列後のMmeI IIS型制限エンドヌクレアーゼ切断部位を用いて合成し得る(図3B、短いアダプター捕捉フラグメント(IIS型)を参照のこと)。
【0161】
(実施例2:ヘアピンアダプター両末端配列決定のためのプロトコル)
100μl中のE.Coli K12 DNA(20μg)を、標準的なHydroShearアセンブリ(Genomic Solutions、Ann Arbor、MI、USA)を使用して速度10で20サイクルにわたってハイドロシアー(hydroshear)した。メチル化反応を、50μlのDNA(5μg)、34.75μlのHO、10μlのメチラーゼ緩衝液、0.25μlの32mM SAM、および5μlのEcoRlメチラーゼ(40,000ユニット/ml、New England Biolabs(NEB)、Ipswich、MA、USA)を添加することによってそのせん断したDNAにおいて行った。その反応を、37℃にて30分間インキュベートした。そのメチル化反応の後、そのせん断しメチル化したDNAを、製造業者の説明書に従ってQiagen MinElute PCR精製カラムを使用して精製した。その精製したDNAを、10μlのEB緩衝液によってカラムから溶出させた。
【0162】
上記せん断しメチル化したDNAを、平滑末端を有するせん断した材料を形成するために研磨する工程に供した。10μlにおけるDNAを、13μlのHOと、5μlの10×研磨緩衝液と、5μlの1mg/mlウシ血清アルブミンと、5μlの10mM ATPと、3μlの10mM dNTPと、5μlの10U/μl T4ポリヌクレオチドキナーゼと、5μlの3U/μl T4 DNAポリメラーゼとを含む反応混合物に添加した。その反応を、12℃にて15分間インキュベートし、次いでその温度を、さらに15分間にわたって25℃まで上昇させた。その反応を、次いで、製造業者の説明書に従ってQiagen MinElute PCR精製カラムを使用して精製した。
【0163】
上記ヘアピンアダプターを、10μlの5μgせん断DNA、17.5μlのHO、50μlの2×Quickリガーゼ緩衝液、20μlの10μMヘアピンアダプター、および2.5μlのQuickリガーゼ(T4 DNAリガーゼ、NEB)を添加することによって上記せん断した平滑末端DNAフラグメントにライゲーションした。その反応を、25℃にて15分間インキュベートし、次いでそのライゲーションしたフラグメントを、その混合物に2μlのλエキソヌクレアーゼ、1μlのRec J(30,000ユニット/ml、NEB)、1μlのT7エキソヌクレアーゼ(10,000ユニット/ml、NEB)、および1μlのエキソヌクレアーゼI(20,000ユニット/ml、NEB)を添加することによって選択した。その反応を、37℃にて30分間インキュベートし、次いでそのサンプルを、Qiagen MinElute PCR精製カラムにおいて精製した。その処理したDNAを、次いで、製造業者の説明書に従ってInvitrogen Purelinkカラムに通し、そして50μlの容量でカラムから溶出させた。
【0164】
上記ライゲーションしエキソヌクレアーゼ処理したDNAを、EcoRIによる消化に供した。50μlのDNAと、30μlのH0と、10μlのEcoRI緩衝液と、10μlのEcoRI(20,000ユニット/ml)とを含む反応を、37℃にて一晩インキュベートした。その切断した産物を、製造業者の説明書に従ってQiagen QiaQuickカラムを使用して精製した。その切断した産物を、閉環状DNAを産生するために、50μlのDNAと、20μlの緩衝液4(New England Biolabs)と、2μlの100mM ATPと、123μlのH0と、5μlのリガーゼ(上記の通り)とを含む反応においてさらに1回ライゲーションした。そのライゲーション反応を、25℃にて15分間インキュベートし、次いでそれらを、その混合物に1μlのλエキソヌクレアーゼ(5,000ユニット/ml、NEB)、0.5μlのRec J(上記の通り)、0.5μlのT7エキソヌクレアーゼ(上記の通り)、および0.5μlのエキソヌクレアーゼI(上記の通り)を添加することによるエキソヌクレアーゼ処理のさらなるラウンドに供した。そのエキソヌクレアーゼ反応を、37℃にて30分間インキュベートし、次いでそのサンプルを、Qiagen MinElute PCR精製カラムによって精製した。
【0165】
上記処理したDNAを、次いで10μlのDNAと、78.75μlのHOと、10μlの緩衝液4(New England Biolabs)、0.25μlのSAMと、0.5μlのMme I(2,000 ユニット/ml、NEB)とを含む反応混合物におけるMme I消化に供した。その反応を、37℃にて60分間にわたってMme Iを用いて消化し、次いで0.1%の最終濃度の3M酢酸ナトリウムによって緩衝化したQiagen QiaQuickカラムにおいて精製した。そのカラムを、700μlの8.0MグアニジンHClによって洗浄し、そしてそのサンプルを、製造業者の説明書に従ってそのカラムに添加した。そのDNAを、30μlのEB緩衝液において溶出させ、そして100μlの最終容量まで希釈した。
【0166】
ストレプトアビジン磁性ビーズ(50μl)(Dynal Dynabeads M270、Invitrogen、Carlsbad、CA、USA)を、2×ビーズ結合緩衝液によって洗浄し、そして100μlの2×ビーズ結合緩衝液中にそのビーズを懸濁することによって調製し、次いで100μlのそのDNAサンプルを、そのビーズに添加し、そして室温にて20分間にわたって混合した。そのビーズを、洗浄緩衝液において2回洗浄した。SAD7アダプターセット(A/Bセット、その一本鎖オリゴヌクレオチドのSAD7FtopおよびSAD7Fbotを、Aアダプターを形成するためにアニーリングさせ、そして一本鎖オリゴヌクレオチドのSAD7RtopおよびSADRFbotを、Bアダプターを形成するためにアニーリングさせる)(SAD7Ftop:5’−CCGCCCAGCATCGCCTCAGNN−3’(配列番号51);SAD7Fbot:5’−CTGAGGCGATGCTGG−3’(配列番号52);SAD7Rtop:5’−CCGCCCGAGCACCGCTCAGNN−3’(配列番号53);SAD7Rbot:5’−CTGAGCGGTGCTCGG−3’(配列番号54)、ここでNは、4種の塩基A、G、TまたはCのいずれかである)を、ストレプトアビジンビーズに結合したDNAにライゲーションし、15μlのHOと、25μlのQuickリガーゼ緩衝液と、5μlのSAD7アダプターセットと、5μlのQuickリガーゼ(上記の通り)とを含むライゲーション反応混合物を、ビーズ−DNA混合物に添加した。そのライゲーション反応を、25℃に15分間インキュベートし、次いでそのビーズを、ビーズ洗浄緩衝液によって2回洗浄した。
【0167】
ヌクレオチド充填反応を、そのビーズに40μlのH2Oと、5μlの10×充填緩衝液と、2μlの10mM dNTPと、3μlの充填ポリメラーゼ(Bst DNAポリメラーゼ、8,000ユニット/ml、NEB)とを含む混合物を添加することによって行った。その反応を、37℃にて20分間インキュベートし、そしてそのビーズを、洗浄緩衝液において2回洗浄した。次いで、そのビーズを、25μlのTE緩衝液に懸濁した。
【0168】
次いで、そのビーズに結合したDNAを、30μlのH2Oと、5μlの10×Advantage 2緩衝液と、2μlの10mM dNTPと、1μlの100μM順方向プライマー(SAD7FPCR:5’−Bio−CCGCCCAGCATCGCC−3’(配列番号55))と、1μlの100μM逆方向プライマー(SAD7RPCR:5’−CCGCCCGAGCACCGC−3’(配列番号56))と、10μlのビーズに結合したDNAと、1μlのAdvantage 2ポリメラーゼ混合物(Clontech、Mountain View、CA、USA)とを含む反応混合物においてPCRに供した。PCRを、以下のプログラムを使用して行い、次いでその反応を、14℃に保った:(a)94℃にて4分間、(b)94℃にて15秒間、(c)64℃にて15秒間(ここで、工程(b)および(c)を、19サイクルにわたって行う)、(d)68℃にて2分間。
【0169】
上記PCR産物を、Qiagen MinElute PCR精製カラムを使用して精製し、次いでその精製した産物を、120bpの産物の存在を検出するために、1センチメートルあたり5ボルトにて1.5%アガロースゲルにおいて電気泳動した。その120bpのフラグメントを、そのゲルから切り出し、そしてQiagen MinEluteゲル抽出プロトコルを使用して回収した。その120bpのフラグメントを、18μlのEB緩衝液において溶出させた。二本鎖産物を、ストレプトアビジンビーズに結合させ、そしてビーズ洗浄緩衝液によって2回洗浄した。一本鎖産物を、125mM NaOHにおいて溶出させ、そしてQiagen MinElute PCR精製カラムにおいて精製した。この材料を、次いで454 Life Sciences Corporation自動配列決定システムにおいて標準的な454 Life Sciences Corporation(Branford、CT、USA)配列決定法を使用して配列決定した。
【0170】
(実施例3:非ヘアピンアダプター両末端配列決定のためのプロトコル)
100μl容量におけるE.Coli K12 DNA(5μg)を、鎖アセンブリ(HydroShear、上記の通り)を使用して速度11において20サイクルにわたってハイドロシアーした。そのせん断したDNAを、製造業者の説明書に従ってQiagen MinElute PCR精製カラムにおいて精製し、そして23μlのEB緩衝液によって溶出させた。その精製しせん断したDNAを、23μlのDNAと、5μlの10×研磨緩衝液と、5μlの1mg/mlウシ血清アルブミンと、5μlの10mM ATPと、3μlの10mM dNTPと、5μlの10U/μl T4ポリヌクレオチドキナーゼと、5μlの3U/μl T4 DNAポリメラーゼとを含む反応混合物において平滑末端研磨に供した。その反応を、12℃にて15分間インキュベートし、次いでその温度を、さらに15分間にわたって25℃まで上昇させた。その反応を、次いで製造業者の説明書に従ってQiagen MinElute PCR精製カラムにおいて精製した。非ヘアピンアダプターのライゲーションを、25μlの2×Quickリガーゼ緩衝液と、18.5μlの10μM非ヘアピンアダプターと、2.5μlのQuickリガーゼ(上記の通り)とを含む反応混合物において2μgのそのせん断し精製したDNAを使用して行った。そのライゲーション反応を、25℃にて15分間インキュベートし、次いでそのサンプルを、Sephacryl 5−400スピンカラムに通し、次いでQiagen MinElute PCR精製カラムに通した。そのDNAを、次いで、10μlのEB緩衝液によってそのカラムから溶出させた。
【0171】
上記精製しライゲーションしたDNAを、次いで、キナーゼ反応に供し、ここでその混合物は、13μlのH2O、25μlの2×緩衝液、10μlのDNA、および2μlの10U/μl T4ポリヌクレオチドキナーゼを含んだ。その反応を、37℃にて60分間インキュベートし、次いでそのサンプルを、1cmあたり5ボルトにて1%アガロースゲルにおいて電気泳動した。1500bpと4000bpとの間のバンドを、そのゲルから切り出し、そしてQiagen MinEluteゲル抽出プロトコルを使用して回収した。
【0172】
上記精製したDNAを、環状DNAを産生するために、18μlのDNAと、20μlの緩衝液4(New England Biolabs)と、2μlのATPと、150μlのH2Oと、10μlのリガーゼ(上記の通り)とを含む反応混合物においてライゲーションのさらなるラウンドに供した。その反応を、25℃にて15分間インキュベートし、次いで2μlのλエキソヌクレアーゼ(上記の通り)と、1μlのRec J(上記の通り)と、1μlのT7エキソヌクレアーゼ(上記の通り)と、1μlのエキソヌクレアーゼI(上記の通り)とを含む混合物を、37℃にて30分間インキュベートした。そのエキソヌクレアーゼ反応の後、そのDNAを、Qiagen MinElute PCR精製カラムにおいて精製し、そして20μlのEB緩衝液によって溶出させた。
【0173】
上記精製しライゲーションしたDNAを、次いで、68.6μlのH2Oと、10μlの緩衝液4(New England Biolabs)と、0.2μlのSAMと、1μlのMme I制限エンドヌクレアーゼ(上記の通り)とを含む混合物に添加した。そのDNAを、37℃にて30分間切断し、次いで、そのDNAを、0.1%の最終濃度の3M酢酸ナトリウムにて予め緩衝化したQiagen QiaQuickカラムにおいて精製し、そして700μlの8.0MグアニジンHClによって洗浄した。その精製したDNAを、次いで、30μlのEB緩衝液によって溶出させ、そしてその容量を、100μlに調整した。
【0174】
ストレプトアビジン磁性ビーズ(50μl)(上記の通り)を、2×ビーズ結合緩衝液によって洗浄し、そして100μlのビーズ結合緩衝液に懸濁した。そのビーズを、次いで、100μlの上記DNAサンプルと混合し、そして室温にて20分間にわたって互いに結合させた。その後、そのビーズを、洗浄緩衝液において2回洗浄し、そしてSAD7アダプターセット(A/Bセット)(上記の通り)を用いたライゲーション反応に供した。15μlのH2Oと、25μlのQuickリガーゼ緩衝液と、5μlのSAD7アダプターと、5μlのQuickリガーゼ(上記の通り)とを含む混合物を、そのビーズに結合したDNAに添加し、そして25℃にて15分間インキュベートし、次いでそのビーズを、洗浄緩衝液において2回洗浄した。
【0175】
上記ビーズに結合したDNAを、40μlのH2Oと、5μlの10×充填緩衝液と、2μlの10mM dNTPと、3μlの充填ポリメラーゼ(上記の通り)とを含む混合物において充填反応に供した。その反応を、37℃にて20分間にわたって行い、次いでそのビーズを、洗浄緩衝液において2回洗浄し、そして25μlのTE緩衝液に懸濁した。そのビーズに結合したDNAを、30μlのH2Oと、5μlの10×Advantage 2緩衝液と、2μlのdNTPと、0.5μlの100μM順方向プライマー(上記の通り)と、0.5μlの100μM逆方向プライマー(上記の通り)と、10μlのビーズに結合したDNAと、1μlのAdvantage 2酵素(上記の通り)とを含む反応混合物において増幅した。そのPCR反応を、以下の条件下で行い、次いでそのPCR反応を、14℃に保った:(a)94℃にて4分間、(b)94℃にて15秒間、(c)64℃にて15秒間(ここで、工程(b)および工程(c)を、24サイクルにわたって繰り返した)、(d)68℃にて2分間。そのPCR産物を、Qiagen MinElute PCR精製カラムにおいて精製し、そして1cmあたり5ボルトにて1.5%アガロースゲルにおいて電気泳動した。120bpの産物を、そのゲルから切り出し、そしてQiagen MinEluteゲル抽出プロトコルによって回収した。そのDNAを、次いで、18μlのEB緩衝液において溶出させた。
【0176】
二本鎖DNAを、ストレプトアビジンビーズに結合させ、そしてそのビーズを、洗浄緩衝液によって2回洗浄した。一本鎖DNAを、次いで、125mM NaOHによって溶出させ、次いで、Qiagen MinElute PCR精製カラムを使用して精製した。その精製した材料を、標準的な454エマルションプロトコルおよび454配列決定プロトコルに供した。
【0177】
上に記載した手順を使用して、本発明者らは、以下の結果を得た:
E.coliコンティグは、4回の60×60の実行(約130万の読み取り)からの通常の454配列からもたらされた:1000bpよりも大きい303個のコンティグが、もたらされ、それは、16,858bpの平均サイズ、および94,060bpの最大サイズを有した。表3は、上記の手順を使用して得たさらなる結果を含む。
【0178】
(表3:両末端配列決定手順からの結果)
【0179】
【表3】

分析を、最初にGenbankから得たE.coli K12ゲノムに対して全ての両末端読み取りをブラスト検索することによって行った。上記参照ゲノムと0.1未満の期待値で一致した読み取りを、保持した。内部リンカー配列によって分けられた2つの別個のブラストヒット(blast hit)を含んだ全ての読み取りを、そのゲノムにおいて離れているそれらのブラスト検索した距離について分析し、そして距離が5,000bp未満である場合にのみ保持した。これらの読み取りを、次いで、そのゲノムにおける第1および第2の位置ヒット(position hit)によって順序付けし、そしてオーバーラップが次の分類した両末端配列に生じたか否かを見るために試験した。これらの順序付けしたコンティグの各々を、次いで、上記と同じ様式において454配列決定コンティグに対するオーバーラップパターンについて試験した。
【0180】
本発明の有利な実施形態をそのようにして詳細に記載したことで、上記によって定義される本発明はおそらく本発明の精神または分野を逸脱することなく可能であるその明白なバリエーションとして上記の説明に示される特定の詳述に限定されないことが、理解されるべきである。本明細書中に記載される方法の改変およびバリエーションは、当業者に明らかであり、そして添付の特許請求の範囲によって包含されることが意図される。

【特許請求の範囲】
【請求項1】
明細書中に記載の発明。

【図1−1】
image rotate

【図1−2】
image rotate

【図1−3】
image rotate

【図1−4】
image rotate

【図1−5】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6−A】
image rotate

【図6−B】
image rotate

【図6−C】
image rotate

【図6−D】
image rotate

【図6−E】
image rotate

【図6−F】
image rotate

【図7】
image rotate

【図8−1】
image rotate

【図8−2】
image rotate

【図8−3】
image rotate

【図8−4】
image rotate

【図8−5】
image rotate

【図8−6】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12−1】
image rotate

【図12−2】
image rotate

【図12−3】
image rotate

【図12−4】
image rotate

【図12−5】
image rotate

【図12−6】
image rotate

【図13】
image rotate

【図14−1】
image rotate

【図14−2】
image rotate

【図14−3】
image rotate

【図15−1】
image rotate

【図15−2】
image rotate

【図15−3】
image rotate

【図15−4】
image rotate

【図15−5】
image rotate

【図15−6】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate


【公開番号】特開2012−223203(P2012−223203A)
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−180575(P2012−180575)
【出願日】平成24年8月16日(2012.8.16)
【分割の表示】特願2008−531087(P2008−531087)の分割
【原出願日】平成18年6月6日(2006.6.6)
【出願人】(507331232)454 ライフ サイエンシーズ コーポレイション (11)
【Fターム(参考)】