タンパク質の結晶化実験における観測データの処理システム

【課題】初期スクリーニングや二次スクリーニング等のタンパク質の結晶化実験に際して蓄積される膨大な観測データを処理するタンパク質の結晶化実験における観測データの処理システムを提供することを課題としている。
【解決手段】異なる条件でタンパク質試料と試薬とが混合されてなる複数のサンプルの結晶化状態を、経時的に観測することによって得られる複数の観測データが蓄積される主データベースシステム３に蓄積された観測データを処理する処理システム７を、主データベースシステム３の観測データがサンプル毎に１レコードに纏められてなる作業用観測データを蓄積する作業用データベースシステム１１と、作業用データベースシステム３から予め定められた条件に基づいて所定のサンプルを、次工程の作業を行うサンプルとして選択して抽出する抽出システム１２とで構成した。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、タンパク質の結晶化実験に際して蓄積される膨大な観測データを処理する観測データの処理システムに関する。
【背景技術】
【０００２】
今日生物科学はめざましい進歩を遂げているが、タンパク質分子のその優れた機能と構造との相関の理解はまだまだ不十分である。このためタンパク質分子の構造解析として三次元構造解析を行う必要がある。タンパク質分子の三次元構造解析は、一般的にはＸ線構造解析法が使用される。ただしＸ線構造解析法を使用するためには、Ｘ線構造解析が可能なタンパク質の単結晶が必要となる。このためＸ線構造解析法の前段階としてタンパク質の結晶化実験が必要となる。
【０００３】
タンパク質の結晶化実験は、複数のウェル（検体穴）が設けられたプレートを使用して行われる。所定のタンパク質試料に対して、試薬となる複数種類の沈殿剤と緩衝剤（バッファ）と添加剤とを別々の条件で組み合わせて、各ウェルに混入してサンプル用のプレートし、サンプル用のプレートを、オイル中の恒温条件下で結晶化処理して行われる。
【０００４】
プレート内の検体は、ウェル毎に結晶化の状態が所定のタイミングで観測され、所定の判定基準に基づいて各ウェル毎にランク付けされる。例えばランクをスコア0〜スコア9の10段階とすることができる。これにより各観測毎に各ウェルに対してスコア0〜スコア9のいずれかが付与されたプレートの観測実験データを得ることができる（例えば特許文献１参照）。スコアが大きい程結晶化の状態が良好であるといえ、Ｘ線構造解析を行う単結晶の候補となり得る。
【０００５】
ただし上記タンパク質の結晶化実験は、予め定められた沈殿剤と緩衝剤と添加剤とを複数種類組み合わせて第１段階の結晶化実験（初期スクリーニング）を行い、初期スクリーニングにおいて結晶化が良好であった組み合わせに対して、更に沈殿剤，緩衝剤，添加剤の組み合わせ等を展開して第２段階の結晶化実験（二次スクリーニング）を行い、初期スクリーニングにおいて結晶化が良好であった組み合わせに対して、当該組み合わせを量産して結晶化の確認実験（量産結晶化実験）を行い、Ｘ線構造解析を行う単結晶の候補を絞り込むように行われている。
【０００６】
例えば本出願人が既に特許出願している特願２００４−２７１３８９号に示されるように、初期スクリーニングとして、１６種類の沈殿剤と、６種類の緩衝剤と、５種類の添加剤を１４４通りに組み合わせて結晶化実験を行い、スコア４以上を獲得した組み合わせを二次スクリーニングに回し、二次スクリーニングにおいて初期スクリーニングの各組み合わせを沈殿剤濃度を４段階に、緩衝剤pHを６段階に振り分けることによって２４通りに展開して結晶化実験を行い、二次スクリーニングにおいてスコア６以上を獲得した組み合わせを量産結晶化実験に回す実験が行われている。
【０００７】
上記タンパク質の結晶化実験（初期スクリーニング，二次スクリーニング，量産結晶化実験）は、自動タンパク質結晶化ロボットによって自動的に行われる（例えば特願２００４−２７１３８９号参照）。自動タンパク質結晶化ロボットは、タンパク質試料と沈殿剤と緩衝剤と添加剤との組み合わせを入力指示することによって、当該組み合わせを所定のウェルに混入して結晶化を行う。スコア判断は観測者や画像処理等によって順次行われる。観測結果（実験結果）が自動的に順次蓄積され、この観測結果に基づいて上記のようにＸ線構造解析を行う単結晶の候補を絞り込む。
【特許文献１】特開２００３−１０７０７６号公報
【発明の開示】
【発明が解決しようとする課題】
【０００８】
上記実験結果は所定のデータベース等に蓄積されるが、一定期間ごとの実験結果が蓄積され、全体として膨大な量となる。したがって膨大な実験結果の処理は容易に行うことはできない。このため、例えば初期スクリーニングにおけるスコア４以上の組み合わせの検索や、二次スクリーニングにおけるスコア６以上の組み合わせの検索等を行い、実験結果の処理を容易に行うことができるタンパク質の結晶化実験データの処理システムが望まれていた。
【課題を解決するための手段】
【０００９】
上記課題を解決するための本発明のタンパク質の結晶化実験における観測データの処理システムは、異なる条件でタンパク質試料と試薬とが混合されてなる複数のサンプルの結晶化状態を、経時的に観測することによって得られる複数の観測データが蓄積される主データベースシステム３と、該主データベースシステム３に蓄積された観測データを処理する処理システム７とを備え、該処理システム７を、主データベースシステム３の観測データがサンプル毎に１レコードに纏められてなる作業用観測データを蓄積する作業用データベースシステム１１と、作業用データベースシステム３から予め定められた条件に基づいて所定のサンプルを、次工程の作業を行うサンプルとして選択して抽出する抽出システム１２とで構成したことを第１の特徴としている。
【００１０】
第２に、各観測データが、観測時に各サンプルに対して付与される結晶化状態のランクを表すデータを含み、抽出システム１２が、観測時の最高ランクが所定ランク以上である場合に、当該サンプルを抽出するシステムであることを特徴としている。
【００１１】
第３に、抽出されたサンプルが、次工程の作業で使用可能な条件を備えているか否かをチェックし、使用不可状態のサンプルを抽出システム１２による抽出から排除するチェックシステムを設けたことを特徴としている。
【発明の効果】
【００１２】
以上のように構成される本発明の構造によると、処理システムが主データベースシステムに蓄積された膨大な観測データを、サンプル毎に纏め、所定のサンプルを次工程の作業を行うサンプルとして自動的に選択して抽出するため、例えば初期スクリーニングにおいて結晶化状態が良好で二次スクリーニングに展開するサンプルや、二次スクリーニングにおいて結晶化状態が良好で量産結晶化実験を行うサンプル等を簡単に判別して、次工程に結晶化実験の指示を出すことができ、タンパク質の結晶化実験における観測データを円滑に処理し、実験を進めることができるという効果がある。
【００１３】
特に各観測データに、観測時に各サンプルに対して付与される結晶化状態のランクを表すデータを含め、抽出システムを、観測時の最高ランクが所定ランク以上である場合に、当該サンプルを抽出するシステムとすることによって、各サンプルの最高ランクによって、簡単に上記サンプルを抽出することができる。
【００１４】
そして抽出されたサンプルが、次工程の作業で使用可能な条件を備えているか否かをチェックし、使用不可状態のサンプルを抽出システムによる抽出から排除するチェックシステムを設けることによって、例えば初期スクリーニングにおいて結晶化状態が良好で二次スクリーニングに展開するサンプルや、二次スクリーニングにおいて結晶化状態が良好で量産結晶化実験を行うサンプル等を抽出した場合でも、当該サンプルが次工程の作業で使用可能な条件を備えておらず、二次スクリーニングや量産結晶化実験を行うことができない等の不都合を避けることができる。
【発明を実施するための最良の形態】
【００１５】
図１は本タンパク質の結晶化実験データの処理システムを使用したタンパク質の結晶化実験の概要を示すイメージ図である。所定のタンパク質試料と沈殿剤と緩衝剤（バッファ）と添加剤との組み合わせによるサンプルの結晶化実験は、該サンプルの結晶化依頼に従って結晶化ロボット１が実行する。
【００１６】
結晶化ロボット１は、結晶化依頼のあった組み合わせのサンプルを、複数のウェル（検体穴）が設けられたプレートの所定のウェルに混入し、当該プレートを、オイル中の恒温条件下で結晶化処理し、プレート内のサンプルの画像を、所定の観測タイミング、例えばサンプルの混合混入時点から概ね１週間毎に１０週間（７０日）、ウェル毎に観測用に出力する。
【００１７】
プレートには横方向に６個、縦方向に１２個の全７２個のウェル（受けとなる窪み穴）が形成されている。各プレートの各ウェルには各々、所定のタンパク質試料と、試薬となる複数種類の沈殿剤と緩衝剤と添加剤とが別々の条件で組み合わされたサンプルが混入され、これにより各プレートがサンプル用のプレートとなる。なお結晶化ロボット１は従来公知のものであり、詳細な説明は割愛する。
【００１８】
結晶化ロボット１からの出力画像は、コンピュータからなるデータサーバ２に蓄積される。データサーバ２には、主データベースシステム３がインストールされている。データサーバ２には、結晶化ロボット１から出力された観測用の画像のファイル（画像ファイル）が保存される画像ファイル用ストレージ４が設けられている。データサーバ２は、結晶化ロボット１と通信が可能な構成となっている。
【００１９】
結晶化ロボット１から出力される画像ファイルは、所定のファイルネームで画像ファイル用ストレージ４に逐次保存されていく。観測者は各画像ファイルを観測し、各画像に対して、番号，観察日時，結晶化開始日時，結晶化温度，結晶化タイプ，サンプルＩＤ，沈殿剤，緩衝剤，添加剤等をデータとして採り、所定の判断基準に基づいて結晶化状態に対してスコアを付してランク付けを行い、スコアをデータとして採る。上記番号は、プレート番号とウェル番号とを連続させた英数字からなる。これにより番号はウェル毎にユニークとなる。
【００２０】
スコア（score）は、score0〜score9までの１０段階が設定されている。各観測（画像ファイル）毎に割り当てられる。スコアランクの割り当ては、観測者の目視や、画像処理等による自動割当によって行われる。図２（Ａ）がscore0の一例、図２（Ｂ）がscore1の一例、図２（Ｃ）がscore2の一例、図２（Ｄ）がscore3の一例、図２（Ｅ）がscore4の一例、図２（Ｆ）がscore5の一例、図２（Ｇ）がscore6の一例、図２（Ｈ）がscore7の一例、図２（Ｉ）がscore8の一例、図２（Ｊ）がscore9の一例である。
【００２１】
スコアランクの判断は、概ね、クリアドロップ（変化がない）状態をScore0、薄い沈殿（もやもや）状態をScore1、濃い沈殿（砂状）状態をScore2、score2より濃い沈殿状態をScore3、ゼリー状の固まり状態をScore4、微結晶・針状結晶状態をScore5、やや小さい結晶状態をScore6、やや大きい結晶状態（ただし一部割れていたり、くっついていたりするものが存在する）をScore7、測定に適した大きい結晶状態をScore8、測定に適しているが非常に大きい結晶状態をScore9とする。
【００２２】
上記観測によって得られたデータが主データベースシステム３に登録される。なおscore0よりも結晶化状態が悪い場合や、画像撮影時等のエラーの場合に、score-1やscore-2，score-3とすることもできる。この場合は主データベースシステム３に、score-1やscore-2，score-3を登録することや、score0以下のスコアは全てscore0として登録する等の対応をとることができる。
【００２３】
主データベースシステム３は、例えば従来公知のSQLリレーショナルデータベースシステム等からなる。図３に示されるように、番号フィールド６Ａ，観察日時フィールド６Ｂ，結晶化開始日時フィールド６Ｃ，サンプルＩＤフィールド６Ｄ，沈殿剤フィールド６Ｅ，緩衝剤フィールド６Ｆ，添加剤フィールド６Ｇ，スコアフィールド６Ｈ，画像ファイルフィールド６Ｉ，結晶化温度フィールド６Ｊ，結晶化タイプ６Ｋ等の項目を備えたデータテーブルを備える。
【００２４】
画像ファイルは、画像ファイル用ストレージに保存されている画像ファイルのファイルネームを画像ファイルフィールドに書き込んだり、画像ファイルフィールドのデータ型をBLOB等のバイナリ大データ格納型とし、画像ファイル用ストレージに保存されている対応する画像ファイルをバイナリとして画像ファイルフィールドに直接書き込むこと等によってデータベースシステムに登録される。観測時に結晶化がない場合があり得るため、結晶化開始日時フィールドは、NULLデータを許容する。
【００２５】
以上のように結晶化ロボット１による結晶化実験に対する観測結果（実験結果）が主データベースシステム３の上記データテーブルに蓄積される。該データテーブルに蓄積された実験結果データ（観測データ）が本処理システム７に取り込まれ、データ処理されることによって、結晶化ロボット１に対して、所定の条件でのタンパク質の結晶化実験を指示したり、Ｘ線構造解析を行う単結晶の候補を引き出したりすることができる。
【００２６】
本実施形態において上記タンパク質の結晶化実験は、イソプロパノール（2-Propanol），リン酸ナトリウム（Na Phos），リン酸ニカリウム（K2 Phos＝沈殿剤としての機能も備えている）を含む１６種類の沈殿剤と、Acet（酢酸），Citr（クエン酸），MES（２−モルホリノエタンスルホン酸），HEPES（２−[４−（２ヒドロキシエチル）−１−ピペラジニル]エタンスルホン酸），Tris（トリス（ヒドロキシメチル）アミノメタン），CHES（Ｎ−シクロエキシル−２−アミノエタンスルホン酸）の６種類のバッファーと、Li Chlor（塩化リチウム），Mg Chlor（塩化マグネシウム），Ca Chlor（塩化カルシウム），Dioxane（ジオキサン）1，4-Dioxane（ジオキサン）の５種類の添加剤を１４４通りに組み合わせて試薬として初期スクリーニングを行う。
【００２７】
また初期スクリーニングにより微結晶が産出された条件（試薬）から沈殿剤濃度を４段階とバッファーpHを６段階に振り分け、初期スクリーニング１条件につき２４条件に展開して二次スクリーニングを行う。つまり本実施形態における上記タンパク質の結晶化実験に使用する全試薬は、初期スクリーニング用と二次スクリーニング用の２種類あり、初期スクリーニング用に144の試薬が、二次スクリーニング用に3456の試薬がある。なお本実施形態においては、この２４条件に展開したものを１Section（セクション）とする。１プレートには７２個の受けが設けられているため、１プレートで３セクションの二次スクリーニングを行うことができる。
【００２８】
本処理システム７は、データ処理コンピュータ８上に構成される。データ処理コンピュータ８は、データサーバ２との通信が可能な環境を備えたものとなっている。なお処理システム７を、データサーバ２上に構成し、主データベースシステム３とLoopbackによって通信するように構成することもできる。この場合データサーバ２はデータ処理コンピュータとしても機能する。
【００２９】
図４に示されるように、処理システム７は、情報取得・登録システム９と、作業用データベースシステム１１と、サンプル抽出システム１２とを備える。データ処理コンピュータ８はＣＲＴ等の表示装置（ディスプレイ）１３を備える。
【００３０】
作業用データベースシステム１１は、例えば従来公知のSQLリレーショナルデータベースシステムからなる。後述するように情報取得・登録システム９によって主データベースシステム３から取り込まれて加工された観測データ（作業用観測データ）が蓄積されるスコアテーブルと、各ウェルに使用するサンプルのデータが蓄積されているサンプルテーブルと、試薬の内訳（沈殿剤，緩衝剤，添加剤の種類と濃度等）が登録されている試薬No.テーブルと、各初期スクリーニング用の試薬No.に対する二次スクリーニング用の試薬No.が登録されている試薬関係テーブルとを備えている。
【００３１】
スコアテーブルは、図５に示されるように、サンプルIDフィールド１４Ａ，タンパクIDフィールド１４Ｂ，試薬No.フィールド１４Ｃ，最高スコアフィールド１４Ｄ，結晶化開始日時フィールド１４Ｅ，プレート番号フィールド１４Ｆ，ウェル番号フィールド１４Ｇ，結晶化温度フィールド１４Ｈ，結晶化タイプフィールド１４Ｉ，スコア観測日時フィールド１４Ｊ，スコアフィールド１４Ｋを持つ。
【００３２】
サンプルIDフィールド１４Ａはサンプルのロットを決定するキー、タンパクIDフィールド１４Ｂはタンパク質試料を決定するキー、試薬No.フィールド１４Ｃは試薬を決定するキー、最高スコアフィールド１４Ｄは当該ウェルにおいて観測された最高のスコア、結晶化開始日フィールド１４Ｅは結晶化を始めた日時、プレート番号フィールド１４Ｆはプレート番号、ウェル番号フィールド１４Ｇはウェル番号、結晶化温度フィールド１４Ｈは結晶化実験の温度条件(℃)、結晶化タイプフィールド１４Ｉは結晶化実験の種類、スコア観測日時フィールド１４Ｊは当該ウェルの観測を行った日時、スコアフィールド１４Ｋは各観測時のスコアが、主データベースシステム３のデータテーブルの各各観測データから展開されて登録される。
【００３３】
観測日時フィールドとスコアフィールドとは観測回数分設けられる。本実施形態においてはそれぞれ１０回分設けられている（観測が１週間毎に１０回行われるため）。結晶化開始日は、結晶化しないウェルもあるためNULLが許容される。
【００３４】
結晶化タイプフィールドには、当該ウェルにおける結晶化実験が、初期スクリーニングであるか、二次スクリーニングであるか、量産結晶化実験であるかが登録される。本実施形態においては、初期スクリーニングの場合は、「initial」、二次スクリーニングの場合は、「expand」、量産結晶化実験の場合は、「same」と登録される。
【００３５】
サンプルテーブルは、図６に示されるように、サンプルIDフィールド１６Ａ，タンパクIDフィールド１６Ｂ，タンパク濃度フィールド１６Ｃ，サンプル残量フィールド１６Ｄ，バッファー種類フィールド１６Ｅ，バッファー濃度フィールド１６Ｆ，塩種類フィールド１６Ｇ，塩濃度フィールド１６Ｈ，添加剤フィールド１６Ｉとを備える。
【００３６】
サンプルIDフィールド１６Ａにはサンプルのロットを決定するキー、タンパクIDフィールド１６Ｂにはタンパク質試料を決定するキー、タンパク濃度フィールド１６Ｃにはタンパクの濃度(mg/mL)、サンプル残量フィールド１６Ｄにはサンプルの残り容量(microL)、バッファー種類フィールド１６Ｅにはバッファーの種類、バッファー濃度フィールド１６Ｆにはバッファーの濃度(mol/L)、塩種類フィールド１６Ｇには塩（沈殿剤）の種類、塩濃度フィールド１６Ｈには塩の濃度(mol/L)、添加剤フィールド１６Ｉには添加剤の種類と濃度が登録される。
【００３７】
スコアテーブルの各行のサンプルIDフィールド１４Ａの値と、サンプルテーブルのサンプルIDフィールド１６Ａの値との一致によって、各行（各ウェル）における結晶化実験に使用したサンプルの詳細内容を得ることができる。なおスコアテーブルにおける各行のタンパクIDフィールド１４Ｂの値は、サンプルテーブルのサンプルIDフィールド１６Ａが一致した行のタンパクIDフィールド１６Ｂの値が展開されている。
【００３８】
スコアテーブルにおける各行の試薬No.フィールド１４Ｃの値と、試薬No.テーブルの試薬No.の値との一致によって、各行（ウェル）における結晶化実験に使用した試薬の詳細内容を得ることができる。
【００３９】
情報取得・登録システム９は、処理コンピュータ８にインストールされたプログラムに基づいて処理コンピュータ８が作動することによって処理コンピュータ８が機能する。情報取得・登録システム９は、主データベースシステム３に対するクライアントとなる。主データベースシステム３のデータテーブルを対象に検索条件を与え、検索条件に一致する観測データ（行）を主データベースシステム３に抽出させ、抽出した観測データを加工して作業用観測データとして作業用データベースシステム１１に登録する。
【００４０】
情報取得・登録システム９による作業用観測データの作業用データベースシステム１１への登録は、単一のウェルに対する全観測データを主データベースシステム３から抽出し、当該ウェルの、サンプルIDとタンパクIDと試薬No.と最高スコアと結晶化開始日とプレートNo.とウェルNo.と結晶化温度と結晶化タイプと各観測回のスコアと各観測回の観察日の各データを１レコードとし、このレコードを作業用データベースシステム１１のスコアテーブルに登録する。この登録作業を主データベースシステム３のデータテーブルに登録されている全ウェルに対して行う。
【００４１】
主データベースシステム３がSQLタイプのデータベースであった場合、主データベースシステム３にデータテーブルの全てのウェルを重複なく抽出させ、抽出された各ウェルを順にselectコマンドのキーとして主データベースシステム３にデータテーブルから観測データを抽出させて、主データベースシステム３から全観測データを各ウェル毎に抽出するように情報取得・登録システム９を構成することができる。以上のように情報取得・登録システム９によって作業用データベースシステム１１のスコアテーブルには、各ウェル毎に纏められた観測データが作業用観測データとして登録される。
【００４２】
サンプル抽出システム１２は、処理コンピュータ８にインストールされる複数のプログラムに基づいて処理コンピュータ８が作動することによって、処理コンピュータ８がサンプル抽出システム１２として機能する。
【００４３】
サンプル抽出システム１２は、作業用データベースシステム１１のスコアテーブルに登録された全ウェル、すなわちスコアテーブルの全行を対象にサンプル抽出処理を行い、結晶化状態が良好で、二次スクリーニング又は量産結晶化実験を行うサンプルや、再初期スクリーニングを行わせる再初期サンプルを選択して抽出し、ディスプレイ１３に抽出したサンプルを表示させるシステムとなっている。
【００４４】
処理コンピュータ８をサンプル抽出システム１２として機能させるプログラムとして、上記再初期サンプルを抽出する再初期サンプル抽出プログラムと、二次スクリーニング又は量産結晶化実験を行うサンプルを抽出する二次・同一サンプル抽出プログラムと、後述するウェイト処理プログラムとが処理コンピュータにインストールされている。
【００４５】
サンプル抽出システム１２によるサンプル抽出処理は、図７のフローチャートに示されるように、再初期サンプル抽出プログラムに基づく再初期サンプル抽出処理と、二次・同一サンプル抽出プログラムに基づく二次・同一サンプル抽出処理と、ウェイト処理プログラムに基づくウェイト処理とが、シリアルに実行されて行われる。
【００４６】
再初期サンプル抽出処理は、図８のフローチャートに示されるように、まずステップＳ１においてスコアテーブルから各プレート毎にウェルの作業用観測データを抽出し、ステップＳ２に進む。作業用データベースシステム１１がSQLタイプの場合、全てのプレート番号を重複無く抽出し、抽出された各プレート番号を順にselectコマンドのキーとしてスコアテーブルから作業用観測データを抽出することによって、各プレート毎に各ウェルの作業用観測データを抽出することができる。
【００４７】
ステップＳ２においては、抽出されたウェルの結晶化実験のタイプをチェックする。少なくとも１つの抽出されたウェルの作業用観測データの結晶化タイプフィールド１４Ｉをチェックすることによって、当該プレートのウェルにおいて行われた結晶化実験のタイプをチェックすることができる。ステップＳ２において、結晶化実験のタイプが初期スクリーニング（結晶化タイプフィールド１４Ｉがinitial）の場合、ステップＳ３に進む。
【００４８】
ステップＳ３においては、各ウェルの作業用観測データに基づき、各ウェルにおける結晶化実験開始時点から１週間後のスコアをチェックして、score0のウェルの数を積算し、ステップＳ４に進む。ステップＳ４においては、score0のウェルの数をチェックし、score0のウェルの数が50以上ある場合は、当該プレートのウェルの結晶化実験に使用した全サンプルは再初期スクリーニングを行う再初期候補サンプルとなるため、ステップＳ５に進み、当該プレートのウェルの結晶化実験に使用した全サンプルに対して選択処理を行い、再初期候補サンプルの絞込みを行う。
【００４９】
再初期スクリーニングは、当該プレート又はscore0のウェルの数が50以上ある他のプレートの中に、当該再初期候補サンプルとタンパク質が同一且つ試薬条件が濃度以外同一のサンプルが存在していた場合は、試薬の濃度が一番濃いサンプルのみを再初期サンプルとし、またScore0のウェルの数が50未満のプレートの中に、当該再初期候補サンプルとタンパク質が同一且つ試薬条件が濃度以外同一のサンプルが存在していた場合は、当該再初期候補サンプルを再初期サンプルとはしない。
【００５０】
このためステップＳ５における選択処理は、まず作業用データベースシステム１１がSQLタイプの場合、例えば当該プレートの所定のウェルのスコアテーブルにおけるタンパクIDフィールド１４Ｂと試薬No.フィールド１４Ｃの値をselectの対象キーとしてスコアテーブルを検索して、他のウェル（行）がヒットされるか否かをチェックする。
【００５１】
他のウェルがヒットした場合は、プレート番号フィールド１４Ｆの値によって、ヒットしたウェルのプレートが、Score0のウェルの数が50未満のプレートか、score0のウェルの数が50以上あるプレートかをチェックする。ヒットしたウェルのプレートが、Score0のウェルの数が50未満のプレートの場合は、当該サンプルを再初期候補サンプルから外す。
【００５２】
ヒットしたウェルのプレートが、Score0のウェルの数が50以上のプレートの場合は、サンプルIDフィールド１４Ａに基づきサンプルテーブルを検索し、試薬の濃度を比較し、当該サンプルより試薬の濃度が濃いサンプルが存在していた場合に、当該サンプルを再初期候補サンプルから外し、以上の処理を当該プレートの全ウェルに対して実行することによって行うことができる。
【００５３】
ステップＳ５において、再初期候補サンプルとして残った全サンプルの残量をステップＳ６に進み、チェックする。サンプルの残量チェックは、作業用データベースシステム１１がSQLタイプの場合、例えば再初期候補サンプルとして残った各ウェルのスコアテーブルから、全サンプルIDを重複無く抽出し、各サンプルIDを順にselectコマンドのキーとしてサンプルテーブルを検索し、ヒットした各サンプルテーブルの行のサンプル残量フィールドを抽出することにより行うことができる。
【００５４】
ステップＳ６において残量が80μL以上あるサンプルの場合は、サンプル量が十分であるとしてステップＳ７に進み、当該プレートを再初期登録リストに登録し、ステップＳ８に進み、他にチェックするプレートがあるか否かをチェックする。
【００５５】
ステップＳ６において残量が80μL未満のサンプルは、サンプル量が十分ではないとして、ステップＳ９に進み、他のサンプルの流用又はサンプルの新規精製（再精製）の依頼処理を行うサンプルとしてウェイトリストに登録され、ステップＳ８に進み、他にチェックするプレートがあるか否かをチェックする。上記サンプルのウェイトリストへの登録時には、再初期スクリーニング用のサンプルであることが情報として登録される。
【００５６】
ステップＳ４においてscore0のウェルの数が50未満である場合、及びステップＳ２において結晶化フィールドがinitial以外の場合は、そのままステップＳ８に進み、他にチェックするプレートがあるか否かをチェックする。
【００５７】
他にチェックするプレートがあるか否かは、例えばselectコマンドのキーとするプレート番号が残っているか否かによりチェックすることができる。ステップＳ８において他にチェックするプレートがある場合は、ステップＳ１に戻り、他にチェックするプレートがない場合は、二次・同一サンプル抽出処理を実行する。
【００５８】
以上に示される再初期サンプル抽出処理により、結晶化実験開始から１週間後にScore0のウェルが50以上あるプレートに使用した残量が80μL以上の所定の（選択処理によって選択された）サンプルが再処理サンプルとして再初期登録リストに登録される。なお再初期スクリーニングは、初期スクリーニングのサンプルを、濃度を倍にして再度初期スクリーニングするものである。
【００５９】
上記二次・同一サンプル抽出処理は、作業用データベースシステム１１におけるスコアテーブルの全行（結晶化実験済みの全ウェル）に対して順に実行される。図９のフローチャートに示されるように、まずステップＳ１においてウェルの結晶化タイプをチェックする。結晶化タイプのチェックは、対象ウェルの作業用観測データにおける結晶化タイプフィールド１４Ｉのチェックによって実行することができる。
【００６０】
結晶化タイプが初期スクリーニング（結晶化タイプフィールド１４Ｉがinitial）のウェルは、ステップＳ２に進み、観測時の最高のスコアをチェックする。最高のスコアは最高スコアフィールド１４Ｄのチェックによって可能である。最高スコアが４以上（最高スコアフィールド１４Ｄがscore４以上）の場合は、ステップＳ３に進み、上記同様に再度最高スコアをチェックする。
【００６１】
ステップＳ３において、最高スコアが６以上（最高スコアフィールド１４Ｄがscore6以上）の場合は、ステップＳ４に進み、回折チェック依頼のリストに登録してステップＳ５に進み重複チェックを行う。ステップＳ３において、最高スコアが６未満（最高スコアフィールド１４Ｄがscore6未満）の場合は、ステップＳ３からステップＳ５に進む（回折チェック依頼のリストに登録）されない。
【００６２】
ステップＳ５における重複チェックは、作業用データベースシステムにおけるスコアテーブルを参照して、当該ウェルに使用したサンプルが、既に実験済み（二次スクリーニングに展開済み）のものであるか否かをチェックする。複数の試薬とタンパク質試料の組み合わせによる結晶化実験が、初期スクリーニングや二次スクリーニングとして行われているため、同一の組み合わせとなる実験が過去に行われているケースが有り得るためである。
【００６３】
重複チェックは、作業用データベースシステム１１がSQLタイプの場合、例えば当該ウェルのスコアテーブルのタンパクIDフィールド１４Ｂと試薬No.フィールド１４Ｃの値をselectの対象キーとしてスコアテーブルを検索して、他のウェル（行）がヒットされるか否かによって行うことができる。
【００６４】
ステップＳ５において重複がなかった場合は、ステップＳ６に進み、当該ウェルに使用したサンプルに対応する二次スクリーニング用のサンプルの残量をチェックする。ステップＳ６においては、作業用データベースシステムがSQLタイプの場合、例えば試薬No.フィールド１４Ｃをselectコマンドのキーに、試薬関係テーブルを検索し、当該試薬に対する二次スクリーニング用の試薬の試薬No.を抽出し、且つ当該ウェルのスコアテーブルにおけるタンパクIDフィールド１４Ｂをキーにサンプルテーブルを検索し、ヒットしたサンプルテーブルの各行を対象に二次スクリーニング用に抽出された試薬No.の試薬の内容をselectコマンドのキーとして検索を行い、ヒットしたサンプルテーブルの各行のサンプル残量フィールドをチェックすることにより行うことができる。
【００６５】
ステップＳ６において残量が20μL以上ある二次スクリーニング用のサンプルは、サンプル量が十分であるとしてステップＳ７に進み、二次スクリーニングを行うサンプルとして展開依頼・依頼日登録のリストに登録され、ステップＳ８に進む。ステップＳ８においては、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップＳ１に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【００６６】
なおステップＳ２においてスコアが４未満（最高スコアフィールド１４ＤがScore4未満）の場合、ステップＳ５において重複があった場合もステップＳ８に進み、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップＳ１に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【００６７】
ステップＳ１において、結晶化タイプが二次スクリーニング（結晶化フィールドがexpand）のウェルは、ステップＳ９に進み、上記同様に最高スコアのチェックを行う。最高スコアが６以上（最高スコアフィールド１４ＤがScore6以上）の場合は、ステップＳ１０に進み、測定可能結晶を算出したウェルとして結晶化報告のリストに登録するとともに、回折チェック依頼のリストに登録し、ステップＳ１１に進む。
【００６８】
ステップＳ１１においては、当該ウェルの最高スコアが、所属セクション（Section）中での最高スコアか否かをチェックする。これは当該ウェルと同一セクションにあるウェルをスコアテーブルから検索して抽出し、抽出された他のウェル（行）の最高スコアフィールド１４Ｄの値と比較することによって行うことができる。
【００６９】
ステップＳ１１において、当該ウェルが所属セクション中での最高スコアであった場合は、ステップＳ１２に進み、重複チェックを行う。重複チェックは、初期スクリーニングの場合（ステップＳ５）と同様の理由で行われ、同様の手法で行うことができる。
【００７０】
ステップＳ１２において重複がなかった場合は、ステップＳ１３に進み、当該ウェルの結晶化実験に使用したサンプルの残量をチェックする。サンプルの残量チェックは、作業用データベースシステム１１がSQLタイプの場合、例えば当該ウェルのスコアテーブルにおけるサンプルIDフィールド１４Ａをselectコマンドのキーにサンプルテーブルを検索し、ヒットしたサンプルテーブルの行のサンプル残量フィールド１６Ｄをチェックすることにより行うことができる。
【００７１】
ステップＳ１３においてサンプルの残量が20μL以上ある場合は、サンプル量が十分であるとして量産結晶化実験を行うサンプルとして同一依頼・依頼日登録のリストに登録し、ステップＳ８に進み、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップＳ１に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【００７２】
なおステップＳ９においてスコアが６未満（最高スコアフィールド１４ＤがScore6未満）の場合、ステップＳ１１において当該ウェルが所属セクション中での最高スコアではない場合、ステップＳ１２において重複があった場合もステップＳ８に進み、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップＳ１に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【００７３】
ステップＳ１において、結晶化タイプが量産結晶化実験（結晶化フィールドがsame）のウェルは、ステップＳ１５に進み、上記同様に最高スコアのチェックを行う。最高スコアが６以上（最高スコアフィールド１４ＤがScore6以上）の場合は、ステップＳ１６に進み、測定可能結晶を算出したウェルとして結晶化報告のリストに登録するとともに、回折チェック依頼のリストに登録し、ステップＳ８に進み、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップＳ１に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【００７４】
なおステップＳ６及びステップＳ１３においてサンプルの残量が20μL未満の場合は、サンプル量が十分ではないと判断され、ステップＳ１７に進み、ステップＳ１７において、他のサンプルの流用又はサンプルの新規精製（再精製）の依頼処理を行うサンプルとしてウェイトリストに登録される。
【００７５】
ただしステップＳ６経由でウェイトリストに登録されるサンプルは、ウェイトリストへの登録時に、二次スクリーニング用のサンプルであることが情報として登録され、ステップＳ１３経由でウェイトリストに登録されるサンプルは、ウェイトリストへの登録時に、量産結晶化実験用のサンプルであることが情報として登録される。ウェイトリストに登録されたサンプルは後述するウェイト処理の対象となる。
【００７６】
上記二次・同一サンプル抽出処理のフローは、上記のように作業用データベースのスコアテーブルに登録されている全行（全ウェル）に対して順に実行されて終了する。
【００７７】
上記二次・同一サンプル抽出処理によって、重複が無く、初期スクリーニングの最高スコアの結果がスコア４以上の全てのウェルに使用されたサンプルに対する二次スクリーニング用の量が十分なサンプルが展開依頼・依頼日登録のリストに登録され、重複が無く、且つサンプル量が十分であり、且つ所属セクションにおいて最高スコアである二次スクリーニングの最高スコアの結果がスコア６以上の全てのウェルに使用されたサンプルが同一依頼・依頼日登録のリストに登録される。
【００７８】
また初期スクリーニングの最高スコアの結果が６以上の全てのウェルに使用されたサンプルと、二次スクリーニングの最高スコアの結果がスコア６以上の全てのウェルに使用されたサンプルと、量産結晶化実験の最高スコアの結果がスコア６以上の全てのウェルに使用されたサンプルが回折チェック依頼リストに登録される。
【００７９】
ウェイト処理は、ウェイトリストに登録された全てのサンプルに対して順に実行される。図１０のフローチャートに示されるように、ステップＳ１においては、異なるロットの使用が可能か否かをチェックする。異なるロットの使用が可能な場合とは、再精製されたロット番号（サンプルID）が異なるだけで、他が同一のサンプルの使用や、濃度の変更等によって対応が可能なサンプルの使用等が考えられる。
【００８０】
異なるロットの使用の可否は、当該サンプルのサンプルIDを除く他のフィールドの値をキーとして、作業用データベースシステム１１のサンプルテーブルを検索し、他のサンプルがヒットするか否かをチェックすること等によってチェックすることができる。
【００８１】
ステップＳ１において異なるロットの使用が可能である場合は、ステップＳ２に進み、当該サンプルをウェイトリストから削除し、ステップＳ３に進む。ステップＳ３においては当該サンプルが再初期スクリーニング用又は二次スクリーニング用又は量産結晶化実験用のいずれであるかをチェックする。
【００８２】
前述のようにウェイトリストには、各サンプルに対応して、当該サンプルが再初期スクリーニング用又は二次スクリーニング用又は量産結晶化実験用のいずれであるか情報が付加されているため、ステップＳ３のチェックは、ウェイトリストによって行うことができる。
【００８３】
ステップＳ３において当該サンプルが、初期スクリーニング用である場合は、ステップＳ４に進み、再初期サンプルとして再初期登録リストに登録し、当該サンプルが、二次スクリーニング用である場合は、ステップＳ５に進み、展開依頼・依頼日登録リストに登録し、当該サンプルが、量産結晶化実験用である場合は、ステップＳ６に進み、同一依頼・依頼日登録リストに登録し、それぞれ登録後ステップＳ７に進み、次に処理するサンプルの有無をチェックする。
【００８４】
ステップＳ１において、異なるロットの使用が不可である場合は、ステップＳ８に進み、重複して再精製依頼リストに登録されていないかをチェックし、重複して登録されていない場合は、ステップＳ９に進み、ウェイトリストに登録されている当該サンプルを再精製依頼リストに登録する。
【００８５】
ステップＳ９において、再精製登録依頼リストにサンプルを登録した後は、ステップＳ１０に進み、再精製されたサンプルが作業用データベースシステム１１のサンプルテーブルに登録されたか否かをチェックする。ステップＳ１０は、作業用データベースシステム１１がSQLタイプの場合、サンプルの内訳をselectコマンドのキーとしてサンプルテーブルを検索することによって、所定の行がヒットするか否かをチェックすることにより行うことができる。
【００８６】
ステップＳ１０において、再精製されたサンプルが作業用データベースシステム１１のサンプルテーブルに登録されている場合は、ステップＳ１１に進み、再精製登録依頼リストの登録を解除し、ステップＳ７に進む。ステップＳ１０において、再精製されたサンプルが作業用データベースシステム１１のサンプルテーブルに登録されていない場合は、ステップＳ１０からステップＳ７に進む。
【００８７】
ステップＳ７においては、次に処理するサンプルがある場合は、ステップＳ１に戻り、次に処理するサンプルがない場合は、処理を終了する。
【００８８】
上記ウェイト処理により、二次・同一サンプル抽出処理及び再初期サンプル抽出処理によりリストアップされた量が少ないサンプルは、異なるロットの使用が可能な場合は、同一依頼・依頼日登録リスト又は展開依頼・依頼日登録リスト又は再初期登録リストにリストアップされる。再精製となったものは、再精製完了後に行われるサンプル抽出制御によって、同一依頼・依頼日登録リスト又は展開依頼・依頼日登録リスト又は再初期登録リストにリストアップされる。
【００８９】
なお上記各リストは、プログラム言語が持つリストやハッシュの機能を使用することや、作業用データベースシステム１１等のデータベースシステムに各リストに対応するテーブルを設けること等によって実現される。
【００９０】
サンプル抽出システムは、上記のように展開依頼・依頼日登録リスト、同一依頼・依頼日登録リスト、結晶化報告リスト、回折チェック依頼リスト、再初期登録リスト、ウェイトリスト、再精製登録依頼リストに登録されたサンプルをリスト毎にディスプレイ１３に表示させることができる。
【００９１】
作業者は再初期登録リストを表示させることによって再度初期スクリーニングを行うサンプルを、展開依頼・依頼日登録リストを表示させることによって二次スクリーニングを行うサンプルを、同一依頼・依頼日登録リストを表示させることによって二次スクリーニングを行うサンプルを、結晶化報告リストを表示させることによって測定可能結晶を産出したサンプルを容易に確認することができ、タンパク質の結晶化実験の実験結果の整理を自動的に容易に行うことができ、次工程（再初期スクリーニング，二次スクリーニング，量産結晶化実験，回折チェック）に対する結晶化実験の指示を容易に出し、結晶化実験を継続させることができる。
【００９２】
サンプル抽出システムは、次工程を行うためのサンプルを、上記のようにスコアを基準にして容易に選択して抽出し、再初期登録リスト、展開依頼・依頼日登録リスト、同一依頼・依頼日登録リスト、回折チェック依頼リストに登録する。
【００９３】
ただし、再初期サンプル抽出処理のステップＳ５とステップＳ６、二次・同一サンプル抽出処理のステップＳ６とステップＳ１３と、ウェイト処理によって、チェックシステムを構成し、サンプル抽出システム作動時に、容量が少なかったり、異なるロットの使用ができない等のサンプルは、次工程の作業（再初期スクリーニング，二次スクリーニング，量産結晶化実験）で使用可能な条件を備えていないとして、再精製登録依頼リスト又は展開依頼・依頼日登録リスト又は同一依頼・依頼日登録リストへの登録から排除するように構成されている。
【００９４】
これにより次工程での作業を行う際に、サンプル量が足りない等のトラブルを未然に防止することができる。なお異なるロットが使用できるサンプルや、再精製が完了したサンプルは、再精製登録依頼リストや、展開依頼・依頼日登録リスト、同一依頼・依頼日登録リストに登録されるため、対象となったサンプルの結晶化実験が漏れる等の不都合は防止される。
【００９５】
以上のような本処理システム７を作動させることによって、図１１のフローチャートに則ったタンパク質の結晶化実験を行うことが可能となる。本処理システム７を使用して、初期スクリーニングの結果、展開依頼・依頼日登録リストによってスコア４以上のサンプルを二次スクリーニングに容易に送り、二次スクリーニングの結果、同一依頼・依頼日登録リストによって、スコア６以上であり、且つセクション内で最高のスコアであるサンプルを量産結晶化実験に容易に送り、各段階のスクリーニングを行わせる指示を、次工程に簡単に出すことができる。
【００９６】
各段階のスクリーニングで、スコア６以上のサンプルは、回折チェック依頼リストに登録されるため、回折チェック依頼リストによって、回折チェックの指示を簡単に出すことができる。回折チェックにおいては、回折チェック依頼リストに基づいて容易に分解能チェックの作業を行うことができる。
【００９７】
回折チェックにおいては、分解能の値は小さいほど良好な結果であるといえる。そして通常は分解能が４Åが良否の境界となるため、分解能が４Åよりも良好となる、分解能が４Å未満のサンプルに関して、Ｘ線構造解析を行う単結晶の候補として回折結果報告を行い実験を終了することができる。
【００９８】
分解能のチェックにおいて4.0Å以上の場合は、高度化を行い、再度適切な段階でのスクリーニングを行わせることができる。本処理システムによって、以上のようなタンパク質の結晶化実験を円滑且つ簡単に進めることが可能となる。
【００９９】
なおサンプル抽出システム１２における各段階でのサンプルの抽出条件や、ウェイトリストへの登録条件は、例えば変数等として登録するように構成することにより、容易に変更が可能となる。実際に行う実験に合わせて、上記サンプルの抽出条件やウェイトリストへの登録条件等を変更することにより、タンパク質の結晶化実験を様々なバリエーションで行い、Ｘ線構造解析を行う単結晶の候補を容易に絞り込む実験等を適切な条件で行うことができる。
【産業上の利用可能性】
【０１００】
タンパク質の結晶化実験を適切な段階のスクリーニングを行い、Ｘ線構造解析を行う単結晶の候補を絞り込む実験に適用できる。
【図面の簡単な説明】
【０１０１】
【図１】本処理装置を使用したタンパク質の結晶化実験システムの概要図である。
【図２】各スコアのサンプルの表示図である。
【図３】主データベースシステムにおけるデータテーブルの概念を示す概念図である。
【図４】処理システムのブロック図である。
【図５】作業用データベースシステムにおけるスコアテーブルの概念を示す概念図である。
【図６】作業用データベースシステムにおけるサンプルテーブルの概念を示す概念図である。
【図７】サンプル抽出処理のフローチャート図である。
【図８】再初期サンプル抽出処理のフローチャート図である。
【図９】二次・同一サンプル抽出処理のフローチャート図である。
【図１０】ウェイト処理のフローチャート図である。
【図１１】本処理システムを使用したタンパク質の結晶化実験の一例を示すフローチャート図である。
【符号の説明】
【０１０２】
３主データベースシステム
７処理システム
１１作業用データベースシステム
１２サンプル抽出システム（抽出システム）

【特許請求の範囲】
【請求項１】
異なる条件でタンパク質試料と試薬とが混合されてなる複数のサンプルの結晶化状態を、経時的に観測することによって得られる複数の観測データが蓄積される主データベースシステム（３）と、該主データベースシステム（３）に蓄積された観測データを処理する処理システム（７）とを備え、該処理システム（７）を、主データベースシステム（３）の観測データがサンプル毎に１レコードに纏められてなる作業用観測データを蓄積する作業用データベースシステム（１１）と、作業用データベースシステム（３）から予め定められた条件に基づいて所定のサンプルを、次工程の作業を行うサンプルとして選択して抽出する抽出システム（１２）とで構成したタンパク質の結晶化実験における観測データの処理システム。
【請求項２】
各観測データが、観測時に各サンプルに対して付与される結晶化状態のランクを表すデータを含み、抽出システム（１２）が、観測時の最高ランクが所定ランク以上である場合に、当該サンプルを抽出するシステムである請求項１のタンパク質の結晶化実験における観測データの処理システム。
【請求項３】
抽出されたサンプルが、次工程の作業で使用可能な条件を備えているか否かをチェックし、使用不可状態のサンプルを抽出システム（１２）による抽出から排除するチェックシステムを設けた請求項１又は２のタンパク質の結晶化実験における観測データの処理システム。

【図１】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【図２】

【公開番号】特開２００７−３３０４６（Ｐ２００７−３３０４６Ａ）
【公開日】平成１９年２月８日（２００７．２．８）
【国際特許分類】

【出願番号】特願２００５−２１２４３７（Ｐ２００５−２１２４３７）
【出願日】平成１７年７月２２日（２００５．７．２２）
【国等の委託研究の成果に係る記載事項】（出願人による申告）国等の委託研究の成果に係る特許出願（平成１６年度、文部科学省、タンパク３０００委託研究「タンパク質基本構造の網羅的解析プログラム」、産業活力再生特別措置法第３０条の適用を受けるもの）
【出願人】（５０３３５９８２１）独立行政法人理化学研究所 (1,056)
【出願人】（３０００６３１０５）株式会社システムデザイン・アクティ (1)
【Ｆターム（参考）】

[ Back to top ]

タンパク質の結晶化実験における観測データの処理システム

メニュー

スポンサーリンク

次の公報 »

« 前の公報

タンパク質の結晶化実験における観測データの処理システム

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク