説明

タンパク質の結晶化実験における観測データの処理システム

【課題】初期スクリーニングや二次スクリーニング等のタンパク質の結晶化実験に際して蓄積される膨大な観測データを処理するタンパク質の結晶化実験における観測データの処理システムを提供することを課題としている。
【解決手段】異なる条件でタンパク質試料と試薬とが混合されてなる複数のサンプルの結晶化状態を、経時的に観測することによって得られる複数の観測データが蓄積される主データベースシステム3に蓄積された観測データを処理する処理システム7を、主データベースシステム3の観測データがサンプル毎に1レコードに纏められてなる作業用観測データを蓄積する作業用データベースシステム11と、作業用データベースシステム3から予め定められた条件に基づいて所定のサンプルを、次工程の作業を行うサンプルとして選択して抽出する抽出システム12とで構成した。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、タンパク質の結晶化実験に際して蓄積される膨大な観測データを処理する観測データの処理システムに関する。
【背景技術】
【0002】
今日生物科学はめざましい進歩を遂げているが、タンパク質分子のその優れた機能と構造との相関の理解はまだまだ不十分である。このためタンパク質分子の構造解析として三次元構造解析を行う必要がある。タンパク質分子の三次元構造解析は、一般的にはX線構造解析法が使用される。ただしX線構造解析法を使用するためには、X線構造解析が可能なタンパク質の単結晶が必要となる。このためX線構造解析法の前段階としてタンパク質の結晶化実験が必要となる。
【0003】
タンパク質の結晶化実験は、複数のウェル(検体穴)が設けられたプレートを使用して行われる。所定のタンパク質試料に対して、試薬となる複数種類の沈殿剤と緩衝剤(バッファ)と添加剤とを別々の条件で組み合わせて、各ウェルに混入してサンプル用のプレートし、サンプル用のプレートを、オイル中の恒温条件下で結晶化処理して行われる。
【0004】
プレート内の検体は、ウェル毎に結晶化の状態が所定のタイミングで観測され、所定の判定基準に基づいて各ウェル毎にランク付けされる。例えばランクをスコア0〜スコア9の10段階とすることができる。これにより各観測毎に各ウェルに対してスコア0〜スコア9のいずれかが付与されたプレートの観測実験データを得ることができる(例えば特許文献1参照)。スコアが大きい程結晶化の状態が良好であるといえ、X線構造解析を行う単結晶の候補となり得る。
【0005】
ただし上記タンパク質の結晶化実験は、予め定められた沈殿剤と緩衝剤と添加剤とを複数種類組み合わせて第1段階の結晶化実験(初期スクリーニング)を行い、初期スクリーニングにおいて結晶化が良好であった組み合わせに対して、更に沈殿剤,緩衝剤,添加剤の組み合わせ等を展開して第2段階の結晶化実験(二次スクリーニング)を行い、初期スクリーニングにおいて結晶化が良好であった組み合わせに対して、当該組み合わせを量産して結晶化の確認実験(量産結晶化実験)を行い、X線構造解析を行う単結晶の候補を絞り込むように行われている。
【0006】
例えば本出願人が既に特許出願している特願2004−271389号に示されるように、初期スクリーニングとして、16種類の沈殿剤と、6種類の緩衝剤と、5種類の添加剤を144通りに組み合わせて結晶化実験を行い、スコア4以上を獲得した組み合わせを二次スクリーニングに回し、二次スクリーニングにおいて初期スクリーニングの各組み合わせを沈殿剤濃度を4段階に、緩衝剤pHを6段階に振り分けることによって24通りに展開して結晶化実験を行い、二次スクリーニングにおいてスコア6以上を獲得した組み合わせを量産結晶化実験に回す実験が行われている。
【0007】
上記タンパク質の結晶化実験(初期スクリーニング,二次スクリーニング,量産結晶化実験)は、自動タンパク質結晶化ロボットによって自動的に行われる(例えば特願2004−271389号参照)。自動タンパク質結晶化ロボットは、タンパク質試料と沈殿剤と緩衝剤と添加剤との組み合わせを入力指示することによって、当該組み合わせを所定のウェルに混入して結晶化を行う。スコア判断は観測者や画像処理等によって順次行われる。観測結果(実験結果)が自動的に順次蓄積され、この観測結果に基づいて上記のようにX線構造解析を行う単結晶の候補を絞り込む。
【特許文献1】特開2003−107076号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
上記実験結果は所定のデータベース等に蓄積されるが、一定期間ごとの実験結果が蓄積され、全体として膨大な量となる。したがって膨大な実験結果の処理は容易に行うことはできない。このため、例えば初期スクリーニングにおけるスコア4以上の組み合わせの検索や、二次スクリーニングにおけるスコア6以上の組み合わせの検索等を行い、実験結果の処理を容易に行うことができるタンパク質の結晶化実験データの処理システムが望まれていた。
【課題を解決するための手段】
【0009】
上記課題を解決するための本発明のタンパク質の結晶化実験における観測データの処理システムは、異なる条件でタンパク質試料と試薬とが混合されてなる複数のサンプルの結晶化状態を、経時的に観測することによって得られる複数の観測データが蓄積される主データベースシステム3と、該主データベースシステム3に蓄積された観測データを処理する処理システム7とを備え、該処理システム7を、主データベースシステム3の観測データがサンプル毎に1レコードに纏められてなる作業用観測データを蓄積する作業用データベースシステム11と、作業用データベースシステム3から予め定められた条件に基づいて所定のサンプルを、次工程の作業を行うサンプルとして選択して抽出する抽出システム12とで構成したことを第1の特徴としている。
【0010】
第2に、各観測データが、観測時に各サンプルに対して付与される結晶化状態のランクを表すデータを含み、抽出システム12が、観測時の最高ランクが所定ランク以上である場合に、当該サンプルを抽出するシステムであることを特徴としている。
【0011】
第3に、抽出されたサンプルが、次工程の作業で使用可能な条件を備えているか否かをチェックし、使用不可状態のサンプルを抽出システム12による抽出から排除するチェックシステムを設けたことを特徴としている。
【発明の効果】
【0012】
以上のように構成される本発明の構造によると、処理システムが主データベースシステムに蓄積された膨大な観測データを、サンプル毎に纏め、所定のサンプルを次工程の作業を行うサンプルとして自動的に選択して抽出するため、例えば初期スクリーニングにおいて結晶化状態が良好で二次スクリーニングに展開するサンプルや、二次スクリーニングにおいて結晶化状態が良好で量産結晶化実験を行うサンプル等を簡単に判別して、次工程に結晶化実験の指示を出すことができ、タンパク質の結晶化実験における観測データを円滑に処理し、実験を進めることができるという効果がある。
【0013】
特に各観測データに、観測時に各サンプルに対して付与される結晶化状態のランクを表すデータを含め、抽出システムを、観測時の最高ランクが所定ランク以上である場合に、当該サンプルを抽出するシステムとすることによって、各サンプルの最高ランクによって、簡単に上記サンプルを抽出することができる。
【0014】
そして抽出されたサンプルが、次工程の作業で使用可能な条件を備えているか否かをチェックし、使用不可状態のサンプルを抽出システムによる抽出から排除するチェックシステムを設けることによって、例えば初期スクリーニングにおいて結晶化状態が良好で二次スクリーニングに展開するサンプルや、二次スクリーニングにおいて結晶化状態が良好で量産結晶化実験を行うサンプル等を抽出した場合でも、当該サンプルが次工程の作業で使用可能な条件を備えておらず、二次スクリーニングや量産結晶化実験を行うことができない等の不都合を避けることができる。
【発明を実施するための最良の形態】
【0015】
図1は本タンパク質の結晶化実験データの処理システムを使用したタンパク質の結晶化実験の概要を示すイメージ図である。所定のタンパク質試料と沈殿剤と緩衝剤(バッファ)と添加剤との組み合わせによるサンプルの結晶化実験は、該サンプルの結晶化依頼に従って結晶化ロボット1が実行する。
【0016】
結晶化ロボット1は、結晶化依頼のあった組み合わせのサンプルを、複数のウェル(検体穴)が設けられたプレートの所定のウェルに混入し、当該プレートを、オイル中の恒温条件下で結晶化処理し、プレート内のサンプルの画像を、所定の観測タイミング、例えばサンプルの混合混入時点から概ね1週間毎に10週間(70日)、ウェル毎に観測用に出力する。
【0017】
プレートには横方向に6個、縦方向に12個の全72個のウェル(受けとなる窪み穴)が形成されている。各プレートの各ウェルには各々、所定のタンパク質試料と、試薬となる複数種類の沈殿剤と緩衝剤と添加剤とが別々の条件で組み合わされたサンプルが混入され、これにより各プレートがサンプル用のプレートとなる。なお結晶化ロボット1は従来公知のものであり、詳細な説明は割愛する。
【0018】
結晶化ロボット1からの出力画像は、コンピュータからなるデータサーバ2に蓄積される。データサーバ2には、主データベースシステム3がインストールされている。データサーバ2には、結晶化ロボット1から出力された観測用の画像のファイル(画像ファイル)が保存される画像ファイル用ストレージ4が設けられている。データサーバ2は、結晶化ロボット1と通信が可能な構成となっている。
【0019】
結晶化ロボット1から出力される画像ファイルは、所定のファイルネームで画像ファイル用ストレージ4に逐次保存されていく。観測者は各画像ファイルを観測し、各画像に対して、番号,観察日時,結晶化開始日時,結晶化温度,結晶化タイプ,サンプルID,沈殿剤,緩衝剤,添加剤等をデータとして採り、所定の判断基準に基づいて結晶化状態に対してスコアを付してランク付けを行い、スコアをデータとして採る。上記番号は、プレート番号とウェル番号とを連続させた英数字からなる。これにより番号はウェル毎にユニークとなる。
【0020】
スコア(score)は、score0〜score9までの10段階が設定されている。各観測(画像ファイル)毎に割り当てられる。スコアランクの割り当ては、観測者の目視や、画像処理等による自動割当によって行われる。図2(A)がscore0の一例、図2(B)がscore1の一例、図2(C)がscore2の一例、図2(D)がscore3の一例、図2(E)がscore4の一例、図2(F)がscore5の一例、図2(G)がscore6の一例、図2(H)がscore7の一例、図2(I)がscore8の一例、図2(J)がscore9の一例である。
【0021】
スコアランクの判断は、概ね、クリアドロップ(変化がない)状態をScore0、薄い沈殿(もやもや)状態をScore1、濃い沈殿(砂状)状態をScore2、score2より濃い沈殿状態をScore3、ゼリー状の固まり状態をScore4、微結晶・針状結晶状態をScore5、やや小さい結晶状態をScore6、やや大きい結晶状態(ただし一部割れていたり、くっついていたりするものが存在する)をScore7、測定に適した大きい結晶状態をScore8、測定に適しているが非常に大きい結晶状態をScore9とする。
【0022】
上記観測によって得られたデータが主データベースシステム3に登録される。なおscore0よりも結晶化状態が悪い場合や、画像撮影時等のエラーの場合に、score-1やscore-2,score-3とすることもできる。この場合は主データベースシステム3に、score-1やscore-2,score-3を登録することや、score0以下のスコアは全てscore0として登録する等の対応をとることができる。
【0023】
主データベースシステム3は、例えば従来公知のSQLリレーショナルデータベースシステム等からなる。図3に示されるように、番号フィールド6A,観察日時フィールド6B,結晶化開始日時フィールド6C,サンプルIDフィールド6D,沈殿剤フィールド6E,緩衝剤フィールド6F,添加剤フィールド6G,スコアフィールド6H,画像ファイルフィールド6I,結晶化温度フィールド6J,結晶化タイプ6K等の項目を備えたデータテーブルを備える。
【0024】
画像ファイルは、画像ファイル用ストレージに保存されている画像ファイルのファイルネームを画像ファイルフィールドに書き込んだり、画像ファイルフィールドのデータ型をBLOB等のバイナリ大データ格納型とし、画像ファイル用ストレージに保存されている対応する画像ファイルをバイナリとして画像ファイルフィールドに直接書き込むこと等によってデータベースシステムに登録される。観測時に結晶化がない場合があり得るため、結晶化開始日時フィールドは、NULLデータを許容する。
【0025】
以上のように結晶化ロボット1による結晶化実験に対する観測結果(実験結果)が主データベースシステム3の上記データテーブルに蓄積される。該データテーブルに蓄積された実験結果データ(観測データ)が本処理システム7に取り込まれ、データ処理されることによって、結晶化ロボット1に対して、所定の条件でのタンパク質の結晶化実験を指示したり、X線構造解析を行う単結晶の候補を引き出したりすることができる。
【0026】
本実施形態において上記タンパク質の結晶化実験は、イソプロパノール(2-Propanol),リン酸ナトリウム(Na Phos),リン酸ニカリウム(K2 Phos=沈殿剤としての機能も備えている)を含む16種類の沈殿剤と、Acet(酢酸),Citr(クエン酸),MES(2−モルホリノエタンスルホン酸),HEPES(2−[4−(2ヒドロキシエチル)−1−ピペラジニル]エタンスルホン酸),Tris(トリス(ヒドロキシメチル)アミノメタン),CHES(N−シクロエキシル−2−アミノエタンスルホン酸)の6種類のバッファーと、Li Chlor(塩化リチウム),Mg Chlor(塩化マグネシウム),Ca Chlor(塩化カルシウム),Dioxane(ジオキサン)1,4-Dioxane(ジオキサン)の5種類の添加剤を144通りに組み合わせて試薬として初期スクリーニングを行う。
【0027】
また初期スクリーニングにより微結晶が産出された条件(試薬)から沈殿剤濃度を4段階とバッファーpHを6段階に振り分け、初期スクリーニング1条件につき24条件に展開して二次スクリーニングを行う。つまり本実施形態における上記タンパク質の結晶化実験に使用する全試薬は、初期スクリーニング用と二次スクリーニング用の2種類あり、初期スクリーニング用に144の試薬が、二次スクリーニング用に3456の試薬がある。なお本実施形態においては、この24条件に展開したものを1Section(セクション)とする。1プレートには72個の受けが設けられているため、1プレートで3セクションの二次スクリーニングを行うことができる。
【0028】
本処理システム7は、データ処理コンピュータ8上に構成される。データ処理コンピュータ8は、データサーバ2との通信が可能な環境を備えたものとなっている。なお処理システム7を、データサーバ2上に構成し、主データベースシステム3とLoopbackによって通信するように構成することもできる。この場合データサーバ2はデータ処理コンピュータとしても機能する。
【0029】
図4に示されるように、処理システム7は、情報取得・登録システム9と、作業用データベースシステム11と、サンプル抽出システム12とを備える。データ処理コンピュータ8はCRT等の表示装置(ディスプレイ)13を備える。
【0030】
作業用データベースシステム11は、例えば従来公知のSQLリレーショナルデータベースシステムからなる。後述するように情報取得・登録システム9によって主データベースシステム3から取り込まれて加工された観測データ(作業用観測データ)が蓄積されるスコアテーブルと、各ウェルに使用するサンプルのデータが蓄積されているサンプルテーブルと、試薬の内訳(沈殿剤,緩衝剤,添加剤の種類と濃度等)が登録されている試薬No.テーブルと、各初期スクリーニング用の試薬No.に対する二次スクリーニング用の試薬No.が登録されている試薬関係テーブルとを備えている。
【0031】
スコアテーブルは、図5に示されるように、サンプルIDフィールド14A,タンパクIDフィールド14B,試薬No.フィールド14C,最高スコアフィールド14D,結晶化開始日時フィールド14E,プレート番号フィールド14F,ウェル番号フィールド14G,結晶化温度フィールド14H,結晶化タイプフィールド14I,スコア観測日時フィールド14J,スコアフィールド14Kを持つ。
【0032】
サンプルIDフィールド14Aはサンプルのロットを決定するキー、タンパクIDフィールド14Bはタンパク質試料を決定するキー、試薬No.フィールド14Cは試薬を決定するキー、最高スコアフィールド14Dは当該ウェルにおいて観測された最高のスコア、結晶化開始日フィールド14Eは結晶化を始めた日時、プレート番号フィールド14Fはプレート番号、ウェル番号フィールド14Gはウェル番号、結晶化温度フィールド14Hは結晶化実験の温度条件(℃)、結晶化タイプフィールド14Iは結晶化実験の種類、スコア観測日時フィールド14Jは当該ウェルの観測を行った日時、スコアフィールド14Kは各観測時のスコアが、主データベースシステム3のデータテーブルの各各観測データから展開されて登録される。
【0033】
観測日時フィールドとスコアフィールドとは観測回数分設けられる。本実施形態においてはそれぞれ10回分設けられている(観測が1週間毎に10回行われるため)。結晶化開始日は、結晶化しないウェルもあるためNULLが許容される。
【0034】
結晶化タイプフィールドには、当該ウェルにおける結晶化実験が、初期スクリーニングであるか、二次スクリーニングであるか、量産結晶化実験であるかが登録される。本実施形態においては、初期スクリーニングの場合は、「initial」、二次スクリーニングの場合は、「expand」、量産結晶化実験の場合は、「same」と登録される。
【0035】
サンプルテーブルは、図6に示されるように、サンプルIDフィールド16A,タンパクIDフィールド16B,タンパク濃度フィールド16C,サンプル残量フィールド16D,バッファー種類フィールド16E,バッファー濃度フィールド16F,塩種類フィールド16G,塩濃度フィールド16H,添加剤フィールド16Iとを備える。
【0036】
サンプルIDフィールド16Aにはサンプルのロットを決定するキー、タンパクIDフィールド16Bにはタンパク質試料を決定するキー、タンパク濃度フィールド16Cにはタンパクの濃度(mg/mL)、サンプル残量フィールド16Dにはサンプルの残り容量(microL)、バッファー種類フィールド16Eにはバッファーの種類、バッファー濃度フィールド16Fにはバッファーの濃度(mol/L)、塩種類フィールド16Gには塩(沈殿剤)の種類、塩濃度フィールド16Hには塩の濃度(mol/L)、添加剤フィールド16Iには添加剤の種類と濃度が登録される。
【0037】
スコアテーブルの各行のサンプルIDフィールド14Aの値と、サンプルテーブルのサンプルIDフィールド16Aの値との一致によって、各行(各ウェル)における結晶化実験に使用したサンプルの詳細内容を得ることができる。なおスコアテーブルにおける各行のタンパクIDフィールド14Bの値は、サンプルテーブルのサンプルIDフィールド16Aが一致した行のタンパクIDフィールド16Bの値が展開されている。
【0038】
スコアテーブルにおける各行の試薬No.フィールド14Cの値と、試薬No.テーブルの試薬No.の値との一致によって、各行(ウェル)における結晶化実験に使用した試薬の詳細内容を得ることができる。
【0039】
情報取得・登録システム9は、処理コンピュータ8にインストールされたプログラムに基づいて処理コンピュータ8が作動することによって処理コンピュータ8が機能する。情報取得・登録システム9は、主データベースシステム3に対するクライアントとなる。主データベースシステム3のデータテーブルを対象に検索条件を与え、検索条件に一致する観測データ(行)を主データベースシステム3に抽出させ、抽出した観測データを加工して作業用観測データとして作業用データベースシステム11に登録する。
【0040】
情報取得・登録システム9による作業用観測データの作業用データベースシステム11への登録は、単一のウェルに対する全観測データを主データベースシステム3から抽出し、当該ウェルの、サンプルIDとタンパクIDと試薬No.と最高スコアと結晶化開始日とプレートNo.とウェルNo.と結晶化温度と結晶化タイプと各観測回のスコアと各観測回の観察日の各データを1レコードとし、このレコードを作業用データベースシステム11のスコアテーブルに登録する。この登録作業を主データベースシステム3のデータテーブルに登録されている全ウェルに対して行う。
【0041】
主データベースシステム3がSQLタイプのデータベースであった場合、主データベースシステム3にデータテーブルの全てのウェルを重複なく抽出させ、抽出された各ウェルを順にselectコマンドのキーとして主データベースシステム3にデータテーブルから観測データを抽出させて、主データベースシステム3から全観測データを各ウェル毎に抽出するように情報取得・登録システム9を構成することができる。以上のように情報取得・登録システム9によって作業用データベースシステム11のスコアテーブルには、各ウェル毎に纏められた観測データが作業用観測データとして登録される。
【0042】
サンプル抽出システム12は、処理コンピュータ8にインストールされる複数のプログラムに基づいて処理コンピュータ8が作動することによって、処理コンピュータ8がサンプル抽出システム12として機能する。
【0043】
サンプル抽出システム12は、作業用データベースシステム11のスコアテーブルに登録された全ウェル、すなわちスコアテーブルの全行を対象にサンプル抽出処理を行い、結晶化状態が良好で、二次スクリーニング又は量産結晶化実験を行うサンプルや、再初期スクリーニングを行わせる再初期サンプルを選択して抽出し、ディスプレイ13に抽出したサンプルを表示させるシステムとなっている。
【0044】
処理コンピュータ8をサンプル抽出システム12として機能させるプログラムとして、上記再初期サンプルを抽出する再初期サンプル抽出プログラムと、二次スクリーニング又は量産結晶化実験を行うサンプルを抽出する二次・同一サンプル抽出プログラムと、後述するウェイト処理プログラムとが処理コンピュータにインストールされている。
【0045】
サンプル抽出システム12によるサンプル抽出処理は、図7のフローチャートに示されるように、再初期サンプル抽出プログラムに基づく再初期サンプル抽出処理と、二次・同一サンプル抽出プログラムに基づく二次・同一サンプル抽出処理と、ウェイト処理プログラムに基づくウェイト処理とが、シリアルに実行されて行われる。
【0046】
再初期サンプル抽出処理は、図8のフローチャートに示されるように、まずステップS1においてスコアテーブルから各プレート毎にウェルの作業用観測データを抽出し、ステップS2に進む。作業用データベースシステム11がSQLタイプの場合、全てのプレート番号を重複無く抽出し、抽出された各プレート番号を順にselectコマンドのキーとしてスコアテーブルから作業用観測データを抽出することによって、各プレート毎に各ウェルの作業用観測データを抽出することができる。
【0047】
ステップS2においては、抽出されたウェルの結晶化実験のタイプをチェックする。少なくとも1つの抽出されたウェルの作業用観測データの結晶化タイプフィールド14Iをチェックすることによって、当該プレートのウェルにおいて行われた結晶化実験のタイプをチェックすることができる。ステップS2において、結晶化実験のタイプが初期スクリーニング(結晶化タイプフィールド14Iがinitial)の場合、ステップS3に進む。
【0048】
ステップS3においては、各ウェルの作業用観測データに基づき、各ウェルにおける結晶化実験開始時点から1週間後のスコアをチェックして、score0のウェルの数を積算し、ステップS4に進む。ステップS4においては、score0のウェルの数をチェックし、score0のウェルの数が50以上ある場合は、当該プレートのウェルの結晶化実験に使用した全サンプルは再初期スクリーニングを行う再初期候補サンプルとなるため、ステップS5に進み、当該プレートのウェルの結晶化実験に使用した全サンプルに対して選択処理を行い、再初期候補サンプルの絞込みを行う。
【0049】
再初期スクリーニングは、当該プレート又はscore0のウェルの数が50以上ある他のプレートの中に、当該再初期候補サンプルとタンパク質が同一且つ試薬条件が濃度以外同一のサンプルが存在していた場合は、試薬の濃度が一番濃いサンプルのみを再初期サンプルとし、またScore0のウェルの数が50未満のプレートの中に、当該再初期候補サンプルとタンパク質が同一且つ試薬条件が濃度以外同一のサンプルが存在していた場合は、当該再初期候補サンプルを再初期サンプルとはしない。
【0050】
このためステップS5における選択処理は、まず作業用データベースシステム11がSQLタイプの場合、例えば当該プレートの所定のウェルのスコアテーブルにおけるタンパクIDフィールド14Bと試薬No.フィールド14Cの値をselectの対象キーとしてスコアテーブルを検索して、他のウェル(行)がヒットされるか否かをチェックする。
【0051】
他のウェルがヒットした場合は、プレート番号フィールド14Fの値によって、ヒットしたウェルのプレートが、Score0のウェルの数が50未満のプレートか、score0のウェルの数が50以上あるプレートかをチェックする。ヒットしたウェルのプレートが、Score0のウェルの数が50未満のプレートの場合は、当該サンプルを再初期候補サンプルから外す。
【0052】
ヒットしたウェルのプレートが、Score0のウェルの数が50以上のプレートの場合は、サンプルIDフィールド14Aに基づきサンプルテーブルを検索し、試薬の濃度を比較し、当該サンプルより試薬の濃度が濃いサンプルが存在していた場合に、当該サンプルを再初期候補サンプルから外し、以上の処理を当該プレートの全ウェルに対して実行することによって行うことができる。
【0053】
ステップS5において、再初期候補サンプルとして残った全サンプルの残量をステップS6に進み、チェックする。サンプルの残量チェックは、作業用データベースシステム11がSQLタイプの場合、例えば再初期候補サンプルとして残った各ウェルのスコアテーブルから、全サンプルIDを重複無く抽出し、各サンプルIDを順にselectコマンドのキーとしてサンプルテーブルを検索し、ヒットした各サンプルテーブルの行のサンプル残量フィールドを抽出することにより行うことができる。
【0054】
ステップS6において残量が80μL以上あるサンプルの場合は、サンプル量が十分であるとしてステップS7に進み、当該プレートを再初期登録リストに登録し、ステップS8に進み、他にチェックするプレートがあるか否かをチェックする。
【0055】
ステップS6において残量が80μL未満のサンプルは、サンプル量が十分ではないとして、ステップS9に進み、他のサンプルの流用又はサンプルの新規精製(再精製)の依頼処理を行うサンプルとしてウェイトリストに登録され、ステップS8に進み、他にチェックするプレートがあるか否かをチェックする。上記サンプルのウェイトリストへの登録時には、再初期スクリーニング用のサンプルであることが情報として登録される。
【0056】
ステップS4においてscore0のウェルの数が50未満である場合、及びステップS2において結晶化フィールドがinitial以外の場合は、そのままステップS8に進み、他にチェックするプレートがあるか否かをチェックする。
【0057】
他にチェックするプレートがあるか否かは、例えばselectコマンドのキーとするプレート番号が残っているか否かによりチェックすることができる。ステップS8において他にチェックするプレートがある場合は、ステップS1に戻り、他にチェックするプレートがない場合は、二次・同一サンプル抽出処理を実行する。
【0058】
以上に示される再初期サンプル抽出処理により、結晶化実験開始から1週間後にScore0のウェルが50以上あるプレートに使用した残量が80μL以上の所定の(選択処理によって選択された)サンプルが再処理サンプルとして再初期登録リストに登録される。なお再初期スクリーニングは、初期スクリーニングのサンプルを、濃度を倍にして再度初期スクリーニングするものである。
【0059】
上記二次・同一サンプル抽出処理は、作業用データベースシステム11におけるスコアテーブルの全行(結晶化実験済みの全ウェル)に対して順に実行される。図9のフローチャートに示されるように、まずステップS1においてウェルの結晶化タイプをチェックする。結晶化タイプのチェックは、対象ウェルの作業用観測データにおける結晶化タイプフィールド14Iのチェックによって実行することができる。
【0060】
結晶化タイプが初期スクリーニング(結晶化タイプフィールド14Iがinitial)のウェルは、ステップS2に進み、観測時の最高のスコアをチェックする。最高のスコアは最高スコアフィールド14Dのチェックによって可能である。最高スコアが4以上(最高スコアフィールド14Dがscore4以上)の場合は、ステップS3に進み、上記同様に再度最高スコアをチェックする。
【0061】
ステップS3において、最高スコアが6以上(最高スコアフィールド14Dがscore6以上)の場合は、ステップS4に進み、回折チェック依頼のリストに登録してステップS5に進み重複チェックを行う。ステップS3において、最高スコアが6未満(最高スコアフィールド14Dがscore6未満)の場合は、ステップS3からステップS5に進む(回折チェック依頼のリストに登録)されない。
【0062】
ステップS5における重複チェックは、作業用データベースシステムにおけるスコアテーブルを参照して、当該ウェルに使用したサンプルが、既に実験済み(二次スクリーニングに展開済み)のものであるか否かをチェックする。複数の試薬とタンパク質試料の組み合わせによる結晶化実験が、初期スクリーニングや二次スクリーニングとして行われているため、同一の組み合わせとなる実験が過去に行われているケースが有り得るためである。
【0063】
重複チェックは、作業用データベースシステム11がSQLタイプの場合、例えば当該ウェルのスコアテーブルのタンパクIDフィールド14Bと試薬No.フィールド14Cの値をselectの対象キーとしてスコアテーブルを検索して、他のウェル(行)がヒットされるか否かによって行うことができる。
【0064】
ステップS5において重複がなかった場合は、ステップS6に進み、当該ウェルに使用したサンプルに対応する二次スクリーニング用のサンプルの残量をチェックする。ステップS6においては、作業用データベースシステムがSQLタイプの場合、例えば試薬No.フィールド14Cをselectコマンドのキーに、試薬関係テーブルを検索し、当該試薬に対する二次スクリーニング用の試薬の試薬No.を抽出し、且つ当該ウェルのスコアテーブルにおけるタンパクIDフィールド14Bをキーにサンプルテーブルを検索し、ヒットしたサンプルテーブルの各行を対象に二次スクリーニング用に抽出された試薬No.の試薬の内容をselectコマンドのキーとして検索を行い、ヒットしたサンプルテーブルの各行のサンプル残量フィールドをチェックすることにより行うことができる。
【0065】
ステップS6において残量が20μL以上ある二次スクリーニング用のサンプルは、サンプル量が十分であるとしてステップS7に進み、二次スクリーニングを行うサンプルとして展開依頼・依頼日登録のリストに登録され、ステップS8に進む。ステップS8においては、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップS1に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【0066】
なおステップS2においてスコアが4未満(最高スコアフィールド14DがScore4未満)の場合、ステップS5において重複があった場合もステップS8に進み、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップS1に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【0067】
ステップS1において、結晶化タイプが二次スクリーニング(結晶化フィールドがexpand)のウェルは、ステップS9に進み、上記同様に最高スコアのチェックを行う。最高スコアが6以上(最高スコアフィールド14DがScore6以上)の場合は、ステップS10に進み、測定可能結晶を算出したウェルとして結晶化報告のリストに登録するとともに、回折チェック依頼のリストに登録し、ステップS11に進む。
【0068】
ステップS11においては、当該ウェルの最高スコアが、所属セクション(Section)中での最高スコアか否かをチェックする。これは当該ウェルと同一セクションにあるウェルをスコアテーブルから検索して抽出し、抽出された他のウェル(行)の最高スコアフィールド14Dの値と比較することによって行うことができる。
【0069】
ステップS11において、当該ウェルが所属セクション中での最高スコアであった場合は、ステップS12に進み、重複チェックを行う。重複チェックは、初期スクリーニングの場合(ステップS5)と同様の理由で行われ、同様の手法で行うことができる。
【0070】
ステップS12において重複がなかった場合は、ステップS13に進み、当該ウェルの結晶化実験に使用したサンプルの残量をチェックする。サンプルの残量チェックは、作業用データベースシステム11がSQLタイプの場合、例えば当該ウェルのスコアテーブルにおけるサンプルIDフィールド14Aをselectコマンドのキーにサンプルテーブルを検索し、ヒットしたサンプルテーブルの行のサンプル残量フィールド16Dをチェックすることにより行うことができる。
【0071】
ステップS13においてサンプルの残量が20μL以上ある場合は、サンプル量が十分であるとして量産結晶化実験を行うサンプルとして同一依頼・依頼日登録のリストに登録し、ステップS8に進み、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップS1に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【0072】
なおステップS9においてスコアが6未満(最高スコアフィールド14DがScore6未満)の場合、ステップS11において当該ウェルが所属セクション中での最高スコアではない場合、ステップS12において重複があった場合もステップS8に進み、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップS1に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【0073】
ステップS1において、結晶化タイプが量産結晶化実験(結晶化フィールドがsame)のウェルは、ステップS15に進み、上記同様に最高スコアのチェックを行う。最高スコアが6以上(最高スコアフィールド14DがScore6以上)の場合は、ステップS16に進み、測定可能結晶を算出したウェルとして結晶化報告のリストに登録するとともに、回折チェック依頼のリストに登録し、ステップS8に進み、次に処理するウェルがあるか否かをチェックし、次のウェルが存在する場合は、ステップS1に戻り、次のウェルが存在しない場合はウェイト処理を実行する。
【0074】
なおステップS6及びステップS13においてサンプルの残量が20μL未満の場合は、サンプル量が十分ではないと判断され、ステップS17に進み、ステップS17において、他のサンプルの流用又はサンプルの新規精製(再精製)の依頼処理を行うサンプルとしてウェイトリストに登録される。
【0075】
ただしステップS6経由でウェイトリストに登録されるサンプルは、ウェイトリストへの登録時に、二次スクリーニング用のサンプルであることが情報として登録され、ステップS13経由でウェイトリストに登録されるサンプルは、ウェイトリストへの登録時に、量産結晶化実験用のサンプルであることが情報として登録される。ウェイトリストに登録されたサンプルは後述するウェイト処理の対象となる。
【0076】
上記二次・同一サンプル抽出処理のフローは、上記のように作業用データベースのスコアテーブルに登録されている全行(全ウェル)に対して順に実行されて終了する。
【0077】
上記二次・同一サンプル抽出処理によって、重複が無く、初期スクリーニングの最高スコアの結果がスコア4以上の全てのウェルに使用されたサンプルに対する二次スクリーニング用の量が十分なサンプルが展開依頼・依頼日登録のリストに登録され、重複が無く、且つサンプル量が十分であり、且つ所属セクションにおいて最高スコアである二次スクリーニングの最高スコアの結果がスコア6以上の全てのウェルに使用されたサンプルが同一依頼・依頼日登録のリストに登録される。
【0078】
また初期スクリーニングの最高スコアの結果が6以上の全てのウェルに使用されたサンプルと、二次スクリーニングの最高スコアの結果がスコア6以上の全てのウェルに使用されたサンプルと、量産結晶化実験の最高スコアの結果がスコア6以上の全てのウェルに使用されたサンプルが回折チェック依頼リストに登録される。
【0079】
ウェイト処理は、ウェイトリストに登録された全てのサンプルに対して順に実行される。図10のフローチャートに示されるように、ステップS1においては、異なるロットの使用が可能か否かをチェックする。異なるロットの使用が可能な場合とは、再精製されたロット番号(サンプルID)が異なるだけで、他が同一のサンプルの使用や、濃度の変更等によって対応が可能なサンプルの使用等が考えられる。
【0080】
異なるロットの使用の可否は、当該サンプルのサンプルIDを除く他のフィールドの値をキーとして、作業用データベースシステム11のサンプルテーブルを検索し、他のサンプルがヒットするか否かをチェックすること等によってチェックすることができる。
【0081】
ステップS1において異なるロットの使用が可能である場合は、ステップS2に進み、当該サンプルをウェイトリストから削除し、ステップS3に進む。ステップS3においては当該サンプルが再初期スクリーニング用又は二次スクリーニング用又は量産結晶化実験用のいずれであるかをチェックする。
【0082】
前述のようにウェイトリストには、各サンプルに対応して、当該サンプルが再初期スクリーニング用又は二次スクリーニング用又は量産結晶化実験用のいずれであるか情報が付加されているため、ステップS3のチェックは、ウェイトリストによって行うことができる。
【0083】
ステップS3において当該サンプルが、初期スクリーニング用である場合は、ステップS4に進み、再初期サンプルとして再初期登録リストに登録し、当該サンプルが、二次スクリーニング用である場合は、ステップS5に進み、展開依頼・依頼日登録リストに登録し、当該サンプルが、量産結晶化実験用である場合は、ステップS6に進み、同一依頼・依頼日登録リストに登録し、それぞれ登録後ステップS7に進み、次に処理するサンプルの有無をチェックする。
【0084】
ステップS1において、異なるロットの使用が不可である場合は、ステップS8に進み、重複して再精製依頼リストに登録されていないかをチェックし、重複して登録されていない場合は、ステップS9に進み、ウェイトリストに登録されている当該サンプルを再精製依頼リストに登録する。
【0085】
ステップS9において、再精製登録依頼リストにサンプルを登録した後は、ステップS10に進み、再精製されたサンプルが作業用データベースシステム11のサンプルテーブルに登録されたか否かをチェックする。ステップS10は、作業用データベースシステム11がSQLタイプの場合、サンプルの内訳をselectコマンドのキーとしてサンプルテーブルを検索することによって、所定の行がヒットするか否かをチェックすることにより行うことができる。
【0086】
ステップS10において、再精製されたサンプルが作業用データベースシステム11のサンプルテーブルに登録されている場合は、ステップS11に進み、再精製登録依頼リストの登録を解除し、ステップS7に進む。ステップS10において、再精製されたサンプルが作業用データベースシステム11のサンプルテーブルに登録されていない場合は、ステップS10からステップS7に進む。
【0087】
ステップS7においては、次に処理するサンプルがある場合は、ステップS1に戻り、次に処理するサンプルがない場合は、処理を終了する。
【0088】
上記ウェイト処理により、二次・同一サンプル抽出処理及び再初期サンプル抽出処理によりリストアップされた量が少ないサンプルは、異なるロットの使用が可能な場合は、同一依頼・依頼日登録リスト又は展開依頼・依頼日登録リスト又は再初期登録リストにリストアップされる。再精製となったものは、再精製完了後に行われるサンプル抽出制御によって、同一依頼・依頼日登録リスト又は展開依頼・依頼日登録リスト又は再初期登録リストにリストアップされる。
【0089】
なお上記各リストは、プログラム言語が持つリストやハッシュの機能を使用することや、作業用データベースシステム11等のデータベースシステムに各リストに対応するテーブルを設けること等によって実現される。
【0090】
サンプル抽出システムは、上記のように展開依頼・依頼日登録リスト、同一依頼・依頼日登録リスト、結晶化報告リスト、回折チェック依頼リスト、再初期登録リスト、ウェイトリスト、再精製登録依頼リストに登録されたサンプルをリスト毎にディスプレイ13に表示させることができる。
【0091】
作業者は再初期登録リストを表示させることによって再度初期スクリーニングを行うサンプルを、展開依頼・依頼日登録リストを表示させることによって二次スクリーニングを行うサンプルを、同一依頼・依頼日登録リストを表示させることによって二次スクリーニングを行うサンプルを、結晶化報告リストを表示させることによって測定可能結晶を産出したサンプルを容易に確認することができ、タンパク質の結晶化実験の実験結果の整理を自動的に容易に行うことができ、次工程(再初期スクリーニング,二次スクリーニング,量産結晶化実験,回折チェック)に対する結晶化実験の指示を容易に出し、結晶化実験を継続させることができる。
【0092】
サンプル抽出システムは、次工程を行うためのサンプルを、上記のようにスコアを基準にして容易に選択して抽出し、再初期登録リスト、展開依頼・依頼日登録リスト、同一依頼・依頼日登録リスト、回折チェック依頼リストに登録する。
【0093】
ただし、再初期サンプル抽出処理のステップS5とステップS6、二次・同一サンプル抽出処理のステップS6とステップS13と、ウェイト処理によって、チェックシステムを構成し、サンプル抽出システム作動時に、容量が少なかったり、異なるロットの使用ができない等のサンプルは、次工程の作業(再初期スクリーニング,二次スクリーニング,量産結晶化実験)で使用可能な条件を備えていないとして、再精製登録依頼リスト又は展開依頼・依頼日登録リスト又は同一依頼・依頼日登録リストへの登録から排除するように構成されている。
【0094】
これにより次工程での作業を行う際に、サンプル量が足りない等のトラブルを未然に防止することができる。なお異なるロットが使用できるサンプルや、再精製が完了したサンプルは、再精製登録依頼リストや、展開依頼・依頼日登録リスト、同一依頼・依頼日登録リストに登録されるため、対象となったサンプルの結晶化実験が漏れる等の不都合は防止される。
【0095】
以上のような本処理システム7を作動させることによって、図11のフローチャートに則ったタンパク質の結晶化実験を行うことが可能となる。本処理システム7を使用して、初期スクリーニングの結果、展開依頼・依頼日登録リストによってスコア4以上のサンプルを二次スクリーニングに容易に送り、二次スクリーニングの結果、同一依頼・依頼日登録リストによって、スコア6以上であり、且つセクション内で最高のスコアであるサンプルを量産結晶化実験に容易に送り、各段階のスクリーニングを行わせる指示を、次工程に簡単に出すことができる。
【0096】
各段階のスクリーニングで、スコア6以上のサンプルは、回折チェック依頼リストに登録されるため、回折チェック依頼リストによって、回折チェックの指示を簡単に出すことができる。回折チェックにおいては、回折チェック依頼リストに基づいて容易に分解能チェックの作業を行うことができる。
【0097】
回折チェックにおいては、分解能の値は小さいほど良好な結果であるといえる。そして通常は分解能が4Åが良否の境界となるため、分解能が4Åよりも良好となる、分解能が4Å未満のサンプルに関して、X線構造解析を行う単結晶の候補として回折結果報告を行い実験を終了することができる。
【0098】
分解能のチェックにおいて4.0Å以上の場合は、高度化を行い、再度適切な段階でのスクリーニングを行わせることができる。本処理システムによって、以上のようなタンパク質の結晶化実験を円滑且つ簡単に進めることが可能となる。
【0099】
なおサンプル抽出システム12における各段階でのサンプルの抽出条件や、ウェイトリストへの登録条件は、例えば変数等として登録するように構成することにより、容易に変更が可能となる。実際に行う実験に合わせて、上記サンプルの抽出条件やウェイトリストへの登録条件等を変更することにより、タンパク質の結晶化実験を様々なバリエーションで行い、X線構造解析を行う単結晶の候補を容易に絞り込む実験等を適切な条件で行うことができる。
【産業上の利用可能性】
【0100】
タンパク質の結晶化実験を適切な段階のスクリーニングを行い、X線構造解析を行う単結晶の候補を絞り込む実験に適用できる。
【図面の簡単な説明】
【0101】
【図1】本処理装置を使用したタンパク質の結晶化実験システムの概要図である。
【図2】各スコアのサンプルの表示図である。
【図3】主データベースシステムにおけるデータテーブルの概念を示す概念図である。
【図4】処理システムのブロック図である。
【図5】作業用データベースシステムにおけるスコアテーブルの概念を示す概念図である。
【図6】作業用データベースシステムにおけるサンプルテーブルの概念を示す概念図である。
【図7】サンプル抽出処理のフローチャート図である。
【図8】再初期サンプル抽出処理のフローチャート図である。
【図9】二次・同一サンプル抽出処理のフローチャート図である。
【図10】ウェイト処理のフローチャート図である。
【図11】本処理システムを使用したタンパク質の結晶化実験の一例を示すフローチャート図である。
【符号の説明】
【0102】
3 主データベースシステム
7 処理システム
11 作業用データベースシステム
12 サンプル抽出システム(抽出システム)

【特許請求の範囲】
【請求項1】
異なる条件でタンパク質試料と試薬とが混合されてなる複数のサンプルの結晶化状態を、経時的に観測することによって得られる複数の観測データが蓄積される主データベースシステム(3)と、該主データベースシステム(3)に蓄積された観測データを処理する処理システム(7)とを備え、該処理システム(7)を、主データベースシステム(3)の観測データがサンプル毎に1レコードに纏められてなる作業用観測データを蓄積する作業用データベースシステム(11)と、作業用データベースシステム(3)から予め定められた条件に基づいて所定のサンプルを、次工程の作業を行うサンプルとして選択して抽出する抽出システム(12)とで構成したタンパク質の結晶化実験における観測データの処理システム。
【請求項2】
各観測データが、観測時に各サンプルに対して付与される結晶化状態のランクを表すデータを含み、抽出システム(12)が、観測時の最高ランクが所定ランク以上である場合に、当該サンプルを抽出するシステムである請求項1のタンパク質の結晶化実験における観測データの処理システム。
【請求項3】
抽出されたサンプルが、次工程の作業で使用可能な条件を備えているか否かをチェックし、使用不可状態のサンプルを抽出システム(12)による抽出から排除するチェックシステムを設けた請求項1又は2のタンパク質の結晶化実験における観測データの処理システム。

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図2】
image rotate


【公開番号】特開2007−33046(P2007−33046A)
【公開日】平成19年2月8日(2007.2.8)
【国際特許分類】
【出願番号】特願2005−212437(P2005−212437)
【出願日】平成17年7月22日(2005.7.22)
【国等の委託研究の成果に係る記載事項】(出願人による申告)国等の委託研究の成果に係る特許出願(平成16年度、文部科学省、タンパク3000委託研究「タンパク質基本構造の網羅的解析プログラム」、産業活力再生特別措置法第30条の適用を受けるもの)
【出願人】(503359821)独立行政法人理化学研究所 (1,056)
【出願人】(300063105)株式会社システムデザイン・アクティ (1)
【Fターム(参考)】