説明

機能性生体分子設計方法

【課題】機能制御等の効果を有する機能性生体分子の機能予測または/および配列の設計を行う方法の提供。
【解決手段】既知の機能性生体分子のアミノ配列とその活性データにおいて、該機能性生体分子の特徴量を学習データに用いランダム・フォーレストを適用して機能性生体分子の機能予測モデルを構築し、機能性生体分子の機能が未知である機能性生体分子アミノ酸配列を前記で構築された予測モデルに適用し、機能性生体分子の配列解析を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機能性生体分子の機能予測または/および配列の解析方法およびそのシステムに関する。
詳しくは、(1)3〜100merのアミノ酸で形成される機能性生体分子の機能予測例えば抗原ペプチド等に代表されるMHC結合予測、T細胞誘導活性率等の機能性生体分子の配列解析において、(2)機械学習の手法を利用し、(3)設計候補配列の機能の有無を高い確度で予測し、(4)機能制御等の効果を有する機能性生体分子の機能予測または/および配列の設計を行う方法およびそのシステムに関する。
【背景技術】
【0002】
近年、バイオインフォマティクスの分野では、機械学習の手法を利用した遺伝子、蛋白質等の機能解析が積極的に行われている。中でも、サポート・ベクター・マシン(SVM)、ニューラルネットワーク等に代表される教師付学習アルゴリズムは、例えば、テキスト分類、画像認識および、生物配列情報の解析のような、現実的な多変量解析の諸問題に有用であることが知られている。
このような手法の進歩を背景として、最近では機能性生体分子の機能予測研究が精力的になされ、抗原に対する結合能例えば、ヒト白血球抗原(HLA)結合率の予測や、生体活性分子誘導能例えば、T細胞誘導活性能予測精度は概ね70-80%以上と、非常に高い確度が得られるようになった(非特許文献1,2,3)。
さらに、癌、ウイルスへの免疫療法に用いる免疫系の調節作用を有する免疫系調節ペプチド医薬品の開発においては、T細胞活性を誘導するペプチドを設計することが開発の狙いになっている。
【非特許文献1】Zhao, Y et. al., 鄭pplication of support vector machines for T-cell epitopes prediction pp1978-1984, number 15, volume 19, Bioinformatics
【非特許文献2】Donnnes,P et.al., 撤rediction of MHC class I binding peptides, using SVMHC , 2002 Sep 11;3(1):25, BMC Bioinformatics
【非特許文献3】Doytchinova,I et.al., Towards the in silico identification of class II restricted T-cell epitopes: a partial least squares iterative self-consistent algorithm for affinity prediction pp 2263 2270 ,number 17 ,volume 19, Bioinformatics
【発明の開示】
【発明が解決しようとする課題】
【0003】
従来の機能性生体分子例えば、癌抗原ペプチド等の機能予測例えば、MHC結合予測またはT細胞誘導活性予測の大きな問題点は、ペプチド配列のどのような性質が、それぞれの活性に寄与するのかが不明瞭な点にある。一般に、予測対象となるペプチド配列の長さは8〜10残基ときわめて短い。さらに、MHC結合能および、T細胞誘導活性を有すると確認されている既知の配列間で、配列類似度は概して低かった。
教師付学習を用いて、生物配列から配列の特徴を抽出する手法として一般的に用いられてきた隠れマルコフモデル(HMM)や位置特異的重み行列(PWM)は、アミノ酸を文字列とみなして出現頻度の統計量に基づく特徴抽出を行っているため、配列の一次元的な特徴のみを捉えることになり、学習データの特徴抽出方法に限界があった。
また、これらの方法は、前述のペプチド等の配列の多様性の乏しさ、さらには、学習データとして用いる配列の個数量の少なさが足かせとなって、有意な解析結果を得ることが困難であった。
【0004】
即ち(1)ペプチド配列の特徴量を個数に制限されず効果的に抽出する一般的方法、(2)機能性生体分子、特に抗原ペプチド等の抗原結合予測または生体活性分子誘導能予測に特化した、より効果的な解析方法を見いだす必要があった。
【課題を解決するための手段】
【0005】
ペプチド配列の特徴は、それを構成する一連のアミノ酸の中で、たとえ別のアミノ酸に置換されたとしても、そのペプチド配列の生体内での性質が変化しないものと、置換によって本質的な違いを生じるものとに分けることができる。後者は当該ペプチド配列において、本質的な役割を担うと考えることができる。このような配列の特徴を見出すには、同じ性質を有するが、出所の異なるペプチド配列を多数用意し、それぞれの配列が共通して有するアミノ酸を探索する多重アラインメント法が一般に用いられる。
しかし、ペプチドの性質によっては、多重アラインメント法がうまく働かない場合がある。MHC結合機能、T細胞誘導活性機能を有するペプチド配列がこの場合にあたる。これらの配列は、その機能が確認されている既知配列の本数が少ないうえ、一般的な多重アラインメント法によって、共通するアミノ酸を特定することができない。
【0006】
本発明者らは前述の課題を解決するために、従来とはまったく異なる視点にたって、配列からの特徴抽出を試みた。
本発明者らは、一般的な多重アラインメントを経由しないアルゴリズムを検討し、任意のペプチド長におけるMHC結合、T細胞誘導活性またはリガンド分子相互作用等の予測を試み、鋭意検討の結果、アミノ酸の物理化学的特徴に着目したモデル化を行った。
すなわち、特徴量として、各アミノ酸の疎水性パラメータ(Kyte-Doolittle)、親水性パラメータ(Hopp-Woods)、側鎖のパラメータ(B因子、Karplus-Schlz)、分子量及びペプチドの分子量を用い、既知の機能性生体分子のペプチド配列、活性データおよび、機能性生体分子候補のペプチド配列データからランダム・フォーレスト(random forest)と呼ばれる識別器を用いて活性予測モデルを構築することを見いだし、標的分子に対して有効な機能活性を有する配列を解析して活性能を予測することで本発明を完成させた。
【0007】
即ち本発明の要旨は、以下のとおりである、
〔1〕以下の(1)〜(2)の工程を含む機能性生体分子の配列解析方法;
(1)既知の機能性生体分子のアミノ酸配列とその活性データにおいて、該機能性生体分子の特徴量を学習データに用いランダム・フォーレストを適用して機能性生体分子の機能予測モデルを構築する工程、
(2)機能性生体分子の機能が未知である機能性生体分子アミノ酸配列を前記(1)で構築された予測モデルに適用し、機能性生体分子の配列解析を行う工程。
〔2〕 機能性生体分子が3〜100merのアミノ酸配列で形成される上記1の方法。
〔3〕 機能性生体分子がMHC結合機能を有する抗原ペプチドである上記1〜2いずれかに記載の方法。
〔4〕 MHCが、HLA−A2または、HLA−A24である上記3記載の方法。
〔5〕 機能性生体分子がT細胞誘導活性機能を有する抗原ペプチドである上記1〜4記載の方法。
〔6〕 機能性生体分子の特徴量が、アミノ酸の疎水性パラメータ、親水性パラメータ、側鎖のパラメータ、分子量及びペプチドの分子量である上記1〜5いずれかに記載の方法
〔7〕 上記1〜6に記載された方法をコンピュータに実行させることを特徴とするコンピュータ読み取り可能なプログラム。
〔8〕 上記2に記載されたコンピュータ読み取り可能なプログラムを格納した電子媒体。
〔9〕 以下の(1)〜(5)の特徴を有する機能性生体分子の配列解析システム;
(1)既知の機能性生体分子のアミノ配列とその活性データおよび特徴量を入力する手段、
(2)特徴量を学習データに用いランダム・フォーレストを適用して機能性生体分子の機能予測モデルを構築する手段、
(3)機能性生体分子の機能が未知である機能性生体分子アミノ酸配列を前記(1)で構築された予測モデルに適用し、機能性生体分子の配列解析を行う手段、
(4)該機能の効果の有無を解析する手段、
(5)上記解析結果を出力する出力手段。
〔10〕 機能性生体分子が3〜100merのアミノ酸配列で形成される上記9のシステム。
〔11〕 機能性生体分子がMHC結合機能を有する抗原ペプチドである上記10または9に記載のシステム。
〔12〕 MHCが、HLA−A2または、HLA−A24である上記11記載のシステム。
〔13〕 機能性生体分子がT細胞誘導活性機能を有する抗原ペプチドである上記9〜12いずれかに記載のシステム。
〔14〕 機能性生体分子の特徴量が、アミノ酸の疎水性パラメータ、親水性パラメータ、側鎖のパラメータ分子量及びペプチドの分子量である上記9〜13いずれかに記載のシステム
〔15〕 以下の(1)、(2)または(3)から選ばれる工程により選択される機能性生体分子の製造方法;
(1)上記1〜6に記載された配列解析方法、
(2)上記7記載のプログラム
(3)上記8〜13に記載されたシステム。
〔16〕 機能性生体分子が3〜100merのアミノ酸配列で形成される上記15の製造方法。
〔17〕 機能性生体分子がMHC結合機能を有する抗原ペプチドである上記15たは16に記載の製造方法。
〔18〕 MHCが、HLA−A2または、HLA−A24である上記17記載の製造方法。
〔19〕 機能性生体分子がT細胞誘導活性機能を有する抗原ペプチドである上記15〜18のいずれかに記載の製造方法。
【発明の効果】
【0008】
本発明の配列解析方法は、機能性生体分子の配列の特徴量を長さや個数に制限されず効果的に抽出することにより、活性予測が可能になる程度のデータ数が無償の公共データのみからでも得られる。さらには、機能性生体分子の機能活性等を予測するプログラムを医薬品の開発に活用することにより、免疫系の調節作用を有する免疫系調節ペプチド医薬品の迅速な開発が可能となった。
【発明を実施するための最良の形態】
【0009】
以下に、本発明における用語の定義について説明する。
本発明において、
「機能性生体分子」とは、生体内において生体を構成している成分に影響を及ぼす機能を有する分子を指す。例えば、サイトカイン、受容体、酵素、転写因子、リガンド分子等、生体と相互作用を示す等の機能を有する蛋白が挙げられる。
【0010】
上述の機能性生体分子としては、例えば、癌抗原蛋白質等が挙げられる。例えば、癌抗原蛋白質としては、Immunity, vol.10: 281, 1999 のTable1、あるいは Cancer Immunol. Immunother.,vol.50,3-15,2001のTable1〜Table6に記載のものが代表例として挙げられる。具体的には、例えば、メラノーマ抗原蛋白質として、MAGE(Science ,254:1643,1991)、gp100(J.Exp.Med.,179:1005,1994)、MART−1(Proc.Natl.Acad.Sci.USA,91:3515 ,1994)、チロシナーゼ(J.Exp.Med.,178:489 ,1993);メラノーマ以外の癌抗原蛋白質として、HER2/neu(J.Exp.Med.,181:2109,1995)、CEA(J.Natl.Cancer.Inst. ,87:982,1995)、PSA(J.Natl.Cancer.Inst. ,89:293,1997)等の腫瘍マーカー、または扁平上皮癌由来のSART−1(J.Exp.Med.,vol.187,p277-288, 1998 、国際公開第97/46676号パンフレット)、サイクロフィリンB(Proc. Natl. Acad. Sci., U.S.A. 88: 1903, 1991)、SART−3(Cancer Res.,vol.59,4056(1999)、あるいはWT1(Immunogenetics,vol.51,99,2000, Blood 95:2198-203,2000, Blood 95:286-93,2000)等が挙げられる。
本発明の「配列解析」に用いられる機能性生体分子は、3〜100−merで形成されるアミノ酸配列を有し、その配列が生体内において生体を構成している成分に影響を及ぼす機能を有するアミノ酸配列であればよい。
【0011】
また本発明の配列解析に用いる「既知の機能性生体分子のアミノ配列とその活性データ」および、「機能が未知である機能性生体分子アミノ配列」は、予測される機能を有するアミノ酸配列に応じた配列長であればよい。
例えば、T細胞誘導活性機能を有するような短いアミノ酸を設計候補とする場合、蛋白質がproteasomeによって、断片化される部分配列長を想定しているため、配列長は特に限定しないが、好ましくは6〜20−merの短いアミノ酸配列を有するものが挙げられ、より好ましくは、8〜11−merで形成される短いアミノ酸配列を有するものが挙げられる。
上述のアミノ酸配列を有するものとしては、例えば、細胞傷害性T細胞(CTL)誘導活性機能ペプチド、ヒト白血球抗原(HLA)結合性のペプチド、MHCクラスII結合性の抗原ペプチド(ヘルパーペプチド)、癌抗原ペプチド、ヘルパーペプチドと癌抗原ペプチドとを含有するエピトープペプチド、などが挙げられ、具体例として例えば、Journal of Immnology 1999, 162: 3915-3925には、HBV由来HLA−A2拘束性抗原ペプチド6種類等がイン・ビボでCTLを効果的に誘導したことが記載されている。
【0012】
「ランダム・フォーレスト」とは、決定木(CART法など)を下位学習アルゴリズムに説明変数のランダムサンプリングも行いながら、決定木と属性サンプリングを組み合わせるアンサンブル学習アルゴリズムで、bootstrap法、決定木、属性サンプリングの巧みな組み合わせによって、SVMなどの高性能識別器と同等の性能を持ちながら、重要なパラメータの抽出、知識発見支援、実験精度・予測結果の信頼性、予測における問題点などを考察する情報を提供するアルゴリズムである。
ランダム・フォーレストを実装したソフトウエアは、種々のプログラミング言語によって記述されたものが公共に提供されており、容易に入手できる。例えば、R言語によりランダム・フォーレストを実装したソフトウェアは(http://cran.r-project.org/)から入手できる。
ランダム・フォーレストの概念を図3に示す。ランダム・フォーレストの原理は Breiman, L., (2001) Machine Leaning, 45, 5-32.に記載されている
前記の教師付き学習とは、入出力データが与えられているが、それらを近似する関数が分からない時に、データから関数のパラメータを推定することをいう。学習とは、複数の学習器間のパラメータを適当な学習則を用いることで、変化させることを示し、本発明でいう学習器とは「ランダム・フォーレスト」を指すが、一般的には入出力関係を持ったもので 、ニューラル・ネットワーク(Neural Network) 、ラジアル・ベーシス・ファンクション・ネットワーク(Radial Basis Function Network)等、神経回路を模倣したもの或いはサポート・ベクター・マシン等、統計モデル全般を示す。
【0013】
本発明の第一の態様は、機能性生体分子の配列解析方法に関する。詳しくは、機能性生体分子の機能予測または/および配列の設計方法に関する。
既知の機能性生体分子ペプチド配列、活性データ、各アミノ酸の疎水性パラメータ(Kyte-Doolittle)、親水性パラメータ(Hopp-Woods)、側鎖のパラメータ(B因子、Karplus-Schlz)、分子量及びペプチドの分子量を特徴量としてランダム・フォーレストに適用し、活性予測モデルを構築する。
予測する機能性生体分子のペプチド配列を前記予測モデルを構築したランダム・フォーレストに適用し機能の活性能を予測する方法である。
以下に、本発明の方法の手順を図1を参照して説明する。図1は、本発明の請求項1記載の発明の要旨を説明するための図である。
101で蛋白質の配列から既知の機能性生体分子例えば、MHC結合分子または/およびT細胞誘導活性を有するアミノ酸等の配列および、アミノ酸の物理化学的特徴を数値化したデータから、解析に用いるデータ群(以下データセット)を取得する。該データはMHCBNデータベース(http://www.imtech.res.in/raghava/mhcbn/)MHCPEPデータベース(http://wehih.wehi.edu.au/mhcpep/)、非特許文献1の文献、等から入手可能である。
数値化するアミノ酸の特徴量として、各アミノ酸の疎水性パラメータ(Kyte-Doolittle)、親水性パラメータ(Hopp-Woods)、側鎖のパラメータ(B因子、Karplus-Schlz)、分子量及びペプチドの分子量が挙げられる。
取得したデータセットをパラメータとして入力する。パラメータ化の概念を図4に示す。図4は、本発明方法で用いるデータセットの一例として、アミノ酸配列と効能、物理化学的特徴を数値化したの情報を各アミノ酸配列の位置ごとに行列として表示したものである。具体的には、機能性核酸配列の各アミノ酸の物理化学的特徴(疎水性、親水性等)のパラメータを数値化した値をランダム・フォーレストへの適応データとし(図4の概念図ではA0,B0,C0等の記号に相当)、機能(例えば、有効、効果がない等)を分類するための情報を教師ラベルとして機能性生体分子の配列を割り当てる。
102で101の工程で取得したデータをランダム・フォーレストに適用し、学習モデルを構築する。
【0014】
103で機能性生体分子の機能が未知である機能性生体分子アミノ酸配列を102で構築された予測モデルをランダム・フォーレストに適用し、機能性生体分子の配列解析を行う。
104で配列解析の結果出力を行う。
予測モデル構築に用いる解析用モデル構築対象データは既知のアミノ酸配列であれば取得先は限られず、in houseにおける活性データまたは、既存のデータベース(例えば、文献情報からHLA結合ペプチド情報をデータベース化した「MHCBN」、「MHCPEP」等)から取得できる。
本発明の配列解析方法によって解析された、配列の解析データおよび設計されたアミノ酸配列は、紙、磁気、磁気光ディスク、または光ディスク等の記録媒体に記録されていてもよい。
【0015】
本発明の第2の態様は、本発明の解析方法を実行させるコンピュータで読みとり可能なプログラムである。
図1の101〜104の解析方法を実行させるプログラムで、これらは、図1に示したアルゴリズムの手順にそって1つのモジュールであっても、それぞれのパート毎に書かれたモジュールを組み合わせて使用してもよい。これらは磁気または、磁気光ディスク、光ディスク等の記録媒体に記録されている。
【0016】
本発明の第3の態様は、本発明の配列解析方法を実行させるシステムに関するものである。
本発明解析方法を実行させる装置の構成を図2に示す。201〜204は、本発明の方法にてデータ入力、演算、分析、選別に使用するための装置である。205〜207は201〜204の装置の実行結果を出力するおよび/または記録するための装置である。
201のシステムで、本発明方法に用いる既知の機能性生体分子のアミノ配列とその活性データおよび特徴量のデータ入力を行う、
202のシステムで、201で入力された蛋白質の配列から既知の機能性生体分子例えば、MHC結合分子または/およびT細胞誘導活性を有するアミノ酸等の配列および、アミノ酸の物理化学的特徴を数値化したデータから、解析に用いるデータ群(以下データセット)を取得する手段を実行する。ここで取得する該データは、第1の態様と同様の公共データベース等から入手可能である。数値化するアミノ酸の特徴量は、第1の態様と同様である。
203のシステムで、取得したデータセットをパラメータとし、特徴量を学習データに用いランダム・フォーレストを適用して機能性生体分子の機能予測モデルを構築する手段を実行する。 特徴量は前記101の工程で用いるデータと同様である。
204システムで機能性生体分子の機能が未知である機能性生体分子アミノ酸配列を前記203で築された予測モデルに適用し、機能性生体分子の配列解析を行う手段を実行し、
205で204の装置で得られた解析結果をもとに機能予測対象アミノ酸配列の活性の有無を選別するおよび/または、機能を有する配列の設計する手段を実行させる。
【0017】
201〜206のシステムの実行結果は205の装置の出力部で紙などの記録媒体に印刷することもでき、206の装置の画像処理部で表示することもでき、207の装置で、FD,MO,CD−RW,DVD−RW等の磁気または、磁気光ディスク、光ディスク等の記録媒体に出力することもできる。
201〜207の装置は、全てが含まれて一体化した装置でも、各々が分離した装置でも、一部の手段を実行させる装置を含んだ装置を複数組み合わせた装置であってもよい。
上記の装置は、電子計算機であればよく、サーバー、パーソナルコンピュータ(以下PC)等が挙げられ、計算機の能力は制限しない。
本発明解析方法を実行させるプログラムを動作させるオペレーションシステムも汎用ソフトウェア例えば、Linux系OS、マイクロソフトウインドウズ(登録商標)シリーズ等でよい。
【0018】
本発明の第4の態様は以下の(1)、(2)または(3)から選ばれる工程により選択される機能性生体分子の製造方法に関する。
(1)本発明の配列解析方法、
(2)前記(1)記載の方法を実行させるコンピュータ読み取り可能なプログラム、
(3)本発明の配列解析方法を実行させるシステム。
本発明の製造方法は、(1)〜(3)いずれかの工程であればよく、それらの工程は単独であっても、2つ以上を組み合わせたものでもよい。
前述の工程において製造される機能性生体分子は生体分子に影響を及ぼす機能を有する3〜100merで形成されるアミノ酸配列であればよく、例えば、リガンド分子相互作用機能、MHC結合機能またはT細胞結合機能を有していること等が挙げられる。好ましくは、MHC結合機能またはT細胞結合機能を有していることが挙げられる。
本発明方法で設計されたペプチドの合成については、通常のペプチド化学において用いられる方法に準じて行うことができる。該合成方法としては文献(ペプタイド・シンセンシス(Peptide Synthensis)、interscience, New York, 1996;ザ・プロテインズ(The Proteins),Vol2, Academic Press INc., New York,1976;ペプチド合成,丸善(株),1975;ペプチド合成の基礎と実験、丸善(株),1985;医薬品の開発 続第14巻・ペプチド合成,広川書店,1991)などに記載されている方法が挙げられる。
本発明の製造方法で製造された機能性生体分子のアミノ配列データおよび解析データは、磁気または、磁気光ディスク、光ディスク等の記録媒体に記録されていてもよい。
【0019】
以下、本発の解析方法の実施例を挙げる。但し、本実施例によって本発明を限定されるものではない。
【実施例1】
【0020】
HLA-A2拘束性CTL誘導能およびHLA-A24拘束性CTL誘導能既知ペプチド交差検証
検証するペプチド群にHLA-A2拘束性CTL誘導能既知ペプチド203本(活性有り:36本、活性無し:167本)、HLA-A24拘束性CTL誘導能既知ペプチド115本(活性有り:48本、活性無し:67本)を使用した。HLA-A2拘束性CTL誘導能既知ペプチド203本は非特許文献1(10-mer)、HLA-A24拘束性CTL誘導能既知ペプチド115本はMHCBNデータベース(9-mer)由来である。
前記ペプチド群の各アミノ酸の疎水性パラメータ(Kyte-Doolittle)、親水性パラメータ(Hopp-Woods)、側鎖のパラメータ(B因子、Karplus-Schlz)、分子量及びペプチドの分子量を特徴量として用いてランダム・フォーレストに適用し、予測モデルを構築した。
ランダム・フォーレストはhttp://cran.r-project.org/から入手した。特徴量として用いた数値化データは文献(バイオテクノロジーのためのコンピュータ入門,コロナ社,1995年)から入手した。
交差検証の方法はアウト・オブ・バッグ(Out-Of-Bag,OOB)サンプルを用いた。アウト・オブ・バッグ・サンプルの検証方法はBreiman, L., (2001) Machine Leaning, 45, 5-32.に記載されている。
HLA-A2拘束性CTL誘導能について交差検証を行った結果を表1に、HLA-A24拘束性CTL誘導能について交差検証結果を表2に示す。
【0021】
【表1】

【0022】
【表2】

(結果)
HLA-A2拘束性CTL誘導能既知ペプチドを用いた交差検証法による本発明方法の識別能力評価では87%との高い識別能力を有していることを確認した。
HLA-A24拘束性CTL誘導能既知ペプチドデータにおいても、交差検証法による本発明方法の識別能力評価も75%と高い識別能力有していることを確認した。

HLA-A2拘束性CTL誘導能既知ペプチドに使用したペプチドを表3に示す。表中+は活性有り、−は活性無しを示す。
【0023】
【表3】




HLA-A24拘束性CTL誘導能既知ペプチドに使用したペプチドを表4に示す。表中+は活性有り、−は活性無しを示す。
【0024】
【表4】

【産業上の利用可能性】
【0025】
本発明の配列解析方法は、機能性生体分子の配列の特徴量を個数に制限されず効果的に抽出することにより、活性予測が可能になる程度のデータ数が無償の公共データのみからでも得られる。さらには、機能性生体分子の機能活性等を予測するプログラムを医薬品の開発に活用することにより、免疫系の調節作用を有する免疫系調節ペプチド医薬品の迅速な開発が可能となった。
【図面の簡単な説明】
【0026】
【図1】本発明方法を説明したフローチャートである。
【図2】本発明方法およびプログラムを実行させるシステムの構成を示す機能ブロック図である。
【図3】ランダム・フォーレストの概念図を示す。
【図4】ランダム・フォーレストに適用するデータセットのパラメータ化の概念図を示す。

【特許請求の範囲】
【請求項1】
以下の(1)〜(2)の工程を含む機能性生体分子の配列解析方法;
(1)既知の機能性生体分子のアミノ酸配列とその活性データにおいて、該機能性生体分子の特徴量を学習データに用いランダム・フォーレストを適用して機能性生体分子の機能予測モデルを構築する工程、
(2)機能性生体分子の機能が未知である機能性生体分子アミノ酸配列を前記(1)で構築された予測モデルに適用し、機能性生体分子の配列解析を行う工程。
【請求項2】
機能性生体分子が3〜100merのアミノ酸配列で形成される請求項1の方法。
【請求項3】
機能性生体分子がMHC結合機能を有する抗原ペプチドである請求項1〜2いずれかに記載の方法。
【請求項4】
MHCが、HLA−A2または、HLA−A24である請求項3記載の方法。
【請求項5】
機能性生体分子がT細胞誘導活性機能を有する抗原ペプチドである請求項1〜4記載の方法。
【請求項6】
機能性生体分子の特徴量が、アミノ酸の疎水性パラメータ、親水性パラメータ、側鎖のパラメータ、分子量及びペプチドの分子量である請求項1〜5いずれかに記載の方法
【請求項7】
請求項1〜6に記載された方法をコンピュータに実行させることを特徴とするコンピュータ読み取り可能なプログラム。
【請求項8】
請求項7に記載されたコンピュータ読み取り可能なプログラムを格納した電子媒体。
【請求項9】
以下の(1)〜(5)の特徴を有する機能性生体分子の配列解析システム;
(1)既知の機能性生体分子のアミノ配列とその活性データを入力する手段、
(2)特徴量を学習データに用いランダム・フォーレストを適用して機能性生体分子の機能予測モデルを構築する手段、
(3)機能性生体分子の機能が未知である機能性生体分子アミノ酸配列を前記(1)で構築された予測モデルに適用し、機能性生体分子の配列解析を行う手段、
(4)該機能の効果の有無を解析する手段、
(5)上記解析結果を出力する出力手段。
【請求項10】
機能性生体分子が3〜100merのアミノ酸配列で形成される請求項9のシステム。
【請求項11】
機能性生体分子がMHC結合機能を有する抗原ペプチドである請求項9または10に記載のシステム。
【請求項12】
MHCが、HLA−A2または、HLA−A24である請求項11記載のシステム。
【請求項13】
機能性生体分子がT細胞誘導活性機能を有する抗原ペプチドである請求項9〜12いずれかに記載のシステム。
【請求項14】
機能性生体分子の特徴量が、アミノ酸の疎水性パラメータ、親水性パラメータ、側鎖のパラメータ、分子量及びペプチドの分子量である請求項9〜13いずれかに記載のシステム
【請求項15】
以下の(1)、(2)または(3)から選ばれる工程により選択される機能性生体分子の製造方法;
(1)請求項1〜6に記載された配列解析方法、
(2)請求項7記載のプログラム
(3)請求項8〜13に記載されたシステム。
【請求項16】
機能性生体分子が3〜100merのアミノ酸配列で形成される請求項15の製造方法。
【請求項17】
機能性生体分子がMHC結合機能を有する抗原ペプチドである請求項15または16に記載の製造方法。
【請求項18】
MHCが、HLA−A2または、HLA−A24である請求項17記載の製造方法。
【請求項19】
機能性生体分子がT細胞誘導活性機能を有する抗原ペプチドである請求項15〜18いずれかに記載の製造方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2006−236151(P2006−236151A)
【公開日】平成18年9月7日(2006.9.7)
【国際特許分類】
【出願番号】特願2005−52062(P2005−52062)
【出願日】平成17年2月25日(2005.2.25)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(000002912)大日本住友製薬株式会社 (332)
【Fターム(参考)】