TOP > 国内特許検索 > 蛋白質の判別方法 > 明細書

明細書 :蛋白質の判別方法

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第3722420号 (P3722420)
公開番号 特開2002-215634 (P2002-215634A)
登録日 平成17年9月22日(2005.9.22)
発行日 平成17年11月30日(2005.11.30)
公開日 平成14年8月2日(2002.8.2)
発明の名称または考案の名称 蛋白質の判別方法
国際特許分類 G06F 19/00      
G06F 17/30      
FI G06F 19/00 600
G06F 17/30 170F
請求項の数または発明の数 3
全頁数 11
出願番号 特願2001-010466 (P2001-010466)
出願日 平成13年1月18日(2001.1.18)
新規性喪失の例外の表示 特許法第30条第1項適用 広川貴次,膜貫通へリックスを持つタンパク質の立体構造予測に関する理論的研究,東京農工大学 工学研究科 博士論文,2000年7月19日,第3章及び第5章
審査請求日 平成16年4月22日(2004.4.22)
特許権者または実用新案権者 【識別番号】503360115
【氏名又は名称】独立行政法人科学技術振興機構
発明者または考案者 【氏名】美宅 成樹
【氏名】広川 貴次
個別代理人の代理人 【識別番号】100087631、【弁理士】、【氏名又は名称】滝田 清暉
審査官 【審査官】岩間 直純
参考文献・文献 美宅成樹,ゲノム情報科学 ホモロジーのないアミノ酸配列からの蛋白質構造・機能情報の抽出,蛋白質 核酸 酵素,日本,2001年12月,Vol.46,No.16,pp.2561-2566
美宅成樹,広川貴次,膜蛋白質の立体構造予測 膜蛋白質の判別と立体構造予測への展望,蛋白質 核酸 酵素,日本,1997年12月,Vol.42,No.17,pp.3020-3025
ITO H, et al.,A Transmembrane Topology Prediction Method Based on Integration Mechanism,Genome Informatics,2000年,Vol.11,pp.424-425
IKEDA M, et al.,Genome Informatics,2000年,Vol.11,pp.426-427
調査した分野 G06F 19/00 600
G06F 17/30 170
JICSTファイル(JOIS)
特許請求の範囲 【請求項1】
(a)蛋白質の構成要素である20個のアミノ酸それぞれについて、疎水性指標H、両親媒性指標A、及び非電荷指標Cを割り当て、(b)5~9個の何れかの数の一連の窓を有するウィンドウWを用いて、アミノ酸配列が決定された被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのアミノ酸配列について、該アミノ酸配列の疎水性コア指標Icoreを、前記疎水性指標を用いて計算した一回平均疎水性[H]を介して算出し、(c)得られたIcore値を縦軸とし、被判別蛋白質のアミノ酸鎖を横軸にしてプロットし、(d)得られたグラフが一定の閾値を超える領域の一連のアミノ酸残基の数が15以上となったとき、その領域を構成する一連のアミノ酸残基からなるセグメントを一次型膜貫通ヘリックスの候補とし、(e)得られた各候補について二回平均疎水性<H>及び平均両親媒性<A>を算出し、(f)被判別蛋白質のアミノ酸鎖の長さ(アミノ酸の数)、上記回平均疎水性、及び、平均両親媒性を用いた一定の判別式に従って一次型膜貫通ヘリックスの有無を判別し、(g)一次型膜貫通ヘリックスが存在しない場合には被判別蛋白質を水溶性蛋白質と認定し、(h)一次型膜貫通ヘリックスが存在する場合には、少なくとも、前記(d)における閾値を変更すること以外は、前記(b)~(d)と全く同様にしてセグメントを抽出し、該抽出したセグメントの集合から既に一次型膜貫通ヘリックスと認定されたセグメントを除去して二次型膜貫通ヘリックスの候補セグメントを得、(i)次いで前記(e)と同様にして各候補セグメントについて<H>’と<A>’を算出し、(j)前記二次型膜貫通ヘリックスの候補セグメントについてその中心が45残基以下である場合と45残基以上である場合に分類し、前記<H>’及び<A>’を用いた新たな判別式によって二次型膜貫通ヘリックスの有無を判別すると共に、(k)全く新しく、前記(b)で抽出された全てのアミノ酸配列の単位に対して非電荷指標Cを割り当て、該非電荷指標Cが1であるアミノ酸残基が連続して19残基以上存在するセグメントを抽出し、該セグメントについて前記<H>’及び<A>’を用いた判別式によって二次型膜貫通ヘリックスの有無を判別する方法であって、前記<H>’及び<A>’の演算の基本データとして(a)で各アミノ酸に割り当てた各指標及びその値を使用することを特徴とする、蛋白質判別方法。
【請求項2】
前記(a)-(k)から成る判別によって膜蛋白質であると認定された場合に、得られた膜貫通ヘリックスの本数を、予め記録された、膜貫通ヘリックスの本数と膜蛋白質の機能との対応表に照し合わせることにより、判別に係る蛋白質が有する機能を更に推定することを特徴とする、請求項1に記載されたアミノ酸配列の決定された蛋白質の判別方法。
【請求項3】
前記(a)-(k)から成る判別によって膜蛋白質であると認定された場合に、膜貫通ヘリックスであると認定されたアミノ酸配列について、(1)前後7残基領域の3.6周期のスペクトル密度を最大エントロピー法で計算すると共にその領域の平均疎水性値を求め、(2)膜貫通ヘリックスの中心からN端及びC端側に向けて、それぞれ1乃至10迄の数値jを下記一般式で表される膜環境フィルターに代入しながら(1)で計算したスペクトル強度を掛け合わせ、(3)上記(2)で得られた値と平均疎水性値の和の値が連続して設定された閾値を超えた時、その閾値の存在個所によって更に膜貫通領域を特定することを特徴とする、請求項1に記載されたアミノ酸配列の決定された蛋白質の判別方法。
JP0003722420B2_000009t.gif
発明の詳細な説明
【0001】
【発明の属する技術分野】
本発明は、アミノ酸配列が決定された蛋白質について、その性質や機能あるいは構造を判別する方法に関し、特にコンピュータを用いて、迅速且つ高い精度で膜蛋白質であるか否か膜蛋白質である場合には、膜蛋白質であるとの情報を与えるセグメントについての情報と共に、該膜蛋白質がいかなる機能を発揮するかを推定する蛋白質の判別方法に関する。
【0002】
【従来技術】
膜蛋白質の二次構造の予測は、一般にアミノ酸配列に疎水性指標を割り当てたプロフィールから簡単な計算によって予測することができる[Kyte, j. and Doolittle, R. F., J. Mol. Biol., 157(1982)103-132.]。更に、ニュートラルネットワーク[Rost, B., Casadio, R., Fariseli, P. and Sander, C., Prot. Sci., 4(1995)521-533]や統計的手法[Jones, D. T., Taylor, W. R. and Thornton, J. M., Biochemistry, 33(1994)3038-3049.]による方法も報告されている。しかしながら、水溶性蛋白質に比べて一見精度よく見える膜蛋白質二次構造予測にも、次のようないくつかの問題点がある。
【0003】
(1)ある種の蛋白質では、従来の方法では予測が困難な二次構造(膜貫通ヘリックス)が存在する。
(2)膜貫通ヘリックスの領域予測が十分でない。
(3)膜貫通ヘリックスに対して成績の良い方法でも、実際には水溶性蛋白質である多くのものを膜貫通ヘリックスとして誤認予測してしまう。
【0004】
膜貫通ヘリックスは、基本的には疎水性相互作用によって脂質二重膜の疎水性領域に入り、安定となる。しかしながら、ある疎水性インデックスの値を閾値とし、それを越える一次構造領域を膜貫通ヘリックスとするような従来の単純な方法では、本来単なる水溶性蛋白質であり、膜貫通ヘリックスではないアミノ酸配列の解析からも、多くの膜貫通ヘリックスが誤って予測されるという欠点があった。一方、膜貫通ヘリックスにはしばしば極性残基が含まれており、特に細胞内側には正電荷を持つ残基が多いことなどが知られている[von Heijne, G., J. Mol. Biol., 225(1992)487-494.]。このことは膜貫通ヘリックス形成にも極性相互作用の存在(極性と疎水性のバランス)を考慮することが必要であることを示している。
【0005】
一方、膜蛋白質ができるプロセスを考えてみると、アミノ酸配列にはいくつかの役割があるということが分かる。つまり、あるアミノ酸配列からなるセグメントを想定した場合、(イ)そのセグメント自体が膜貫通ヘリックスを作るべく設計された疎水性の高い配列である場合や、(ロ)膜貫通ヘリックスになったときに一定の機能を持つように設計されている場合などに分類することができる。後者の場合、膜蛋白質の機能に本質的に重要なアミノ酸配列は疎水性の低いアミノ酸残基を含む場合が多く、本来膜貫通ヘリックスを作ることに不利に働くが、近傍の疎水性の高いセグメントによって膜内に引き込まれ、膜貫通ヘリックスになると考えられる。
【0006】
つまり、膜貫通ヘリックスには次の2つのタイプがあると考えられる。
1)アミノ酸配列が本来持つ高い疎水性によって、そのセグメントが自発的に膜貫通ヘリックスを形成するタイプ
2)膜蛋白質の機能的に重要なセグメントなど比較的親水的なセグメントが、上記1)のタイプの膜貫通ヘリックスによって膜内に引き込まれ、膜貫通ヘリックスを形成するタイプ
これらの膜貫通ヘリックスが周囲のヘリックス同士で相互作用することによって強固にパッキングされ、膜蛋白質の立体構造が安定化されるものと考えられる。以上のような膜蛋白質の立体構造形成についての考察から、本発明においては主として上記1)のタイプのものを一次型膜貫通ヘリックス、2)のものを二次型膜貫通ヘリックスと分類する。
【0007】
そこで本発明者は、膜貫通ヘリックスをより高い精度で予測することについて鋭意検討した結果、Kyte-Doolittleの疎水性指標(以下、K-D疎水性指標とする)と、新しく定義した両親媒性指標および非電荷指標を用いて膜貫通候補セグメントを抽出・分類し、さらにタンパク質の大きさを考慮して予測した場合には、格段に高精度の予測が可能となることを見出し、本発明に到達した。
【0008】
【発明が解決しようとする課題】
従って本発明の第1の目的は、アミノ酸の配列が決定された蛋白質が膜蛋白質であるか否かを高い精度で判別するための、蛋白質の判別方法を提供することにある。
本発明の第2の目的は、膜蛋白質について、該膜蛋白質の機能を推定することのできる蛋白質の判別方法を提供することにある。
更に本発明の第3の目的は、膜蛋白質における膜貫通ヘリックスの領域を高い精度で予測することのできる、蛋白質の判別方法を提供することにある。
【0009】
【課題を解決するための手段】
本発明の上記の諸目的は、
(a)蛋白質の構成要素である20個のアミノ酸それぞれについて、疎水性指標H、両親媒性指標A、及び非電荷指標Cを割り当て、(b)5~9個の何れかの数の一連の窓を有するウィンドウWを用いて、アミノ酸配列が決定された被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのアミノ酸配列について、該アミノ酸配列の疎水性コア指標Icoreを、前記疎水性指標を用いて計算した一回平均疎水性[H]を介して算出し、(c)得られたIcore値を縦軸とし、被判別蛋白質のアミノ酸鎖を横軸にしてプロットし、(d)得られたグラフが一定の閾値を超える領域の一連のアミノ酸残基の数が15以上となったとき、その領域を構成する一連のアミノ酸残基からなるセグメントを一次型膜貫通ヘリックスの候補とし、(e)得られた各候補について二回平均疎水性<H>及び平均両親媒性<A>を算出し、(f)被判別蛋白質のアミノ酸鎖の長さ(アミノ酸の数)、上記回平均疎水性、及び、平均両親媒性を用いた一定の判別式に従って一次型膜貫通ヘリックスの有無を判別し、(g)一次型膜貫通ヘリックスが存在しない場合には被判別蛋白質を水溶性蛋白質と認定し、(h)一次型膜貫通ヘリックスが存在する場合には、少なくとも、前記(d)における閾値を変更すること以外は、前記(b)~(d)と全く同様にしてセグメントを抽出し、該抽出したセグメントの集合から既に一次型膜貫通ヘリックスと認定されたセグメントを除去して二次型膜貫通ヘリックスの候補セグメントを得、(i)次いで前記(e)と同様にして各候補セグメントについて<H>’と<A>’を算出し、(j)前記二次型膜貫通ヘリックスの候補セグメントについてその中心が45残基以下である場合と45残基以上である場合に分類し、前記<H>’及び<A>’を用いた新たな判別式によって二次型膜貫通ヘリックスの有無を判別すると共に、(k)全く新しく、前記(b)で抽出された全てのアミノ酸配列の単位に対して非電荷指標Cを割り当て、該非電荷指標Cが1であるアミノ酸残基が連続して19残基以上存在するセグメントを抽出し、該セグメントについて前記<H>’及び<A>’を用いた判別式によって二次型膜貫通ヘリックスの有無を判別する方法であって、前記<H>’及び<A>’の演算の基本データとして(a)で各アミノ酸に割り当てた各指標及びその値を使用し、その結果膜蛋白質であると認定された場合に、更にその膜蛋白質の機能を推定し、及び/又は、その膜蛋白質における膜貫通ヘリックスの領域を予測することのできる、蛋白質の判別方法によって達成された。
【0010】
【発明の実施の形態】
一般的に、一次型膜貫通ヘリックスは、水溶性蛋白質や膜蛋白質の水溶性ドメインには見られないような特徴を持っていて、特に疎水性が高い。しかしながら、疎水性だけではそれらを判断することができない。即ち、脂質からなる二重膜自体が、非常に疎水性の高い炭化水素鎖領域と表面に分布する極性基でできているために、膜貫通ヘリックスも、中心の疎水性部分だけで安定化しているのではなく、両端の極性部位による構造安定化がかなり重要であると考えられる。従って、中心部分に対する疎水性パラメーターである疎水性指標Hと共に、もう1つのパラメータとして膜貫通ヘリックスの両端にある極性残基の分布を考慮することが妥当であると考えられる。
【0011】
また、一般に極性基があると共に炭化水素部分が大きい場合には、分子の両親媒性が高く、ミセルやラメラ構造などの超分子構造を作りやすい。これと同様に、側鎖自体の両親媒性が高いと膜貫通ヘリックスの両端の構造を安定化し易いのではないかと考えられる。本発明者は、このことを用いて、新たに、下記表1に示す両親媒性指標A,Aを作成した。以後これを両親媒性指標Aとする。尚、Cは後述する非電荷指標であり、()内のアルファベットは、三文字表記のアミノ酸を一文字表記する場合の記号である。
【0012】
【表1】
JP0003722420B2_000002t.gif
【0013】
以下、本発明を具体的手順に従って説明する。
本発明においては、先ず判別しようとする蛋白質を構成する各アミノ酸に、表1によって予め設定されているK-D疎水性指標Hを割り当てる。次に、5~9箇から選択されるアミノ酸残基の数、好ましくは7箇の連続するアミノ酸残基に当てはめることのできるウィンドウWを用いて、下記(1)式によって一回平均疎水性[H]を計算する。
JP0003722420B2_000003t.gif 但し、iはウィンドウの中心のアミノ酸の座標である。
上記の計算は、例えば7残基について行う場合(W=7、W/2=3とする)には蛋白質を構成するアミノ酸鎖の左端から7残基ウィンドウを1残基ずつずらしながら、5残基(W=5、W/2=2とする)について行う場合には5残基ウィンドウを1残基ずつずらしながら、全ての単位について計算する。
【0014】
例えば、下記(5)式によって、疎水性コア指標であるIcore(i)を計算する。
core(i)=Positive([Hmax(i)]+S(i)・[Hmin(i)]) (5)
但し、[Hmax(i)]、[Hmin(i)]及びS(i)は下記6~8式で表される。
[Hmax(i)]=Max([H(j)]:j=i-n…,0,…,i+n) (6)
[Hmin(i)]=Min([H(j)]:j=i-n,…,0,…i+n) (7)
S(i)=Sign([Hmax(i)]・[Hmin(i)]) (8)
【0015】
上記のIcore(i)は正負の間を変動する関数の、正の部分(Positive)を表す。尚、Positive関数は、負の値の場合は0とする。この正の値が特定の閾値kより大きくなる部分を抽出し、その部分の連続するアミノ数の数がLより大であるものを、膜蛋白質か否かを判別するためのデータを保有する第一次セグメントの候補S(i)とし、この候補セグメントの集合をSとする。但しLは、15~25から選択された何れかのアミノ酸残基の数、即ち長さであり、好ましくは18~20から選択される整数である。尚、Lを19とした場合には、前記kとして、1.15を設定することが好ましい。また、Max及びMinは、領域の中から最大値及び最小値を選び出す関数であり、Signは()内が正のときS(i)が1となり、()内が負のときS(i)が-1となるように符号を返す関数である。
【0016】
上記の如くして抽出された候補S(i)の各セグメントについて、下記の式により、二回平均疎水性<H>と平均両親媒性<A>を計算する。下記式は、ウィンドウWを7とした場合について示したものである。尚、Aは表1に示された両親媒性指標であり、[H]は前記(1)式で求めたものである。但し、icはセグメントの中心、mはセグメント長の1/2である。
JP0003722420B2_000004t.gifJP0003722420B2_000005t.gifJP0003722420B2_000006t.gif
【0017】
次に、被判別蛋白質の長さNが約175(ここでは175と設定)より長い場合と短い場合に分けて、S(i)の集合Sに含まれる全てのセグメントについて次式の判別式を実行する。但し、通常、Nは90~250の整数である。
(ア):N≧175の場合:<A>≧-4<H>+4.8及び<A>≧-1<H>+1.5の両判別式を同時に満足するセグメントは一次型膜貫通ヘリックスである。
(イ):N<175の場合:判別式<A>≧-1.25<H>+1.625を満足するセグメントは一次型膜貫通ヘリックスである。
尚、上記判別式は、一般式<A>≧-a<H>+bで表され、このa及びbは、既知の多数の蛋白質に対する<A>及び<H>を計算し、<A>及び<H>を夫々X軸又はY軸としてグラフ化した散布図に基づいて選択される。従って、上記判別式における定数a、bは、夫々上記の値±10%の範囲で異なった値に設定される場合がある。
【0018】
上記判別式を満たすセグメントが前記候補セグメントの中に1つも存在しない場合には、被判別蛋白質は水溶性蛋白質であって、膜蛋白質ではないと判定され、判定操作(プログラム)は終了する。従って、この蛋白質については以降の演算はされず、別の被判別蛋白質について、初めから本判定操作(プログラム)が実行される。
一方、上記判別式を満たすセグメントが抽出されたとき、そのセグメントを一次型膜貫通ヘリックスであると判定する。
尚、上記の判別式は、既知の蛋白質について、平均両親媒性<A>の二回平均疎水性<H>依存性を表す散布図を作成することによって求めることができる。
【0019】
次に、類似の方法によって二次型膜貫通ヘリックスの存在の有無を判定する。この場合の候補セグメントとして、少なくともSを求めたときの閾値kの値を変えること以外は、Sの場合と同様にして候補セグメントを抽出し、この候補セグメントの集合の中から、前記一次型膜貫通ヘリックスを除去した残りの全セグメント(その集合をS’とする)、及び、新たに、非電荷指標Cが1であるアミノ酸が、15~25から選択された何れかの長さL’以上に連なった全てのセグメント(その集合をSとする)の集合を含める。S’を求めるとき、ウィンドウWや閾値kより大きくなる部分の連続するアミノ酸の数L等も、kの値と共に変更しても良い。
【0020】
次に、一次型膜貫通ヘリックスの判定の場合と同様にして、次式によって二次型膜貫通ヘリックスの有無を判定する。
’の集合に含まれる各セグメントに対する判別式は下記の通りである。
coreで決まる領域の中心が45残基以下の場合:<A>≧-2<H>+1.6
coreで決まる領域の中心がN端から45残基以上、且つ前記中心から前後65残基以内に一次型膜貫通ヘリックスの中心が存在する場合:<A>≧-2.71<H>+2.57
の集合に含まれる各セグメントについては、Sの場合と全く同様にして<H>及び<A>を求める。次に各候補セグメントについて、中心から前後50残基以内に一次型膜貫通ヘリックス又は上記判別式によって判別されたセグメントが存在することを条件として<A>≧-5<H>+1.9の判別式を満たすものを抽出する。
但し、これらの判別式における勾配や定数も±10%の範囲で変更する場合もある。
’及びSについて上記判別式を満足するセグメントがない場合には二次膜貫通ヘリックスは存在しないことになり、判別操作(プログラム)は終了する。
上記判別式を満足するセグメントが存在する場合には、そのセグメントを二次型膜貫通ヘリックスであると判定する。
【0021】
以上の判定によって得られた膜貫通ヘリックスの末端の最終的な領域を決定するために、本発明においては、最大エントロピー法によって周期のスペクトル密度を求め、それを下記f(j)の式で表される膜環境フィルタと組み合わせて膜貫通ヘリックスの末端を決定する。
JP0003722420B2_000007t.gif 但し、jはコアの中心から左右へ伸長する値である。
膜貫通ヘリックスの末端は、以下の操作によって決定する。
1.膜貫通ヘリックスのアミノ酸配列について、その前後7残基領域の3.6周期のスペクトル密度を最大エントロピー法で計算し、同時にその領域の平均疎水性値を求める。
2.膜貫通ヘリックスコアの中心からN端、C端側に向けて1,2,…10までの数値jを膜環境フィルターに代入しながら、(1)で計算したスペクトル強度を掛け合わせる。
3.(2)で得られた値と平均疎水性値を足しあわせてその値が連続してある閾値を超えれば、その領域を膜貫通ヘリックス領域とする。
尚、前記最大エントロピー法を用いる計算の詳細は、Biophysical Chemistry, 34(1989)の第70-71頁、「2.2 Spectral analysis」の項に記載されている。
【0022】
被判別蛋白質のアミノ酸配列について以上のデータ入力と演算を行わせ、不等式の判別式を満足する解がない場合には、判別操作(プログラム)はそこで終了する。本発明においては、各判別段階によって得られた全ての膜貫通ヘリックスの本数とそれらの領域についての情報を、モニター及び/又はプリンターによって出力する。勿論、各判別段階における、それらの情報を、個別に出力するようにすることも、全体情報と併せて各個別データを付加的に出力することもできる。
【0023】
上記の判別を実施する為のコンピュータプログラムのフローチャートは、図1に示される通りである。本発明のコンピュータプログラムは、C言語等を用いて記載することができる。以下に更に詳述する。
【0024】
本発明のプログラムを格納した記録手段を有するコンピュータを起動し、被判別蛋白質を形成するN個のアミノ酸配列を入力すると、各アミノ酸にN個の連続した整数が割り当てられ(STP100)、入力されたアミノ酸残基の数がN個であることが認識される。次に、入力された全てのアミノ酸残基に、予めメモリ部(記録手段)に保存されている前記表1のデータのうち、該当する疎水性指標Hの値を割り当てる(STP101)。
【0025】
所定のウィンドウ(例えば7つの連続した窓を有するウィンドウ)を、端から1残基ずつずらしながら、各ウィンドウに対応するアミノ酸列を抽出し、抽出された全てのアミノ酸列に対して、前記(1)式に従って一回平均疎水性[H]を計算する(STP102)。次に前記(5)式に従って、上記の全てのアミノ酸列に対してIcoreを計算しこれを被判別蛋白質のアミノ酸配列の順に対応させて整列させる(Icoreのグラフ化:STP103)。
【0026】
Icoreがk(例えば1.15)より大きくなる領域を抽出し、その領域のうちL(例えば19)より大きい数のアミノ酸残基が連続する部分のアミノ酸配列を候補セグメントとして抽出し、その集合をSとする(STP104)。次いで、この各候補セグメントについて、表1のデータを用い、前記した(2)~(4)式に従って二回平均疎水性<H>及び平均両親媒性<A>を計算する(STP105)。
【0027】
被判別蛋白質を形成するアミノ酸残基の数Nが175より大きい場合には、STP104で得られた集合Sに含まれる全ての候補セグメントについて、<A>≧-4<H>+4.8及び<A>≧-1<H>+1.5を同時に満たすか否か判別し、これらの判別式を満たすセグメントが抽出された場合にそれを一次型膜貫通ヘリックスと認定する。
一次型膜貫通ヘリックスが存在しない場合には、プログラムは終了し、被判別蛋白質が水溶性蛋白質であるとの結果を、モニター及び/又はプリンターに出力する(STP106)。
【0027】
で認定した二次型膜貫通ヘリックスが存在するものに対しては、判別式<A>≧-5<H>+1.9を満足するものを二次型膜貫通ヘリックスと認定する(STP110)。 これらの全ての演算が完了すると、一次型膜貫通ヘリックスの本数と領域、及び二次型膜貫通ヘリックスの本数と領域を出力してプログラムは、終了する。
【0028】
一次型膜貫通ヘリックスが存在した場合には、次に二次型膜貫通ヘリックスの有無の判断に移る。
少なくとも一次形膜貫通ヘリックスの判別操作で使用した閾値kをk’に変更し、必要に応じて、ウィンドウWや、候補セグメントを抽出するための閾値k’を超える領域として設定する一連のアミノ酸残基の数を更に変更すること以外は、Sの場合と同様にして候補セグメントを抽出し、この中から一次型膜貫通ヘリックスに該当するセグメントを除去し、この集合S’を二次型膜貫通ヘリックスの候補セグメントの部分集合と認定する(STP107)。次に、この集合S’に含まれる各セグメントについて、Sの場合と同様にして<H>及び<A>を求める(STP108)。
【0029】
セグメントの中心が45残基以下であるものに対しては判別式<A>≧-2<H>+1.6を満足するものを二次型膜貫通ヘリックスと認定し、45残基以上である場合には、更に、該セグメントの前後65残基以内に一次型膜貫通ヘリックスが存在することを条件に、判別式<A>≧-2.71<H>+2.57を満足するものを抽出し、これも二次型膜貫通ヘリックスと認定する(STP109)。
【0030】
【0031】
膜貫通ヘリックスの本数と膜蛋白質の機能とは一定の関係を有するので、その対応関係を表1の場合と同様に、予めコンピュータの記憶部に記憶させておくと、被判別蛋白質から抽出された全膜貫通ヘリックスの本数を該データと比較対照して、被判別蛋白質の機能をモニター及び/又はプリンターに出力することができる。
また、得られた膜貫通ヘリックスのアミノ酸配列について、(1)該アミノ酸配列の前後7残基領域の3.6周期のスペクトル密度を最大エントロピー法で計算すると共にその領域の平均疎水性値を求め、(2)膜貫通ヘリックスの中心からN端及びC端側に向けて、それぞれ1乃至10迄の数値jを下記一般式で表される膜環境フィルターに代入しながら、(1)で計算したスペクトル強度を掛け合わせ、(3)上記(2)で得られた値と平均疎水性値の和の値が連続して設定された閾値を超えた時、その閾値の存在個所によって特定された領域を、膜貫通ヘリックスの領域として抽出し、モニター及び/又はプリンターに出力することができる。
JP0003722420B2_000008t.gif
【0032】
【発明の効果】
本発明によれば、アミノ酸の一次配列が解明された蛋白質について、97%以上の正答率で、迅速に、被判別蛋白質が膜蛋白質であるか、水溶性蛋白質であるかを判定することができる。
【図面の簡単な説明】
【図1】本発明のコンピュータプログラムのフローチャートの全体図の1例である。
【図2】図1におけるSTP109のフローチャートである。
【図3】図1におけるSTP110のフローチャートである。
図面
【図1】
0
【図2】
1
【図3】
2