TOP > 国内特許検索 > ダンベル型水溶性蛋白質の判別方法、及びその為のコンピュータプログラム > 明細書

明細書 :ダンベル型水溶性蛋白質の判別方法、及びその為のコンピュータプログラム

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第4021153号 (P4021153)
公開番号 特開2002-286725 (P2002-286725A)
登録日 平成19年10月5日(2007.10.5)
発行日 平成19年12月12日(2007.12.12)
公開日 平成14年10月3日(2002.10.3)
発明の名称または考案の名称 ダンベル型水溶性蛋白質の判別方法、及びその為のコンピュータプログラム
国際特許分類 G01N  33/68        (2006.01)
G06F  17/30        (2006.01)
FI G01N 33/68
G06F 17/30 170F
請求項の数または発明の数 2
全頁数 12
出願番号 特願2001-089619 (P2001-089619)
出願日 平成13年3月27日(2001.3.27)
審査請求日 平成16年4月22日(2004.4.22)
特許権者または実用新案権者 【識別番号】503360115
【氏名又は名称】独立行政法人科学技術振興機構
発明者または考案者 【氏名】美宅 成樹
【氏名】高橋 俊哉
個別代理人の代理人 【識別番号】100087631、【弁理士】、【氏名又は名称】滝田 清暉
審査官 【審査官】宮地 匡人
参考文献・文献 特許第3722420(JP,B2)
高橋俊哉,ダンベル型水溶性タンパク質のヘリックス予測,日本生物物理学会第37回年会講演予稿集,日本,日本生物物理学会,1999年,p.S172
美宅成樹,膜蛋白質の立体構造予測 膜蛋白質の判別と立体構造予測への展望,蛋白質 核酸 酵素,日本,共立出版株式会社,1997年,第42巻,第17号,p.3020-3025
調査した分野 G01N 33/68
G06F 17/30
特許請求の範囲 【請求項1】
アミノ酸配列の決定された水溶性蛋白質が、ダンベル型蛋白質であるか否かを判別する方法であって、該方法が、(a)蛋白質の構成要素である20種のアミノ酸それぞれについて電荷指標Cを割り当てて該蛋白質の総電荷指標の絶対値|CT|を算出し、得られた|CT|が一定の閾値を超える蛋白質については、(b)蛋白質全体の電荷密度の絶対値|D|を算出し、該|D|が一定の閾値を超える蛋白質について、(c)蛋白質のアミノ酸配列を半分に分割した後、分割されたそれぞれの総電荷指標CN及びCCを算出し、CN×CCが一定の閾値以上となる蛋白質をダンベル型蛋白質の候補とし、(d)該蛋白質を構成する各アミノ酸に疎水性指標Hと両親媒性指標Aを割り当て、(e)次いで5~9個の何れかの数の一連の窓を有するウィンドウWを用いて被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのセグメントについて一回平均疎水性[H]及び一回平均両親媒性[A]を計算し、(f)前記アミノ酸の連続10残基以上が、前記一回平均疎水性[H]として-0.25以下をとる領域があるか否かを判別し、該領域があればその領域を前記アミノ酸配列のCore領域として抽出し、(g)得られたCore領域について二回平均疎水性<H>及び二回平均両親媒性を算出し、これらがそれぞれ一定の閾値を超える場合に、(h)Core領域の両端残基を除いた領域の[H]の最大値Maxと最小値Minを算出し、Max-Minが2.0以下となる場合に、(i)中央ヘリックス候補セグメントを、前記Core領域外両端の一回平均疎水性[H]が-0.30以下になる直前のアミノ酸残基を中央へリックスの末端とすることによって抽出し、(j)得られた候補セグメントを除いたN端側のアミノ酸残基数NN(アミノ酸の長さ)とC端側のアミノ酸残基数NC(アミノ酸の長さ)を算出し、該NNとNCが、 NC≦(3/2)×NN かつ NC≧(2/3)×NNの関係を有する場合に、(k)候補セグメントの総電荷指標CHと候補セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを算出し、これらの総電荷指標が全て正であるか全て負である場合にその蛋白質をダンベル型水溶性蛋白質と判別することを特徴とするダンベル型水溶性蛋白質の判別方法。
【請求項2】
蛋白質の構成要素である20種のアミノ酸のそれぞれに対して割り当てられた疎水性指標H、両親媒性指標A,及び電荷指標Cを用い、入力されたアミノ酸配列について、一回平均疎水性[H]、二回平均疎水性<H>、二回平均両親媒性
、総電荷指標|CT|及び電荷密度|D|を計算し、これらの値を利用して、アミノ酸配列の決定された蛋白質がダンベル型蛋白質であるか否かを判別するコンピュータプログラムであって、被判別蛋白質の全てのアミノ酸配列を入力し、判別プログラムを実行させると、(a)予め記憶部に記録された、前記20種のアミノ酸に設定された前記疎水性指標H、両親媒性指標A及び電荷指標Cのデータのうち、電荷指標Cのデータを参照して、入力した全てのアミノ酸残基のそれぞれに前記電荷指標Cを割り当て、該蛋白質の総電荷指標の絶対値|CT|を算出し、得られた|CT|が20以上であるか否かを判別し、20未満であればプログラムを終了し、(b)20以上となる蛋白質については蛋白質全体の電荷密度の絶対値|D|を算出し、該|D|が0.14以上であるかを判別する;0.14未満であればプログラムを終了し、(c)0.14以上を満足する蛋白質について、全アミノ酸配列を半分に分割した後、分割されたそれぞれの総電荷指標CN及びCCを算出し、CN×CCが100以上である蛋白質をダンベル型蛋白質の候補とし、該蛋白質を構成する各アミノ酸に疎水性指標Hと両親媒性指標Aを割り当て、(d)次いで5~9個の何れかの数の一連の窓を有するウィンドウWを用いて被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのセグメントについて一回平均疎水性[H]及び一回平均両親媒性[A]を計算する;次に(e)前記一回平均疎水性[H]が連続して10残基以上-0.25以下となる領域を探索し、該当する領域が無ければプログラムを終了し、該当する領域がある場合には、その領域をCore領域として定義する;(f)得られたCore領域について二回平均疎水性<H>及び二回平均両親媒性を算出し、<H>の値が-1.15以下であると共に、の値が0.90以上となるか否かを判別し、この条件が満たされない場合にはプログラムを終了する;(g)前記(f)の条件が満たされた場合に、前記Core領域の両端3残基を除いた領域の一回平均疎水性[H]の最大値Maxと最小値Minを算出し、Max-Minが2.0以下となるかを判別し、2.0を超える場合にはプログラムを終了する;(h)前記(g)の条件が満たされた場合、Core領域外の両端に向けて一回平均疎水性[H]を探索し、その値が-0.30以下になる直前のアミノ酸残基を、それぞれ中央ヘリックス候補セグメントの両末端とする;次に(i)得られた候補セグメントを除いたN端側のアミノ酸残基数NN(アミノ酸の長さ)とC端側のアミノ酸残基数NC(アミノ酸の長さ)を算出し、NC≦(3/2)NN且つNC≧(2/3)NNの判別条件を実行し、これらの条件が満たされない場合にはプログラムを終了する;(j)上記判別条件を満たすセグメントが存在した場合、該セグメントを中央ヘリックスの候補セグメントとし、(k)該候補セグメントの総電荷指標CHと候補セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを算出し、これらの総電荷指標が全て正であるか全て負である場合にその蛋白質をダンベル型水溶性蛋白質と判断し、その中央ヘリックスを出力して、全プログラムを終了することを特徴とするダンベル型水溶性蛋白質を判別するためのコンピュータプログラム。
発明の詳細な説明
【0001】
【発明の属する技術分野】
本発明は、アミノ酸配列が決定された水溶性蛋白質のコンピュータを用いた判別方法に関し、特に、コンピュータを用いて迅速且つ高い精度でダンベル型水溶性蛋白質であるか否かを判別する方法、及びダンベル型水溶性蛋白質の中央ヘリックスについての情報を出力する方法、並びにそれを実施する為のコンピュータプログラムに関する。
【0002】
【従来技術】
蛋白質の立体構造の分類方法及び構造予測方法は既に数多く知られているが、水溶性蛋白質の二次構造予測の精度はあまり高くないというのが現状である。その原因の一つとして、二次構造の分類がうまくなされていないということが挙げられる。即ち、統計的・経験的手法による水溶性蛋白質の二次構造予測の正当率は7割を越えていないが、これは、二次構造が同じであれば、それだけで一様に分類するということが一因と考えられる。
【0003】
例えば、水溶性蛋白質に含まれるヘリックスでの結合には、水相にむき出しになっているタイプのものもあれば、内部コアで形成されているタイプのものや極性と非極性の界面付近でうまく安定しているタイプのものもある。つまり、構造的には同じヘリックスでも環境が異なる場合には蛋白質の立体構造が同一であるとすることはできないのであるが、統計的・経験的手法ではこれらを同じものとして分類せざるを得ないので予測精度が下がる。従って、このようなヘリックスの環境が異なるものを、異なるものとして分類することが予測精度の向上につながると推定される。
【0004】
本発明が対象としている、水相にむき出しになったヘリックスをもつダンベル型水溶性蛋白質についても状況は同様である。尚、ここでダンベル型蛋白質とは、二つの水溶性ドメインが、一本の長い中央ヘリックスによって結ばれた構造をしている蛋白質である。
一般に、水溶性蛋白質の大部分は球状の形態をとることによって安定化しているが、ダンベル型蛋白質の場合には、二つの水溶性ドメインが同程度の大きな電荷を帯びて反発し合うことにより安定化していると考えられる。また、水溶性ドメインを結ぶ中央ヘリックスは、両親媒性残基が多く出現しそれらがヘリックスの安定化に寄与していると考えられる。
【0005】
そこで本発明者は、ダンベル型水溶性蛋白質と中央ヘリックスを高い精度で予測することについて鋭意検討した結果、蛋白質の大きさとその蛋白質を構成する各アミノ酸固有の電荷指標を用いて蛋白質を選別し、さらにKyte-Doolittleの疎水性指標(以下、K-D疎水性指標とする)と、新しく各アミノ酸に対して定義した両親媒性指標を用いて中央ヘリックス領域を予測したところ、極めて高精度の予測が可能となることを見出し、本発明に到達した。
【0006】
【発明が解決しようとする課題】
従って本発明の第1の目的は、アミノ酸配列が決定された水溶性蛋白質がダンベル型水溶性蛋白質であるか否かを迅速且つ高い精度で判別する方法を提供することにある。
本発明の第2の目的は、ダンベル型水溶性蛋白質の中央ヘリックスを、高い精度で判別するための方法を提供することにある。
更に本発明の第3の目的は、水溶性蛋白質の一次構造情報を用いて、その蛋白質がダンベル型水溶性蛋白質であるか否か、ダンベル型水溶性蛋白質である場合には更にその中央ヘリックスを、高い精度で判別するためのコンピュータプログラムを提供することにある。
【0007】
【課題を解決するための手段】
本発明の上記の諸目的は、アミノ酸配列の決定された水溶性蛋白質が、ダンベル型蛋白質であるか否かを判別する方法であって、該方法が、(a)蛋白質の構成要素である20種のアミノ酸それぞれについて電荷指標Cを割り当てて該蛋白質の総電荷指標の絶対値|CT|を算出し、得られた|CT|が一定の閾値を超える蛋白質については、(b)蛋白質全体の電荷密度の絶対値|D|を算出し、該|D|が一定の閾値を超える蛋白質について、(c)蛋白質のアミノ酸配列を半分に分割した後、分割されたそれぞれの総電荷指標CN及びCCを算出し、CN×CCが一定の閾値以上となる蛋白質をダンベル型蛋白質の候補とし、(d)該蛋白質を構成する各アミノ酸に疎水性指標Hと両親媒性指標Aを割り当て、(e)次いで5~9個の何れかの数の一連の窓を有するウィンドウWを用いて被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのセグメントについて一回平均疎水性[H]及び一回平均両親媒性[A]を計算し、(f)前記アミノ酸の連続10残基以上が、前記一回平均疎水性[H]として-0.25以下をとる領域があるか否かを判別し、該領域があればその領域を前記アミノ酸配列のCore領域として抽出し、(g)得られたCore領域について二回平均疎水性<H>及び二回平均両親媒性を算出し、これらがそれぞれ一定の閾値を超える場合に、(h)Core領域の両端残基を除いた領域の[H]の最大値Maxと最小値Minを算出し、Max-Minが2.0以下となる場合に、(i)中央ヘリックス候補セグメントを、前記Core領域外両端の一回平均疎水性[H]が-0.30以下になる直前のアミノ酸残基を中央へリックスの末端とすることによって抽出し、(j)得られた候補セグメントを除いたN端側のアミノ酸残基数NN(アミノ酸の長さ)とC端側のアミノ酸残基数NC(アミノ酸の長さ)を算出し、該NNとNCが、 NC≦(3/2)×NN かつ NC≧(2/3)×NNの関係を有する場合に、(k)候補セグメントの総電荷指標CHと候補セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを算出し、これらの総電荷指標が全て正であるか全て負である場合にその蛋白質をダンベル型水溶性蛋白質と判別することを特徴とするダンベル型水溶性蛋白質の判別方法、及び、その方法を実施するコンピュータプログラムによって達成された。
【0008】
【発明の実施の形態】
一般に、水溶性蛋白質の大部分は球状の形態をとることによって安定化しているが、ダンベル型蛋白質は球状の形態をとっていない。一方、ダンベル型蛋白質は、蛋白質の総電荷指標が大きく、電荷密度が高いという特徴と共に二つのドメインが同程度の大きな電荷を帯びているという特徴がある。従って、ダンベル型蛋白質の構造安定化には、蛋白質の電荷を考慮することが重要である。
【0009】
また、極性基があると共に炭化水素部分が大きい場合には、一般に分子の両親媒性が高く、これによって極性と非極性の界面が安定化される。これと同様に、側鎖自体の両親媒性が高いと水に露出した中央ヘリックスの構造を安定化し易いと考えられる。本発明者は、このことを用いて、新たに下記表1に示す両親媒性指標Aを作成した。なお、Hは疎水性指標、Cは電荷指標であり、()内のアルファベットは、三文字表記のアミノ酸を一文字表記する場合の記号である。
【0010】
【表1】
JP0004021153B2_000002t.gif
【0011】
以下、本発明を具体的手順に従って説明する。
本発明においては、ダンベル型蛋白質を次のように定義する(図1参照)。
(1)PDBに記述されているヘリックス領域のアミノ酸残基[HN]が20残基以上である。
(2)(1)のヘリックス両端のアミノ酸残基[NN][CN]が50残基以上である。
(3)(1)のヘリックスの中央残基を通り、ヘリックス末端2残基のCα原子を結ぶベクトルを法線ベクトルとする平面を考えたとき、ヘリックスN(C)端側の全Cα原子がN(C)端側の空間に存在する割合[PN]([PC])を計算し、それが99%以上である。
(4)蛋白質のサイズが大きいとドメインがいくつかあることが考えられるので、総残基数が500残基以内である。
【0012】
従って、本発明においては、蛋白質を構成するアミノ酸残基の数(アミノ酸鎖の長さ)Nが100以上500以下の蛋白質を判別の対象とする。尚、100残基以上としたのは、ダンベル型蛋白質の定義が120残基以上であること、及び、100残基未満の場合にはペプチドや蛋白質断片が多く含まれるからである。
本発明においては、先ず判別しようとする蛋白質を構成する各アミノ酸に、表1によって予め設定されている電荷指標Cを割り当て、下記(1)式によって総電荷指標の絶対値|CT|を計算する。
JP0004021153B2_000003t.gif(1)
但し、Nはアミノ酸残基の数(アミノ酸鎖の長さ)である。
【0013】
この総電荷指標の絶対値|CT|が20以上であるか否かを判別し、|CT|が20以上である場合には下記(2)式によって蛋白質全体の電荷密度の絶対値|D|を計算する。
JP0004021153B2_000004t.gif(2)
尚、閾値を20とした理由は、ダンベル型蛋白質は総電荷指標の絶対値が20以上の大きな電荷を帯びており、総電荷指標の絶対値が20以上の蛋白質の全体に占める割合は1.5%程度である。
【0014】
次に、この蛋白質全体の電荷密度の絶対値|D|が0.14以上であるか否かを判別し、上記|D|が0.14以上である場合には、対象としているアミノ酸配列を半分に分割し、それぞれの総電荷指標CN、CCを、下記(3-1)及び(3-2)式によって計算する。
JP0004021153B2_000005t.gif(3-1)
JP0004021153B2_000006t.gif(3-2)
但し、C(i)はi番目のアミノ酸残基の電荷、Nは全アミノ酸残基の数(アミノ酸鎖の長さ)である。Nが奇数のときはN/2の小数を四捨五入する。尚、既知のダンベル型蛋白質の解析から、負の単位残基当たりの電荷は0.14以上と大きく、0.14以上の蛋白質の全体に占める割合は0.4%程度であることが分かっている。
【0015】
上記のCN、CCよりCN×CCを計算し、その値が100以上であるか否かを判別し、CN×CCが100以上である場合には、対象としている蛋白質を構成する各アミノ酸に、表1によって予め設定されている疎水性指標H及び両親媒性指標Aを割り当てる。尚、既知のダンベル型蛋白質の解析から、負の単位残基当たりの電荷は10以上と大きく、10以上の蛋白質の全体に占める割合は0.3%程度であることが分かっている。
【0016】
次に、5~9箇から選択されるアミノ酸残基の数、好ましくは7箇の連続するアミノ酸残基に当てはめることのできるウィンドウWを用い、下記(4-1)及び(4-2)式によって一回平均疎水性 [H] 及び一回平均両親媒性 [A] を計算する。
JP0004021153B2_000007t.gif(4-1)
JP0004021153B2_000008t.gif(4-2)
但し、iはウィンドウの中心のアミノ酸の座標である。
【0017】
上記の計算は、例えば7残基について行う場合(W=7、W/2=3とする)には蛋白質を構成するアミノ酸鎖の左端から7残基ウィンドウを1残基ずつずらしながら、5残基(W=5、W/2=2とする)について行う場合には5残基ウィンドウを1残基ずつずらしながら、全ての単位について計算する。次に、連続10残基以上が、一回平均疎水性 [H] として-0.25以下をとる領域(Core領域とする)があるか否かを判別し、[H]が連続10残基以上で-0.25以下であるCore領域があればその領域を抽出する。尚、連続10残基以上とした理由は、中央ヘリックスの疎水性の低い領域が10残基より長いからである。
【0018】
上記の如くして抽出されたCore領域に対して、下記(5-1)、(5-2)式によって、二回平均疎水性<H> 及び 二回平均両親媒性 を計算する。
JP0004021153B2_000009t.gif(5-1)
但し、[H] は一回平均疎水性、S及びEはCore領域の開始残基と終始残基である。
また、NcoreはCore領域の残基数(E-S+1)である。
JP0004021153B2_000010t.gif(5-2)
但し、[A] は一回平均両親媒性、S及びEはCore領域の開始残基と終始残基である。
また、NcoreはCore領域の残基数(E-S+1)である。
【0019】
次に、このCore領域の二回平均疎水性 <H> の値が-1.15以下であると共に、二回平均両親媒性 の値が0.90以上であるか否かを判別する。尚、これらの閾値は既知のダンベル型蛋白質の解析に基づいて設定したものである。上記の2条件が満たされた場合には、抽出されたCore領域に対して、両端3残基を除いた領域の一回平均疎水性 [H] に対して最大値Maxと最小値Minを求める。次いで、Max-Minを計算し、その値が2.0以下となるか否かを判断する。
【0020】
Max-Minの値が2.0以下であると判断されたCore領域に対して、その領域外両端に一回平均疎水性 [H] の値を探索していき、-0.30以下になる直前のアミノ酸残基をそれぞれ中央ヘリックス候補セグメントの末端とする。
上記の中央ヘリックス候補セグメントに対して、そのセグメントを除いたN端側の総残基数NNとC端側の総残基数NCを計算し、次式の判別式を実行する。尚、N端はアミノ基末端、C端はカルボキシル基末端を意味する。
NC ≦(3/2)×NN かつ N C ≧(2/3)×NN
上記判別式を満たすセグメントを抽出する。
【0021】
上記の如くして抽出された中央ヘリックス候補セグメントに対して、下記(6-1)式によって総電荷指標CHを計算する。また、セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを下記(6-2)、(6-3)式によって計算する。
JP0004021153B2_000011t.gif(6-1)
JP0004021153B2_000012t.gif(6-2)
JP0004021153B2_000013t.gif(6-3)
但し、C(i)はアミノ酸残基iの電荷指標、S及びEは中央ヘリックス候補セグメントの開始残基と終始残基である。Nはアミノ酸鎖の長さ(アミノ酸の長さ)である。
【0022】
次に、次式の判別式を実行し、判別式を満たすセグメントを抽出する。
CH > 0 かつ CND > 0 かつ CCD > 0 あるいは
CH < 0 かつ CND < 0 かつ CCD < 0
上記の如くして抽出された中央ヘリックス候補セグメントを中央ヘリックス領域とし、その領域を含む蛋白質をダンベル型水溶性蛋白質と判別する。
【0023】
上記の判別を実施する為のコンピュータプログラムのフローチャートは図2~4に示される通りである。本発明のコンピュータプログラムはC言語などを用いて記載することができる。以下に更に詳述する。
【0024】
本発明のプログラムを起動し、被判別蛋白質を形成するN個のアミノ酸列を入力すると、記憶部に貯えられている前記表1のデータと照らし合わされ、各アミノ酸に、それぞれ固有の電荷指標が割り振られる(STP100)。次いで、前記(1)式によって総電荷指標の絶対値|CT|が計算される(STP101)。次に、得られた|CT|が20以上であるか否かを判別し(STP102)、20未満であればプログラムを終了し、必要に応じて新しい被判別蛋白質について、新たに操作を開始する。
【0025】
|CT|が20以上である場合には、(2)式によって蛋白質全体の電荷密度の絶対値|D|を計算する(STP103)。但し、(2)式中のNは、被判別蛋白質の全アミノ酸残基数(アミノ酸鎖の長さ)である。次に|D|が0.14以上であるか否かを判別する(STP104)。|D|が0.14未満である場合にはプログラムは終了する。|D|が0.14以上である場合には、N個からなる全アミノ酸配列を半分に分割し、分割されたそれぞれについて、総電荷指標CN(N端側)及びCC(C端側)を計算する(STP105)。
【0026】
次に、上記CNとCCの積CN×CCが100以上か否かを判別し(STP106)、100未満であればプログラムを終了する。CN×CCが100以上の場合には、表1に照らし合わせて、N個の全アミノ酸にそれぞれ固有のK-D疎水性指標Hと両親媒性指標Aを割り当てる(STP107)。これらの割り当ては、STP100で予め行っておいても良い。7残基ウィンドウを用い、前記式(4-1)によって一回平均疎水性[H]を計算する(STP108)。
【0027】
次に、[H]の値が連続10残基以上-0.25以下となるCore領域が存在するか否かを判別し(STP109)、存在しなければプログラムを終了する。Core領域が存在する場合には、該Core領域に対して、前記式(5-1)によって二回平均疎水性<H>を計算すると共に、式(5-2)によって二回平均両親媒性を計算する(STP110)。尚、STP108における[A]の計算は、STP108では行わずにSTP110のの計算の前に行うようにし、[A]から迄の計算を一貫して行わせても良い。
【0028】
次に、<H>≦-1.15且つ
≧0.90が満足されるか否かを判別し、満足されない場合にはプログラムを終了する。満足される場合には、Core領域の両端3残基を除いた領域について、[H]の最大値Maxと最小値Minを求める(STP112)。次いでMax-Minが2.以下であるか否かを判別し(STP113)、2.0を超えればプログラムを終了する。
【0029】
Max-Minが2.0以下となる場合には、Core領域外の両端に向って[H]の値を探索していき、-0.30以下になる直前の残基を候補セグメント末端と決定する。(STP114)。次に候補セグメントを除いたN端側総残基数NNとC端側総残基数NCを計算し(STP115)、NC≦3/2×NNかつNC≦2/3×NNを満足するか否かを判別する(STP116)。上記の条件が満たされない場合にはプログラムを終了する。
【0030】
上記の条件が満足される場合、候補セグメントの総電荷指標CH、候補セグメントを除いたN端側の総電荷指標CND、及び、C端側の総電荷指標CCDを計算する(STP117)。次に、CH、CND及びCCDが何れも正又は負となるか判断する(STP118)。これらの指標の符号が一致して正又は負とならない場合には、プログラムは終了する。上記の条件が満足される場合には、候補セグメントをダンベル型水溶性蛋白質の中央ヘリックスと判断し(STP119)、ダンベル型水溶性蛋白質であるとの判定と中央ヘリックス領域を出力し、プログラムを終了する。
尚、本プログラム中で行った判断の各結果を同時に出力するようにできることは当然である。
【0031】
下記表2に、12個のダンベル型蛋白質について、本発明のコンピュータプログラムを用いて解析した結果を示す。
【表2】
JP0004021153B2_000014t.gif
【0032】
【発明の効果】
本発明はダンベル型水溶液蛋白質の二次構造の特徴を考慮し、新たに各アミノ酸に対して設定した、電化荷指標、K-D疎水性指標、及び両親媒性指標を用いて、特にダンベル型水溶性蛋白質に絞って判別を行うので、従来になく、迅速且つ精度良く判別することができる。
【図面の簡単な説明】
【図1】ダンベル型蛋白質の定義を表す図である。
【図2】本発明のコンピュータプログラムのフローチャートの内、ダンベル型蛋白質の候補を抽出するための部分フローチャートである。
【図3】本発明のコンピュータプログラムのフローチャートの内、ダンベル型蛋白質の候補について、中央ヘリックスの候補となるセグメントを抽出するための部分フローチャートである。
【図4】本発明のコンピュータプログラムのフローチャートの内、中央ヘリックスとダンベル型蛋白質についての最終判断をするための部分フローチャートである。
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3