TOP > 国内特許検索 > ダンベル型水溶性蛋白質の判別方法、及びその為のコンピュータプログラム

ダンベル型水溶性蛋白質の判別方法、及びその為のコンピュータプログラム 実績あり

国内特許コード P03A000383
整理番号 Y00-P469
掲載日 2003年8月28日
出願番号 特願2001-089619
公開番号 特開2002-286725
登録番号 特許第4021153号
出願日 平成13年3月27日(2001.3.27)
公開日 平成14年10月3日(2002.10.3)
登録日 平成19年10月5日(2007.10.5)
発明者
  • 美宅 成樹
  • 高橋 俊哉
出願人
  • 国立研究開発法人科学技術振興機構
発明の名称 ダンベル型水溶性蛋白質の判別方法、及びその為のコンピュータプログラム 実績あり
発明の概要 【課題】 アミノ酸配列が決定された水溶液蛋白質について、それがダンベル型であるか否かを判断する方法、及びそのためのコンピュータプログラムの提供。
【解決手段】 蛋白質を構成する各アミノ酸に疎水性指標Hと両親媒性指標Aを割り当て、アミノ酸配列のCore領域を一回平均疎水性 [H] を介して算出し、得られたCore領域について二回平均疎水性 <H> 及び二回平均両親媒性<A> を算出する。次にCore領域の両端残基を除いた領域の [H] の最大値Maxと最小値Minを算出し、Max-Minが一定の閾値以下となる場合に、N端側のアミノ酸残基数NNとC端側のアミノ酸残基数NCを算出する。また、候補セグメントの総電荷指標CHと候補セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを算出し、これらの総電荷指標が全て正であるか全て負である場合にその蛋白質をダンベル型水溶性蛋白質と判別する。
従来技術、競合技術の概要


蛋白質の立体構造の分類方法及び構造予測方法は既に数多く知られているが、水溶性蛋白質の二次構造予測の精度はあまり高くないというのが現状である。その原因の一つとして、二次構造の分類がうまくなされていないということが挙げられる。即ち、統計的・経験的手法による水溶性蛋白質の二次構造予測の正当率は7割を越えていないが、これは、二次構造が同じであれば、それだけで一様に分類するということが一因と考えられる。



例えば、水溶性蛋白質に含まれるヘリックスでの結合には、水相にむき出しになっているタイプのものもあれば、内部コアで形成されているタイプのものや極性と非極性の界面付近でうまく安定しているタイプのものもある。つまり、構造的には同じヘリックスでも環境が異なる場合には蛋白質の立体構造が同一であるとすることはできないのであるが、統計的・経験的手法ではこれらを同じものとして分類せざるを得ないので予測精度が下がる。従って、このようなヘリックスの環境が異なるものを、異なるものとして分類することが予測精度の向上につながると推定される。



本発明が対象としている、水相にむき出しになったヘリックスをもつダンベル型水溶性蛋白質についても状況は同様である。尚、ここでダンベル型蛋白質とは、二つの水溶性ドメインが、一本の長い中央ヘリックスによって結ばれた構造をしている蛋白質である。
一般に、水溶性蛋白質の大部分は球状の形態をとることによって安定化しているが、ダンベル型蛋白質の場合には、二つの水溶性ドメインが同程度の大きな電荷を帯びて反発し合うことにより安定化していると考えられる。また、水溶性ドメインを結ぶ中央ヘリックスは、両親媒性残基が多く出現しそれらがヘリックスの安定化に寄与していると考えられる。



そこで本発明者は、ダンベル型水溶性蛋白質と中央ヘリックスを高い精度で予測することについて鋭意検討した結果、蛋白質の大きさとその蛋白質を構成する各アミノ酸固有の電荷指標を用いて蛋白質を選別し、さらにKyte-Doolittleの疎水性指標(以下、K-D疎水性指標とする)と、新しく各アミノ酸に対して定義した両親媒性指標を用いて中央ヘリックス領域を予測したところ、極めて高精度の予測が可能となることを見出し、本発明に到達した。

産業上の利用分野


本発明は、アミノ酸配列が決定された水溶性蛋白質のコンピュータを用いた判別方法に関し、特に、コンピュータを用いて迅速且つ高い精度でダンベル型水溶性蛋白質であるか否かを判別する方法、及びダンベル型水溶性蛋白質の中央ヘリックスについての情報を出力する方法、並びにそれを実施する為のコンピュータプログラムに関する。

特許請求の範囲 【請求項1】
アミノ酸配列の決定された水溶性蛋白質が、ダンベル型蛋白質であるか否かを判別する方法であって、該方法が、(a)蛋白質の構成要素である20種のアミノ酸それぞれについて電荷指標Cを割り当てて該蛋白質の総電荷指標の絶対値|CT|を算出し、得られた|CT|が一定の閾値を超える蛋白質については、(b)蛋白質全体の電荷密度の絶対値|D|を算出し、該|D|が一定の閾値を超える蛋白質について、(c)蛋白質のアミノ酸配列を半分に分割した後、分割されたそれぞれの総電荷指標CN及びCCを算出し、CN×CCが一定の閾値以上となる蛋白質をダンベル型蛋白質の候補とし、(d)該蛋白質を構成する各アミノ酸に疎水性指標Hと両親媒性指標Aを割り当て、(e)次いで5~9個の何れかの数の一連の窓を有するウィンドウWを用いて被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのセグメントについて一回平均疎水性[H]及び一回平均両親媒性[A]を計算し、(f)前記アミノ酸の連続10残基以上が、前記一回平均疎水性[H]として-0.25以下をとる領域があるか否かを判別し、該領域があればその領域を前記アミノ酸配列のCore領域として抽出し、(g)得られたCore領域について二回平均疎水性<H>及び二回平均両親媒性<A>を算出し、これらがそれぞれ一定の閾値を超える場合に、(h)Core領域の両端残基を除いた領域の[H]の最大値Maxと最小値Minを算出し、Max-Minが2.0以下となる場合に、(i)中央ヘリックス候補セグメントを、前記Core領域外両端の一回平均疎水性[H]が-0.30以下になる直前のアミノ酸残基を中央へリックスの末端とすることによって抽出し、(j)得られた候補セグメントを除いたN端側のアミノ酸残基数NN(アミノ酸の長さ)とC端側のアミノ酸残基数NC(アミノ酸の長さ)を算出し、該NNとNCが、 NC≦(3/2)×NN かつ NC≧(2/3)×NNの関係を有する場合に、(k)候補セグメントの総電荷指標CHと候補セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを算出し、これらの総電荷指標が全て正であるか全て負である場合にその蛋白質をダンベル型水溶性蛋白質と判別することを特徴とするダンベル型水溶性蛋白質の判別方法。

【請求項2】
蛋白質の構成要素である20種のアミノ酸のそれぞれに対して割り当てられた疎水性指標H、両親媒性指標A,及び電荷指標Cを用い、入力されたアミノ酸配列について、一回平均疎水性[H]、二回平均疎水性<H>、二回平均両親媒性<A>、総電荷指標|CT|及び電荷密度|D|を計算し、これらの値を利用して、アミノ酸配列の決定された蛋白質がダンベル型蛋白質であるか否かを判別するコンピュータプログラムであって、被判別蛋白質の全てのアミノ酸配列を入力し、判別プログラムを実行させると、(a)予め記憶部に記録された、前記20種のアミノ酸に設定された前記疎水性指標H、両親媒性指標A及び電荷指標Cのデータのうち、電荷指標Cのデータを参照して、入力した全てのアミノ酸残基のそれぞれに前記電荷指標Cを割り当て、該蛋白質の総電荷指標の絶対値|CT|を算出し、得られた|CT|が20以上であるか否かを判別し、20未満であればプログラムを終了し、(b)20以上となる蛋白質については蛋白質全体の電荷密度の絶対値|D|を算出し、該|D|が0.14以上であるかを判別する;0.14未満であればプログラムを終了し、(c)0.14以上を満足する蛋白質について、全アミノ酸配列を半分に分割した後、分割されたそれぞれの総電荷指標CN及びCCを算出し、CN×CCが100以上である蛋白質をダンベル型蛋白質の候補とし、該蛋白質を構成する各アミノ酸に疎水性指標Hと両親媒性指標Aを割り当て、(d)次いで5~9個の何れかの数の一連の窓を有するウィンドウWを用いて被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのセグメントについて一回平均疎水性[H]及び一回平均両親媒性[A]を計算する;次に(e)前記一回平均疎水性[H]が連続して10残基以上-0.25以下となる領域を探索し、該当する領域が無ければプログラムを終了し、該当する領域がある場合には、その領域をCore領域として定義する;(f)得られたCore領域について二回平均疎水性<H>及び二回平均両親媒性<A>を算出し、<H>の値が-1.15以下であると共に、<A>の値が0.90以上となるか否かを判別し、この条件が満たされない場合にはプログラムを終了する;(g)前記(f)の条件が満たされた場合に、前記Core領域の両端3残基を除いた領域の一回平均疎水性[H]の最大値Maxと最小値Minを算出し、Max-Minが2.0以下となるかを判別し、2.0を超える場合にはプログラムを終了する;(h)前記(g)の条件が満たされた場合、Core領域外の両端に向けて一回平均疎水性[H]を探索し、その値が-0.30以下になる直前のアミノ酸残基を、それぞれ中央ヘリックス候補セグメントの両末端とする;次に(i)得られた候補セグメントを除いたN端側のアミノ酸残基数NN(アミノ酸の長さ)とC端側のアミノ酸残基数NC(アミノ酸の長さ)を算出し、NC≦(3/2)NN且つNC≧(2/3)NNの判別条件を実行し、これらの条件が満たされない場合にはプログラムを終了する;(j)上記判別条件を満たすセグメントが存在した場合、該セグメントを中央ヘリックスの候補セグメントとし、(k)該候補セグメントの総電荷指標CHと候補セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを算出し、これらの総電荷指標が全て正であるか全て負である場合にその蛋白質をダンベル型水溶性蛋白質と判断し、その中央ヘリックスを出力して、全プログラムを終了することを特徴とするダンベル型水溶性蛋白質を判別するためのコンピュータプログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2001089619thum.jpg
出願権利状態 登録
ライセンスをご希望の方、特許の内容に興味を持たれた方は、問合せボタンを押してください。


PAGE TOP

close
close
close
close
close
close
close