Top > Search of Japanese Patents > METHOD FOR DISCRIMINATING DUMBBELL WATER SOLUBLE PROTEIN, AND COMPUTER PROGRAM THEREFORE

METHOD FOR DISCRIMINATING DUMBBELL WATER SOLUBLE PROTEIN, AND COMPUTER PROGRAM THEREFORE achieved

Patent code P03A000383
File No. Y00-P469
Posted date Aug 28, 2003
Application number P2001-089619
Publication number P2002-286725A
Patent number P4021153
Date of filing Mar 27, 2001
Date of publication of application Oct 3, 2002
Date of registration Oct 5, 2007
Inventor
  • (In Japanese)美宅 成樹
  • (In Japanese)高橋 俊哉
Applicant
  • (In Japanese)国立研究開発法人科学技術振興機構
Title METHOD FOR DISCRIMINATING DUMBBELL WATER SOLUBLE PROTEIN, AND COMPUTER PROGRAM THEREFORE achieved
Abstract PROBLEM TO BE SOLVED: To provide a method for discriminating water soluble protein, whose amino acid sequence is decided, whether it is a dumbbell type or not, and provide a computer program therefor.
SOLUTION: A hydrophobic index H and an amphipathic index A are allocated to each amino acid constituting protein, a Core region of the amino acid sequence is calculated through single average hydrophobicity [H], and double average hydrophobicity <;H>; and double average amphiphilicity <;A>; are calculated on the obtained Core region. The maximum value Max and the minimum value Min of a region except for both end residues of the Core region are calculated, and if Max-Min is a constant threshold or less, amino acid residue number NN at N end and amino acid residue number NC at C end are calculated. A total charge index CH of a candidate segment and a total charge index CND at N end excluding the candidate segment and a total charge index CCD at C end are calculated, and if these charge indexes are all positive or all negative, the protein is discriminated as dumbbell water soluble protein.
Outline of related art and contending technology (In Japanese)


蛋白質の立体構造の分類方法及び構造予測方法は既に数多く知られているが、水溶性蛋白質の二次構造予測の精度はあまり高くないというのが現状である。その原因の一つとして、二次構造の分類がうまくなされていないということが挙げられる。即ち、統計的・経験的手法による水溶性蛋白質の二次構造予測の正当率は7割を越えていないが、これは、二次構造が同じであれば、それだけで一様に分類するということが一因と考えられる。



例えば、水溶性蛋白質に含まれるヘリックスでの結合には、水相にむき出しになっているタイプのものもあれば、内部コアで形成されているタイプのものや極性と非極性の界面付近でうまく安定しているタイプのものもある。つまり、構造的には同じヘリックスでも環境が異なる場合には蛋白質の立体構造が同一であるとすることはできないのであるが、統計的・経験的手法ではこれらを同じものとして分類せざるを得ないので予測精度が下がる。従って、このようなヘリックスの環境が異なるものを、異なるものとして分類することが予測精度の向上につながると推定される。



本発明が対象としている、水相にむき出しになったヘリックスをもつダンベル型水溶性蛋白質についても状況は同様である。尚、ここでダンベル型蛋白質とは、二つの水溶性ドメインが、一本の長い中央ヘリックスによって結ばれた構造をしている蛋白質である。
一般に、水溶性蛋白質の大部分は球状の形態をとることによって安定化しているが、ダンベル型蛋白質の場合には、二つの水溶性ドメインが同程度の大きな電荷を帯びて反発し合うことにより安定化していると考えられる。また、水溶性ドメインを結ぶ中央ヘリックスは、両親媒性残基が多く出現しそれらがヘリックスの安定化に寄与していると考えられる。



そこで本発明者は、ダンベル型水溶性蛋白質と中央ヘリックスを高い精度で予測することについて鋭意検討した結果、蛋白質の大きさとその蛋白質を構成する各アミノ酸固有の電荷指標を用いて蛋白質を選別し、さらにKyte-Doolittleの疎水性指標(以下、K-D疎水性指標とする)と、新しく各アミノ酸に対して定義した両親媒性指標を用いて中央ヘリックス領域を予測したところ、極めて高精度の予測が可能となることを見出し、本発明に到達した。

Field of industrial application (In Japanese)


本発明は、アミノ酸配列が決定された水溶性蛋白質のコンピュータを用いた判別方法に関し、特に、コンピュータを用いて迅速且つ高い精度でダンベル型水溶性蛋白質であるか否かを判別する方法、及びダンベル型水溶性蛋白質の中央ヘリックスについての情報を出力する方法、並びにそれを実施する為のコンピュータプログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
アミノ酸配列の決定された水溶性蛋白質が、ダンベル型蛋白質であるか否かを判別する方法であって、該方法が、(a)蛋白質の構成要素である20種のアミノ酸それぞれについて電荷指標Cを割り当てて該蛋白質の総電荷指標の絶対値|CT|を算出し、得られた|CT|が一定の閾値を超える蛋白質については、(b)蛋白質全体の電荷密度の絶対値|D|を算出し、該|D|が一定の閾値を超える蛋白質について、(c)蛋白質のアミノ酸配列を半分に分割した後、分割されたそれぞれの総電荷指標CN及びCCを算出し、CN×CCが一定の閾値以上となる蛋白質をダンベル型蛋白質の候補とし、(d)該蛋白質を構成する各アミノ酸に疎水性指標Hと両親媒性指標Aを割り当て、(e)次いで5~9個の何れかの数の一連の窓を有するウィンドウWを用いて被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのセグメントについて一回平均疎水性[H]及び一回平均両親媒性[A]を計算し、(f)前記アミノ酸の連続10残基以上が、前記一回平均疎水性[H]として-0.25以下をとる領域があるか否かを判別し、該領域があればその領域を前記アミノ酸配列のCore領域として抽出し、(g)得られたCore領域について二回平均疎水性<H>及び二回平均両親媒性<A>を算出し、これらがそれぞれ一定の閾値を超える場合に、(h)Core領域の両端残基を除いた領域の[H]の最大値Maxと最小値Minを算出し、Max-Minが2.0以下となる場合に、(i)中央ヘリックス候補セグメントを、前記Core領域外両端の一回平均疎水性[H]が-0.30以下になる直前のアミノ酸残基を中央へリックスの末端とすることによって抽出し、(j)得られた候補セグメントを除いたN端側のアミノ酸残基数NN(アミノ酸の長さ)とC端側のアミノ酸残基数NC(アミノ酸の長さ)を算出し、該NNとNCが、 NC≦(3/2)×NN かつ NC≧(2/3)×NNの関係を有する場合に、(k)候補セグメントの総電荷指標CHと候補セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを算出し、これらの総電荷指標が全て正であるか全て負である場合にその蛋白質をダンベル型水溶性蛋白質と判別することを特徴とするダンベル型水溶性蛋白質の判別方法。

【請求項2】
 
蛋白質の構成要素である20種のアミノ酸のそれぞれに対して割り当てられた疎水性指標H、両親媒性指標A,及び電荷指標Cを用い、入力されたアミノ酸配列について、一回平均疎水性[H]、二回平均疎水性<H>、二回平均両親媒性<A>、総電荷指標|CT|及び電荷密度|D|を計算し、これらの値を利用して、アミノ酸配列の決定された蛋白質がダンベル型蛋白質であるか否かを判別するコンピュータプログラムであって、被判別蛋白質の全てのアミノ酸配列を入力し、判別プログラムを実行させると、(a)予め記憶部に記録された、前記20種のアミノ酸に設定された前記疎水性指標H、両親媒性指標A及び電荷指標Cのデータのうち、電荷指標Cのデータを参照して、入力した全てのアミノ酸残基のそれぞれに前記電荷指標Cを割り当て、該蛋白質の総電荷指標の絶対値|CT|を算出し、得られた|CT|が20以上であるか否かを判別し、20未満であればプログラムを終了し、(b)20以上となる蛋白質については蛋白質全体の電荷密度の絶対値|D|を算出し、該|D|が0.14以上であるかを判別する;0.14未満であればプログラムを終了し、(c)0.14以上を満足する蛋白質について、全アミノ酸配列を半分に分割した後、分割されたそれぞれの総電荷指標CN及びCCを算出し、CN×CCが100以上である蛋白質をダンベル型蛋白質の候補とし、該蛋白質を構成する各アミノ酸に疎水性指標Hと両親媒性指標Aを割り当て、(d)次いで5~9個の何れかの数の一連の窓を有するウィンドウWを用いて被判別蛋白質のアミノ酸配列から抽出される前記ウィンドウWと対応する全てのセグメントについて一回平均疎水性[H]及び一回平均両親媒性[A]を計算する;次に(e)前記一回平均疎水性[H]が連続して10残基以上-0.25以下となる領域を探索し、該当する領域が無ければプログラムを終了し、該当する領域がある場合には、その領域をCore領域として定義する;(f)得られたCore領域について二回平均疎水性<H>及び二回平均両親媒性<A>を算出し、<H>の値が-1.15以下であると共に、<A>の値が0.90以上となるか否かを判別し、この条件が満たされない場合にはプログラムを終了する;(g)前記(f)の条件が満たされた場合に、前記Core領域の両端3残基を除いた領域の一回平均疎水性[H]の最大値Maxと最小値Minを算出し、Max-Minが2.0以下となるかを判別し、2.0を超える場合にはプログラムを終了する;(h)前記(g)の条件が満たされた場合、Core領域外の両端に向けて一回平均疎水性[H]を探索し、その値が-0.30以下になる直前のアミノ酸残基を、それぞれ中央ヘリックス候補セグメントの両末端とする;次に(i)得られた候補セグメントを除いたN端側のアミノ酸残基数NN(アミノ酸の長さ)とC端側のアミノ酸残基数NC(アミノ酸の長さ)を算出し、NC≦(3/2)NN且つNC≧(2/3)NNの判別条件を実行し、これらの条件が満たされない場合にはプログラムを終了する;(j)上記判別条件を満たすセグメントが存在した場合、該セグメントを中央ヘリックスの候補セグメントとし、(k)該候補セグメントの総電荷指標CHと候補セグメントを除いたN端側の総電荷指標CNDとC端側の総電荷指標CCDを算出し、これらの総電荷指標が全て正であるか全て負である場合にその蛋白質をダンベル型水溶性蛋白質と判断し、その中央ヘリックスを出力して、全プログラムを終了することを特徴とするダンベル型水溶性蛋白質を判別するためのコンピュータプログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2001089619thum.jpg
State of application right Registered
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close