TOP > 国内特許検索 > 蛋白質の機能部位予測方法と機能部位予測装置 並びに蛋白質の機能改良方法

蛋白質の機能部位予測方法と機能部位予測装置 並びに蛋白質の機能改良方法 実績あり

国内特許コード P110004526
整理番号 E044P01
掲載日 2011年7月19日
出願番号 特願平09-019249
公開番号 特開平10-222486
登録番号 特許第3801714号
出願日 平成9年1月31日(1997.1.31)
公開日 平成10年8月21日(1998.8.21)
登録日 平成18年5月12日(2006.5.12)
発明者
  • 土居 洋文
  • 平木 秀明
  • 金井 昭夫
出願人
  • 独立行政法人科学技術振興機構
  • 土居 洋文
  • セレスター・レキシコ・サイエンシズ株式会社
発明の名称 蛋白質の機能部位予測方法と機能部位予測装置 並びに蛋白質の機能改良方法 実績あり
発明の概要 機能未知の蛋白質について、その機能部位を予測するための方法と装置。
蛋白質は20種類のアミノ酸残基の配列によって構成されているが、その並びはランダムではない。アミノ酸配列の部分配列である特定のオリゴペプチドがゲノムでコードされる全蛋白質中に出現する頻度は均一ではなく、低頻度で出現するオリゴペプチドが個々の蛋白質の独自性や機能を決定していると考えられる。また、オリゴペプチドの長さが長くなるほどまれに出現するオリゴペプチドが多くなる。
すなわち、この蛋白質機能部位予測方法は、全蛋白質のアミノ酸配列から多くのオリゴペプチドの出現頻度が低くなる長さ(n+1)を確定し、蛋白質中の長さ(n+1)のオリゴペプチドに含まれる各アミノ酸残基の出現頻度を算出する。蛋白質の機能に対する各アミノ酸残基の責任の程度をその出現頻度の値を指標として予測することを特徴としている。
産業上の利用分野
この発明は、蛋白質の機能部位を予測する方法と、この機能予測を行なうための装置、ならびに蛋白質の機能を改良する方法に関するものである。さらに詳しくは、この発明は、ゲノム解析やcDNA解析により得られた機能未知の蛋白質の機能部位の予測や、機能が既知である蛋白質であってもその蛋白質のもつ新規の機能と機能部位の予測およびの機能向上のための改変部位の予測に関するものである。
特許請求の範囲 【請求項1】 ゲノムデータまたはcDNA解析データが既知である生物種aの予想される全蛋白質から、その生物種aの任意の蛋白質の機能部位を予測する方法であって、
(1) 生物種aの全蛋白質のアミノ酸配列について、各アミノ酸残基の出現頻度および各アミノ酸残基を組み合わせて順に長さを長くした各オリゴペプチドの出現頻度を求め、最初に以下の基準に合致するオリゴペプチドの長さn;
長さnのオリゴペプチドのうち、出現頻度1のものが出現頻度2のもの
よりも少なく、長さ(n+1)のオリゴペプチドのうち、出現頻度1の
ものが出現頻度2のものよりも多い;
を確定し、
(2) 機能部位予測対象の蛋白質のアミノ酸配列(長さL)のN末端からj番目アミノ酸残基をAj(n+1≦j≦L-n)とし、この蛋白質のアミノ酸配列の部分配列でj番目のアミノ酸残基Ajを含む長さ(n+1)のAjオリゴペプチド;
j1j2.....Aji..ajnj(n+1)(1≦i≦n+1;Aj=Ajiで
Ajはこのオリゴペプチドのi番目の残基を示す)
の出現頻度と、長さ(n+1)のXiオリゴペプチド;
j1j2.....Xi.....ajnj(n+1)(Xiは任意のアミノ酸残基を示す)
の出現頻度とを生物種aの全蛋白質中で求め、
(3) AjオリゴペプチドとXiオリゴペプチドの出現頻度の比Yjiを求め、
(4) Yjiの平均値Yj;
Yj=ΣYji/n+1(1≦i≦n+1)
を求め、
(5) Yjの関数値Zj;
Zj=f(Yj)(関数fは単調減少関数または単調増加関数)
を求め、このZjの値をアミノ酸配列(長さL)のj番目のアミノ酸残基の機能代表値とし、
(6) 以下、上記ステップ(2)から(5)を順次繰り返し、アミノ酸配列(長さL)のn+1≦j≦L-nの位置にある全アミノ酸残基Ajについて各々のZj値を求める
ことによって、蛋白質の機能に対する各アミノ酸残基の責任の程度をZj値の大きさを指標として予測すること特徴とする蛋白質の機能部位予測方法。
【請求項2】 請求項1記載の方法を自動的に行なう装置であって、少なくとも以下の(a)から(h)の装置、
(a) ゲノムデータまたはcDNA解析データが既知である生物種aの予想される全蛋白質のアミノ酸配列データ、および既存の蛋白質データベースを記憶する外部記憶装置、
(b) 生物種aの全蛋白質のアミノ酸配列について、各アミノ酸残基の出現頻度および各アミノ酸残基を組み合わせて順に長さを長くした各オリゴペプチドの出現頻度を計算するCPUと、その計算結果を記憶する記憶装置とからなる計算/記憶装置、
(c) 装置(b)に出現頻度が記憶された各オリゴペプチドの中から、最初に以下の基準に合致するオリゴペプチドの長さn;
長さnのオリゴペプチドのうち、出現頻度1のものが出現頻度2のもの
よりも少なく、長さ(n+1)のオリゴペプチドのうち、出現頻度1の
ものが出現頻度2のものよりも多い;
を計算するCPUと、nを記憶する記憶装置とからなる計算/記憶装置、
(d) 機能部位予測対象の蛋白質のアミノ酸配列(長さL)のN末端からj番目アミノ酸残基をAj(n+1≦j≦L-n)とし、この蛋白質のアミノ酸配列の部分配列でj番目のアミノ酸残基Ajを含む長さ(n+1)のAjオリゴペプチド;
j1j2.....Aji..ajnj(n+1)(1≦i≦n+1;Aj=Ajiで
Ajはこのオリゴペプチドのi番目の残基を示す)
の出現頻度と、長さ(n+1)のXiオリゴペプチド;
j1j2.....Xi ....ajnj(n+1)(Xiは任意のアミノ酸残基を示す)
の出現頻度とをこの生物種の全蛋白質中で求めるCPUと、その計算結果を記憶する記憶装置とからなる計算/記憶装置、
(e) AjオリゴペプチドとXiオリゴペプチドの出現頻度の比Yjiを求めるCPUと、Yjiを記憶する記憶装置とからなる計算/記憶装置、
(f) Yjiの平均値Yj;
Yj=ΣYji/n+1(1≦i≦n+1)
を求めるCPUと、Yjを記憶する記憶装置とからなる計算/記憶装置、
(g) Yjの関数値Zj;
Zj=f(Yj)(関数fは単調減少関数または単調増加関数)
を求めるCPUと、Zjを記憶する記憶装置とからなる計算/記憶装置、
(h) アミノ酸配列(長さL)について、各アミノ酸残基のZj値(n+1≦j≦L-n)を分布図として表示するディスプレー装置
を備えていることを特徴とする蛋白質の機能部位予測装置。
【請求項3】 ゲノムデータまたはcDNA解析データが既知である生物種aの全蛋白質から、機能が既知である蛋白質Aの機能を改良する方法であって、
(1) 蛋白質Aと近縁の蛋白質を既存の蛋白質データベースから抽出してアラインメントを行って、蛋白質Aを構成する各アミノ酸残基のうち、近縁の蛋白質とは異なるアミノ酸残基を特定し、
(2) 生物種aの全蛋白質のアミノ酸配列について、各アミノ酸残基の出現頻度および各アミノ酸残基を組み合わせて順に長さを長くした各オリゴペプチドの出現頻度を求め、最初に以下の基準に合致するオリゴペプチドの長さn;
長さnのオリゴペプチドのうち、出現頻度1のものが出現頻度2のもの
よりも少なく、長さ(n+1)のオリゴペプチドのうち、出現頻度1の
ものが出現頻度2のものよりも多い;
を確定し、
(3) 蛋白質Aのアミノ酸配列(長さL)のN末端からj番目アミノ酸残基をAj(n+1≦j≦L-n)とし、この蛋白質のアミノ酸配列の部分配列でj番目のアミノ酸残基Ajを含む長さ(n+1)のAjオリゴペプチド;
j1j2.....Aji..ajnj(n+1)(1≦i≦n+1;Aj=Ajiで
Ajはこのオリゴペプチドのi番目の残基を示す)
の出現頻度と、長さ(n+1)のXiオリゴペプチド;
j1j2.....Xi ....ajnj(n+1)(Xiは任意のアミノ酸残基を示す)
の出現頻度とを生物種aの全蛋白質中で求め、
(4) AjオリゴペプチドとXiオリゴペプチドの出現頻度の比Yjiを求め、
(5) Yjiの平均値Yj;
Yj=ΣYji/n+1(1≦i≦n+1)
を求め、
(6) Yjの関数値Zj;
Zj=f(Yj)(関数fは単調減少関数または単調増加関数)
を求め、このZjの値を蛋白質Aのアミノ酸配列(長さL)のj番目のアミノ酸残基の機能代表値とし、
(7) ステップ(3)から(6)を順次繰り返し、アミノ酸配列(長さL)の(n+1≦j≦L-nの位置にある全アミノ酸残基について各々のZj値を求め、
(8) 蛋白質Aのアミノ酸配列(長さL)について、ステップ(1)で特定した蛋白質Aのアミノ酸残基から変異させるアミノ酸残基を1種以上選択し、選択したアミノ酸残基がそれぞれ、近縁蛋白質の対応するアミノ酸残基に変異した種々の変異型アミノ酸配列を作成し、これらの変異型アミノ酸配列における全ての変異アミノ酸残基についてステップ(3)から(6)を順次繰り返し、変異アミノ酸残基のZj値を求め、
(9) ステップ(8)で求めた変異アミノ酸残基のZj値が、ステップ(7)で求めた元のアミノ酸残基のZj値より大きいか小さい変異型アミノ酸配列を選択し、その際にステップ(6)における関数値Zjが単調減少関数fによって得られた場合には、元のアミノ酸残基のZj値より大きい変異型アミノ酸配列を選択し、関数値Zjが単調増加関数fによって得られた場合には、元のアミノ酸残基のZj値より小さい変異型アミノ酸配列を選択し、
(10)このアミノ酸配列をコードする蛋白質Aの改変型遺伝子を作成し、この遺伝子の発現産物として改良型蛋白質を作成する
ことを特徴とする蛋白質の機能改良方法。
【請求項4】 ゲノムデータまたはcDNA解析データが未知である生物種bの蛋白質Bの機能を改良する方法であって、
(1) ゲノムデータまたはcDNA解析データが既知である生物種aの全蛋白質から、蛋白質Bと最も近縁の蛋白質Aを抽出してアラインメントを行い、また蛋白質Bと近縁の蛋白質を既存の蛋白質データベースから抽出してアラインメントを行って、蛋白質Aを構成する各アミノ酸残基のうち、蛋白質Bと近縁の蛋白質とは異なるアミノ酸残基を特定し、
(2) 生物種aの全蛋白質のアミノ酸配列について、各アミノ酸残基の出現頻度および各アミノ酸残基を組み合わせて順に長さを長くした各オリゴペプチドの出現頻度を求め、最初に以下の基準に合致するオリゴペプチドの長さn;
長さnのオリゴペプチドのうち、出現頻度1のものが出現頻度2のもの
よりも少なく、長さ(n+1)のオリゴペプチドのうち、出現頻度1の
ものが出現頻度2のものよりも多い;
を確定し、
(3) 蛋白質Aのアミノ酸配列(長さL)のN末端からj番目アミノ酸残基をAj(n+1≦j≦L-n)とし、この蛋白質のアミノ酸配列の部分配列でj番目のアミノ酸残基Ajを含む長さ(n+1)のAjオリゴペプチド;
j1j2.....Aji..ajnj(n+1)(1≦i≦n+1;Aj=Ajiで
Ajはこのオリゴペプチドのi番目の残基を示す)
の出現頻度と、長さ(n+1)のXiオリゴペプチド;
j1j2.....Xi ....ajnj(n+1)(Xiは任意のアミノ酸残基を示す)
の出現頻度とを生物種aの全蛋白質中で求め、
(4) AjオリゴペプチドとXiオリゴペプチドの出現頻度の比Yjiを求め、
(5) Yjiの平均値Yj;
Yj=ΣYji/n+1(1≦i≦n+1)
を求め、
(6) Yjの関数値Zj;
Zj=f(Yj)(関数fは単調減少関数または単調増加関数)
を求め、このZjの値を蛋白質Aのアミノ酸配列(長さL)のj番目のアミノ酸残基の機能代表値とし、
(7) ステップ(3)から(6)を順次繰り返し、アミノ酸配列(長さL)の(n+1≦j≦L-nの位置にある全アミノ酸残基について各々のZj値を求め、
(8) 蛋白質Aのアミノ酸配列(長さL)について、ステップ(1)で特定した蛋白質Aのアミノ酸残基から変異させるアミノ酸残基を1種以上選択し、選択したアミノ酸残基がそれぞれ、近縁蛋白質の対応するアミノ酸残基に変異した種々の変異型アミノ酸配列を作成し、これらの変異型アミノ酸配列における全ての変異アミノ酸残基についてステップ(3)から(6)を順次繰り返し、変異アミノ酸残基のZj値を求め、
(9) ステップ(8)で求めた変異アミノ酸残基のZj値が、ステップ(7)で求めた元のアミノ酸残基のZj値より大きいか小さい変異位置と変異アミノ酸残基を選択し、その際にステップ(6)における関数値Zjが単調減少関数fによって得られた場合には、元のアミノ酸残基のZj値より大きい変異型アミノ酸配列を選択し、関数値Zjが単調増加関数fによって得られた場合には、元のアミノ酸残基のZj値より小さい変異型アミノ酸配列を選択し、
(10)この位置でこの変異アミノ酸残基を実現する蛋白質Bの改変型遺伝子を作成し、この遺伝子の発現産物として改良型蛋白質を作成する
ことを特徴とする蛋白質の機能改良方法。
産業区分
  • 計算機応用
  • 微生物工業
国際特許分類(IPC)
Fターム
出願権利状態 権利存続中
参考情報 (研究プロジェクト等) ERATO 土居バイオアシンメトリプロジェクト 領域
ライセンスをご希望の方、特許の内容に興味を持たれた方は、問合せボタンを押してください。


PAGE TOP

close
close
close
close
close
close
close