TOP > 国内特許検索 > 蛋白質機能部位の予測方法と予測装置

蛋白質機能部位の予測方法と予測装置 実績あり

国内特許コード P110004552
整理番号 E044P04
掲載日 2011年7月20日
出願番号 特願平10-018699
公開番号 特開平11-213003
登録番号 特許第3792039号
出願日 平成10年1月30日(1998.1.30)
公開日 平成11年8月6日(1999.8.6)
登録日 平成18年4月14日(2006.4.14)
発明者
  • 土居 洋文
  • 平木 秀明
  • 金井 昭夫
出願人
  • 独立行政法人科学技術振興機構
  • 土居 洋文
  • セレスター・レキシコ・サイエンシズ株式会社
発明の名称 蛋白質機能部位の予測方法と予測装置 実績あり
発明の概要 機能未知の蛋白質の機能部位を予測する方法。
蛋白質は20種類のアミノ酸残基の配列によって構成されているが、ある生物種において、種々の蛋白質に高頻度で出現するオリゴペプチドや、まれにしか出現しないオリゴペプチドが存在する。このうち種々の蛋白質に共通して高頻度に出現するオリゴペプチドは、個々の蛋白質の独自性、すなわち機能を決める能力がなく、一方、低頻度で出現するオリゴペプチドが個々の蛋白質の独自性や機能を決定していると考えることができる。
つまり、蛋白質の機能部位はその部分を構成しているオリゴペプチドの出現頻度と対応していると考えられる。この方法では、AjオリゴペプチドとXiオリゴペプチドの出現頻度の比Yjiによって、アミノ酸残基AjがAjオリゴペプチドの出現頻度に寄与している程度を評価する。従って、蛋白質の任意の位置のアミノ酸残基Ajについて算出された関数値Z(j,n) 値が、その位置にあるアミノ酸残基Ajの出現指数(すなわち、その機能代表値となる)。
また、このZ(j,n) 値はアミノ酸残基Ajの種類によって異なっている。ある生物種の全蛋白質におけるZ(j,n) 値の分布を20種類のアミノ酸毎に求め、これらの分布より求めたアミノ酸毎の平均値と標準偏差値に基づいてZ(j,n) 値を標準化したD(j,n) 値が、アミノ酸残基の種類によるバイアスを補正した機能代表値となる。
さらに、オリゴペプチドの長さが長くなるほど、まれに出現するオリゴペプチドが多くなる。従って、一般に長さnによってもZ(j,n) 値やD(j,n) 値は異なるため、様々な長さで求めたZ(j,n) 値とD(j,n) 値の関数値Wj値が機能代表値となる。
産業上の利用分野
この発明は、蛋白質の機能部位を予測する方法と、この機能予測を行なうための装置に関するものである。さらに詳しくは、この発明は、ゲノム解析やcDNA解析により得られた機能未知の蛋白質の機能部位の予測や、機能が既知である蛋白質であってもその蛋白質のもつ新規の機能と機能部位の予測に関するものである。
特許請求の範囲 【請求項1】ゲノムデータまたはcDNA解析データが既知である生物種aの予想される全蛋白質から、その生物種aの任意の蛋白質の機能部位を特定する方法であって、
(1)生物種aの全蛋白質のアミノ酸配列について、各アミノ酸残基の出現頻度および各アミノ酸残基を組み合わせて順に長さを長くした各オリゴペプチドの出現頻度を求め、
(2)生物種aの任意の蛋白質について、
(2')アミノ酸配列(長さL)のN末端からj番目アミノ酸残基をAjとし、この蛋白質のアミノ酸配列の部分配列でj番目のアミノ酸残基Aj(n≦j≦L-n+1)を含む任意の長さn(1≦n≦M、ただしMは最初に以下の基準に合致するオリゴペプチドの長さM;長さMのオリゴペプチドはすべて、出現頻度1である)のAjオリゴペプチド;
j1j2.....aji .. ajn(1≦i≦n+1;Aj=ajiでAjはこのオリゴペプチドのi番目の残基を示す)
の出現頻度と、
Ajオリゴペプチドに対応する長さnのXiオリゴペプチド;
j1j2.....Xi.....ajn(Xiは任意のアミノ酸残基を示す)
の出現頻度とを生物種aの全蛋白質中で求め、
(3)AjオリゴペプチドとXiオリゴペプチドの出現頻度の比Yjiを求め、
(4)Yjiの平均値Y(j,n) ;
Y(j,n) =ΣYji/n(1≦i≦n)
を求め、
(5)Y(j,n) の関数値Z(j,n);
Z(j,n)=-log(Y(j,n))
を求め、
(6)以下、上記ステップ(2')から(5)を順次繰り返し、アミノ酸配列(長さL)のj番目(n≦j≦L-n+1)の位置にあるアミノ酸残基Ajについて各々のZ(j,n)値を求め、
(7)生物種aの全蛋白質について上記ステップ(2)から(6)を順次繰り返し、アミノ酸残基の種類毎のZ(j,n)値の分布を求め、この分布に基づいて各アミノ酸Aaに対するZ(j,n)値の平均値Av(Aa)と標準偏差値Sd(Aa)を求め、アミノ酸残基の種類による分布の違いを標準化する関数g;
g=(Z(j,n),Aj)={Z(j,n)-Av(Aa)}/Sd(Aa)(ただしAj=Aa)
を求め、
(8)アミノ酸配列(長さL)のj番目(n≦j≦L-n+1)の位置にある全アミノ酸残基Ajについてステップ(7)で得られた関数gの値D(j,n);
D(j,n)=g(Z(j,n),Aj)
を求め、
(9)アミノ酸配列(長さL)のj番目のアミノ酸残基の機能代表値をZ(j,n)値とD(j,n)値の関数値Wj;
Wj=h(Z(j,1),Z(j,2),... ,Z(j,M),D(j,1),D(j,2),... ,D(j,M))
とする、
ことによって、蛋白質の機能に対する各アミノ酸残基の責任の程度をWj値の大きさを指標として特定すること特徴とする蛋白質の機能部位特定方法。
【請求項2】各アミノ酸残基のWj値を2次元的な分布図として表示する請求項1の方法。
【請求項3】各アミノ酸残基のWj値を、蛋白質の立体構造モデル上に分布図として表示する請求項1の方法。
【請求項4】請求項1記載の方法を自動的に行なう装置であって、少なくとも以下の(a)から(i)の装置、
(a)ゲノムデータまたはcDNA解析データが既知である生物種aの予想される全蛋白質のアミノ酸配列データ、および既存の蛋白質データベースを記憶する外部記憶装置、
(b)この生物種aの全蛋白質のアミノ酸配列について、各アミノ酸残基の出現頻度および各アミノ酸残基を組み合わせて順に長さを長くした各オリゴペプチドの出現頻度を計算するCPUと、その計算結果を記憶する記憶装置とからなる計算/記憶装置、
(c)この生物種aの任意の蛋白質について、アミノ酸配列(長さL)のN末端からj番目アミノ酸残基をAjとし、この蛋白質のアミノ酸配列の部分配列でj番目のアミノ酸残基Aj(n≦j≦L-n+1)を含む任意の長さn(1≦n≦M、ただしMは最初に以下の基準に合致するオリゴペプチドの長さM;長さMのオリゴペプチドはすべて、出現頻度1である)のAjオリゴペプチド;
j1j2.....aji..ajn(1≦i≦n+1;Aj=ajiでAjはこのオリゴペプチドのi番目の残基を示す)
の出現頻度と、
Ajオリゴペプチドに対応する長さnのXiオリゴペプチド;
j1j2.....Xi.....ajn(Xiは任意のアミノ酸残基を示す)
の出現頻度とを生物種aの全蛋白質中で求めるCPUと、その計算結果を記憶する記憶装置とからなる計算/記憶装置、
(d)AjオリゴペプチドとXiオリゴペプチドの出現頻度の比Yjiを求めるCPUと、Yjiを記憶する記憶装置とからなる計算/記憶装置、
(e)Yjiの平均値Y(j,n);
Y(j,n) =ΣYji/n(1≦i≦n)
を求めるCPUと、Y(j,n)を記憶する記憶装置とからなる計算/記憶装置、
(f)Y(j,n)の関数値Z(j,n);
Z(j,n)=-log(Y(j,n))
を求めるCPUと、Z(j,n)を記憶する記憶装置とからなる計算/記憶装置、
(g)生物種aの全蛋白質のアミノ酸配列について、各アミノ酸残基のZ(j,n)を求め、アミノ酸残基の種類毎のZ(j,n)値の分布を求め、この分布に基づいて各アミノ酸Aaに対するZ(j,n)値の平均値Av(Aa)と標準偏差値Sd(Aa)を求め、アミノ酸残基の種類による分布の違いを標準化する関数g;
g=(Z(j,n),Aj)={Z(j,n)-Av(Aa)}/Sd(Aa)(ただしAj=Aa)
を求めるCPUと、gを記憶する計算装置とからなる計算/記憶装置、
(h)アミノ酸配列(長さL)のj番目(n≦j≦L-n+1)の位置にある全アミノ酸残基Ajについて、装置(g)に記憶された関数gの値D(j,n);
D(j,n)=g(Z(j,n),Aj)
を求めるCPUと、D(j,n)値を記憶する記憶装置とからなる計算/記憶装置、
(i)アミノ酸配列について、各アミノ酸残基のZ(j,n)値gとD(j,n)値の任意の関数値Wj;
Wj=h(Z(j,1),Z(j,2),... ,Z(j,M),D(j,1),D(j,2),... ,D(j,M))
を求める計算装置と、Wj値を記憶する記憶装置とからなる計算/記憶装置を備えていることを特徴とする蛋白質の機能部位特定装置。
【請求項5】アミノ酸配列について、各アミノ酸残基のWj値を2次元的な分布図として表示するディスプレー装置を備えている請求項4の装置。
【請求項6】既存の蛋白質立体構造データベースを記憶し、または公知の方法に従ってアミノ酸配列から立体構造モデルを作成し記憶する計算/記憶装置と、アミノ酸配列について、各アミノ酸残基のWj値を上記計算/記憶装置に記憶されている立体構造データベースまたは立体構造モデル上に分布図として表示するディスプレー装置を備えた請求項4の装置。
産業区分
  • 計算機応用
  • 有機化合物
  • 微生物工業
国際特許分類(IPC)
Fターム
出願権利状態 権利存続中
参考情報 (研究プロジェクト等) ERATO 土居バイオアシンメトリプロジェクト 領域
ライセンスをご希望の方、特許の内容に興味を持たれた方は、問合せボタンを押してください。


PAGE TOP

close
close
close
close
close
close
close