TOP > 国内特許検索 > GPIアンカー型タンパク質の判定装置、判定方法及び判定プログラム

GPIアンカー型タンパク質の判定装置、判定方法及び判定プログラム

国内特許コード P130008732
整理番号 2009-P44
掲載日 2013年3月22日
出願番号 特願2010-169324
公開番号 特開2012-032163
登録番号 特許第5773406号
出願日 平成22年7月28日(2010.7.28)
公開日 平成24年2月16日(2012.2.16)
登録日 平成27年7月10日(2015.7.10)
発明者
  • 池田 有理
  • 田中 大貴
  • 吉澤 昌朗
  • 佐々木 貴規
  • 池田 修己
出願人
  • 学校法人明治大学
発明の名称 GPIアンカー型タンパク質の判定装置、判定方法及び判定プログラム
発明の概要 【課題】高感度且つ高選択的に検査対象タンパク質がGPIアンカー型タンパク質であるか否かを判定する。
【解決手段】スコア数値列生成部114は、PSSM記憶部113が記憶するPSSMによって検査対象タンパク質のアミノ酸配列の各アミノ酸残基の位置特異的スコアを示すスコア数値列を生成する。次に、ニューラルネットワーク115は、当該スコア数値列を入力し、GPIアンカー型タンパク質らしさを示す0以上1以下の期待値を出力する。そして、GPIアンカー型タンパク質判定部116は、当該期待値の値に基づいて、検査対象タンパク質がGPIアンカー型タンパク質であるか否かを判定する。
【選択図】図1
従来技術、競合技術の概要


生体内の多くのタンパク質は、糖鎖、脂質、糖脂質等により翻訳後修飾を受けており、これらの修飾がタンパク質の機能や細胞内局在に影響することが知られている。これらの翻訳後修飾の中でも、脂質と糖鎖とからなる糖脂質であるGPIアンカーによる修飾は、非常に重要な意味を有するとされている。このことは、GPIアンカーが真核生物や古細菌において広く保存されていること、GPIアンカーを欠損した酵母や原虫は生存できず、GPIアンカーを欠損したヒトは造血幹細胞に異常を生じること等からも明らかである。
GPIにより修飾を受けるタンパク質は、GPIアンカー型タンパク質と呼ばれる。GPIアンカー型タンパク質は、そのアミノ酸配列のN末端に小胞体輸送のシグナルペプチドを有するため、小胞体内に輸送された後に翻訳を完了する。その後、GPIアンカー修飾部位(ωサイト)のC末端側に存在するプロペプチドが、トランスアミダーゼにより切断及び除去され、GPIアンカー型タンパク質は小胞体内で生合成されたGPIアンカーと結合する。GPIアンカーと結合したGPIアンカー型タンパク質は、ゴルジ体を経て細胞膜表面に輸送され、GPIアンカーにより細胞膜に繋ぎ止められる。
GPIアンカー型タンパク質の特徴としては、N末端のシグナルペプチド及びC末端のプロペプチドの疎水性が高く、ωサイトの近隣には残基サイズの小さいアミノ酸が存在することが知られている。



GPIアンカー型タンパク質としては、CD14、CD16b等の受容体、5’-ヌクレオチダーゼ、アルカリフォスファターゼ等の酵素等の生体反応に極めて重要なタンパク質が多く発見されている。また、狂牛病関連のプリオンタンパク質や、癌関連のヒト癌胎児性抗原(CEA)等、重篤な疾患に関わるタンパク質も見出されている。しかしながら、現在までに真核生物で知られているGPIアンカー型タンパク質は100種類程度であり、未だ発見されていないGPIアンカー型タンパク質が多く存在すると考えられている。そこで、近年では、コンピュータを用いたバイオインフォマティクス手法により、アミノ酸配列からGPIアンカー型タンパク質を新たに見つける試みがなされている。



例えば、非特許文献1には、真核生物のGPIアンカー型タンパク質を学習のデータセットとして、隠れマルコフモデルとサポートベクターマシン(SVM)とを組み合わせた判定手法を用いて、検査対象タンパク質のアミノ酸配列情報から、検査対象タンパク質がGPIアンカー型タンパク質であるか否かを判定する方法が記載されている。
また、非特許文献2には、原核生物及び真核生物のGPIアンカー型タンパク質を学習のデータセットとして、ωサイト前後のアミノ酸配列におけるアミノ酸の性質及び出現頻度をスコア化し、GPIアンカー修飾部位を予測し、検査対象タンパク質がGPIアンカー型タンパク質であるか否かを判定する方法が記載されている。
さらに、非特許文献3には、ニューラルネットワークの一種であるコホーネン自己組織化マップを用いて、検査対象の真核生物タンパク質がGPIアンカー型タンパク質であるか否かを判定する方法が記載されている。

産業上の利用分野


本発明は、検査対象タンパク質がGPI(glycosylphosphatidylinositol)アンカー型タンパク質であるか否かを判定するGPIアンカー型タンパク質の判定装置、判定方法及び判定プログラムに関する。

特許請求の範囲 【請求項1】
検査対象タンパク質がGPIアンカー型タンパク質であるか否かを判定するGPIアンカー型タンパク質の判定装置であって、
前記検査対象タンパク質のアミノ酸配列情報を取得する配列取得部と、
前記配列取得部が取得したアミノ酸配列情報における既知のGPIアンカー型タンパク質のプロペプチド領域を含む領域として、前記アミノ酸配列情報のC末端から予め定められた残基数の領域を特定し、当該プロペプチド領域を含む領域のアミノ酸残基を抽出し、当該抽出したアミノ酸残基のそれぞれに対して、当該プロペプチド領域を含む領域のアミノ酸残基の側鎖サイズの平均化に用いる残基数である側鎖サイズ特性抽出必要数を用いて、連続する当該側鎖サイズ特性抽出必要数分のアミノ酸残基の各側鎖サイズ指標値の平均値である平均側鎖サイズを1残基ずつずらしながら複数算出する側鎖サイズ算出部と、
既知のGPIアンカー型タンパク質の所定の領域内の位置に存在するアミノ酸残基の種類の出現頻度と既知の非GPIアンカー型タンパク質の所定の領域内の位置に存在するアミノ酸残基の種類の出現頻度とから求められる既知のGPIアンカー型タンパク質のアミノ酸残基位置におけるアミノ酸残基の種類の出現度合いを示す位置特異的スコアを取得し、当該位置特異的スコアに基づき、前記側鎖サイズ算出部が算出した平均側鎖サイズが最小となる位置を基準位置とする、当該基準位置からN末端側及びC末端側に連続する所定の残基数のアミノ酸残基からなる所定の領域におけるアミノ酸残基の部分配列の各アミノ酸残基の位置特異的スコアを特定し、当該各アミノ酸残基の位置特異的スコアを示す数値列であるスコア数値列を生成するスコア数値列生成部と、
前記スコア数値列生成部が生成したスコア数値列を入力し、GPIアンカー型タンパク質らしさを示す0以上1以下の期待値を出力する分類部であって、既知のGPIアンカー型タンパク質の前記スコア数値列を入力とした場合に、期待値として1を出力し、既知の非GPIアンカー型タンパク質の前記スコア数値列を入力した場合に、期待値として0を出力するように学習された分類部と、
前記分類部が出力した期待値が0.5未満であると判定した場合に、前記検査対象タンパク質がGPIアンカー型タンパク質でないと判定するGPIアンカー型タンパク質判定部と、
を備えることを特徴とするGPIアンカー型タンパク質の判定装置。

【請求項2】
前記分類部は、ニューラルネットワークであり、
前記スコア数値列生成部が生成するスコア数値列の要素数と同数のノードで構成される入力層と、複数のノードで構成される隠れ層と、1つのノードで構成される出力層とを少なくとも含む階層型の構造を有し、
前記入力層の各ノードは、前記スコア数値列のうち自身に対応づけられた要素が示す値を前記隠れ層のノードのそれぞれに出力し、
前記隠れ層の各ノードは、前記入力層の各ノードが出力する値を所定の伝達関数に代入し、得られた値を前記出力層のノードに出力し、
前記出力層のノードは、前記隠れ層の各ノードが出力する値を所定の伝達関数に代入し、得られた値を期待値として出力する
ことを特徴とする請求項1に記載のGPIアンカー型タンパク質の判定装置。

【請求項3】
前記分類部は、既知のGPIアンカー型タンパク質の前記スコア数値列を入力した場合に、期待値として1を出力するように前記ノードの伝達関数の係数を変化させ、前記既知の非GPIアンカー型タンパク質の前記スコア数値列を入力した場合に、期待値として0を出力するように前記ノードの伝達関数の係数を変化させることで学習されたことを特徴とする請求項2に記載のGPIアンカー型タンパク質の判定装置。

【請求項4】
前記ノードのそれぞれは伝達関数としてシグモイド関数を用いることを特徴とする請求項2または請求項3に記載のGPIアンカー型タンパク質の判定装置。

【請求項5】
前記側鎖サイズ特性抽出必要数は、
当該側鎖サイズ特性抽出必要数を用いて、既知の複数のGPIアンカー型タンパク質の小側鎖サイズ判定領域に対して平均側鎖サイズを算出した場合に、前記GPIアンカー型タンパク質から算出した平均側鎖サイズが最小となるアミノ酸残基のうち、当該アミノ酸残基のC末端側に隣接するアミノ酸残基がGPIアンカー修飾部位であるものの個数が最大となるような値である
ことを特徴とする請求項1から請求項4の何れか1項に記載のGPIアンカー型タンパク質の判定装置。

【請求項6】
前記小側鎖サイズ判定領域は、
既知のGPIアンカー型タンパク質の前記平均側鎖サイズが最小となる位置が含まれる領域である、
ことを特徴とする請求項5に記載のGPIアンカー型タンパク質の判定装置。

【請求項7】
前記位置特異的スコアは、
既知の複数のGPIアンカー型タンパク質の平均側鎖サイズが最小となる位置を基準位置とする前記所定の領域内の位置pに存在するアミノ酸残基の種類iの出現頻度を示すfippositive、既知の複数の非GPIアンカー型タンパク質の平均側鎖サイズが最小となる位置を基準位置とする前記所定の領域内の位置pに存在するアミノ酸残基の種類iの出現頻度を示すfipnegativeを用いて、
【数1】


から算出されたものであることを特徴とする請求項1から請求項6の何れか1項に記載のGPIアンカー型タンパク質の判定装置。

【請求項8】
前記所定の領域内の位置pに存在するアミノ酸残基の種類iの出現頻度は、
種類iのアミノ酸残基が位置pに存在する既知のGPIアンカー型タンパク質の個数を示すnipと、当該出現頻度の調整値を示すεと、アミノ酸残基の種類数sとを用いて、
【数2】


から算出されたものであることを特徴とする請求項7に記載のGPIアンカー型タンパク質の判定装置。

【請求項9】
前記配列取得部が取得したアミノ酸配列情報における既知のGPIアンカー型タンパク質のN末端側の高疎水性領域に対応する領域として、前記アミノ酸配列情報のN末端から予め定められた残基数の領域を特定し、当該N末端側の高疎水性領域に対応する領域のアミノ酸残基を抽出し、前記N末端側の高疎水性領域に対応する領域のアミノ酸残基の疎水性値の平均化に用いる残基数であるN末端側疎水性特性抽出必要数を用いて、連続する当該N末端側疎水性特性抽出必要数分のアミノ酸残基の各疎水性指標値の平均であるN末端側平均疎水性値を、前記抽出したアミノ酸残基のそれぞれに対して1残基ずつずらしながら複数算出するN末端側疎水性値算出部と、
前記N末端側疎水性値算出部が算出した複数のN末端側平均疎水性値のうちの最大値が、既知のGPIアンカー型タンパク質におけるN末端側平均疎水性値の特性を示すN末端側疎水性閾値以上であるか否かを判定するN末端側疎水性判定部と
を備え、
前記側鎖サイズ算出部、前記スコア数値列生成部、前記分類部、前記GPIアンカー型タンパク質判定部は、前記N末端側疎水性判定部が、前記N末端側疎水性値算出部の算出したN末端側平均疎水性値の最大値が前記N末端側疎水性閾値以上であると判定したアミノ酸配列情報に対して処理を行う
ことを特徴とする請求項1から請求項8の何れか1項に記載のGPIアンカー型タンパク質の判定装置。

【請求項10】
前記N末端側疎水性閾値は、
予め既知の複数のGPIアンカー型タンパク質に対して前記N末端側平均疎水性値の算出を行い、当該算出されたN末端側平均疎水性値の最大値の集合における最小値である
ことを特徴とする請求項9に記載のGPIアンカー型タンパク質の判定装置。

【請求項11】
前記N末端側疎水性特性抽出必要数は、
当該N末端側疎水性特性抽出必要数を用いて、既知の複数のGPIアンカー型タンパク質のN末端側の高疎水性領域のアミノ酸残基のそれぞれに対してN末端側平均疎水性値を算出し、前記既知のGPIアンカー型タンパク質から算出したN末端側平均疎水性値の最大値の集合における最小値を抽出し、前記N末端側疎水性特性抽出必要数を用いて、既知の複数の非GPIアンカー型タンパク質における既知のGPIアンカー型タンパク質のN末端側の高疎水性領域に対応する領域のアミノ酸残基のそれぞれに対してN末端側平均疎水性値を算出した場合に、前記既知の非GPIアンカー型タンパク質から算出したN末端側平均疎水性値の最大値のうち、前記抽出した最小値より値が大きいものの個数が最小となるような値である
ことを特徴とする請求項9または請求項10に記載のGPIアンカー型タンパク質の判定装置。

【請求項12】
前記配列取得部が取得したアミノ酸配列情報における既知のGPIアンカー型タンパク質のN末端側の高疎水性領域に対応する領域として、前記アミノ酸配列情報のN末端から予め定められた残基数の領域を特定し、当該N末端側の高疎水性領域に対応する領域以外のアミノ酸残基を抽出し、前記N末端側の高疎水性領域に対応する領域以外のアミノ酸残基の疎水性値の平均化に用いる残基数であるN末端外疎水性特性抽出必要数を用いて、連続する当該N末端外疎水性特性抽出必要数分のアミノ酸残基の各疎水性指標値の平均であるN末端外平均疎水性値を、前記抽出したアミノ酸残基のそれぞれに対して1残基ずつずらしながら複数算出するN末端外疎水性値算出部と、
前記N末端外疎水性値算出部が算出した複数のN末端外平均疎水性値のうちの最大値が、既知のGPIアンカー型タンパク質におけるN末端外平均疎水性値の特性を示すN末端外疎水性閾値以上であるか否かを判定するN末端外疎水性判定部と、
を備え、
前記側鎖サイズ算出部、前記スコア数値列生成部、前記分類部、前記GPIアンカー型タンパク質判定部は、前記N末端外疎水性判定部が、前記N末端外疎水性値算出部の算出したN末端外平均疎水性値の最大値が前記N末端外疎水性閾値以上であると判定したアミノ酸配列情報に対して処理を実行する
ことを特徴とする請求項1から請求項11の何れか1項に記載のGPIアンカー型タンパク質の判定装置。

【請求項13】
前記N末端外疎水性閾値は、
予め既知の複数のGPIアンカー型タンパク質に対して前記N末端外平均疎水性値の算出を行い、当該算出されたN末端外平均疎水性値の最大値の集合における最小値である
ことを特徴とする請求項12に記載のGPIアンカー型タンパク質の判定装置。

【請求項14】
前記N末端外疎水性特性抽出必要数は、
当該N末端外疎水性特性抽出必要数を用いて、既知の複数のGPIアンカー型タンパク質のN末端側の高疎水性領域以外の領域のアミノ酸残基のそれぞれに対してN末端外平均疎水性値を算出し、前記既知のGPIアンカー型タンパク質から算出したN末端外平均疎水性値の最大値の集合における最小値を抽出し、前記N末端外疎水性特性抽出必要数を用いて、既知の複数の非GPIアンカー型タンパク質における既知のGPIアンカー型タンパク質のN末端側の高疎水性領域に対応する領域以外の領域のアミノ酸残基のそれぞれに対してN末端外平均疎水性値を算出した場合に、前記既知の非GPIアンカー型タンパク質から算出したN末端外平均疎水性値の最大値のうち、前記抽出した最小値より値が大きいものの個数が最小となるような値である
ことを特徴とする請求項12または請求項13項に記載のGPIアンカー型タンパク質の判定装置。

【請求項15】
前記既知のGPIアンカー型タンパク質のN末端側の高疎水性領域に対応する領域は、
既知のGPIアンカー型タンパク質において、前記N末端側平均疎水性値が最大となる位置が含まれる領域である、
ことを特徴とする請求項9から請求項11の何れか1項に記載のGPIアンカー型タンパク質の判定装置。

【請求項16】
既知のGPIアンカー型タンパク質のC末端側の高疎水性領域に対応する領域として、前記アミノ酸配列情報のC末端から予め定められた残基数のアミノ酸残基を特定し、前記N末端外疎水性値算出部が算出したN末端外平均疎水性値が最大となるアミノ酸残基の位置が当該特定した領域内にあるか否かを判定するC末端側最大疎水位置判定部
を備え、
前記側鎖サイズ算出部、前記スコア数値列生成部、前記分類部、前記GPIアンカー型タンパク質判定部は、前記C末端側最大疎水位置判定部が、前記N末端外疎水性値算出部の算出したN末端外平均疎水性値が最大となるアミノ酸残基の位置が前記既知のGPIアンカー型タンパク質のC末端側の高疎水性領域に対応する領域内にあると判定したアミノ酸配列情報に対して処理を実行する
ことを特徴とする請求項12から請求項14の何れか1項に記載のGPIアンカー型タンパク質の判定装置。

【請求項17】
前記既知のGPIアンカー型タンパク質のC末端側の高疎水性領域に対応する領域は、
既知のGPIアンカー型タンパク質のN末端側の高疎水性領域に対応する領域以外の領域において、前記N末端外平均疎水性値が最大となる位置が含まれる領域である、
ことを特徴とする請求項16に記載のGPIアンカー型タンパク質の判定装置。

【請求項18】
検査対象タンパク質がGPIアンカー型タンパク質であるか否かを判定するGPIアンカー型タンパク質の判定装置を用いた判定方法であって、
前記GPIアンカー型タンパク質の判定装置の配列取得部は、前記検査対象タンパク質のアミノ酸配列情報を取得し、
前記GPIアンカー型タンパク質の判定装置の側鎖サイズ算出部は、前記配列取得部が取得したアミノ酸配列情報における既知のGPIアンカー型タンパク質のプロペプチド領域を含む領域として、前記アミノ酸配列情報のC末端から予め定められた残基数の領域を特定し、当該プロペプチド領域を含む領域のアミノ酸残基を抽出し、当該抽出したアミノ酸残基のそれぞれに対して、当該プロペプチド領域を含む領域のアミノ酸残基の側鎖サイズの平均化に用いる残基数である側鎖サイズ特性抽出必要数を用いて、連続する当該側鎖サイズ特性抽出必要数分のアミノ酸残基の各側鎖サイズ指標値の平均値である平均側鎖サイズを1残基ずつずらしながら複数算出し、
前記GPIアンカー型タンパク質の判定装置のスコア数値列生成部は、既知のGPIアンカー型タンパク質の所定の領域内の位置に存在するアミノ酸残基の種類の出現頻度と既知の非GPIアンカー型タンパク質の所定の領域内の位置に存在するアミノ酸残基の種類の出現頻度とから求められる既知のGPIアンカー型タンパク質のアミノ酸残基位置におけるアミノ酸残基の種類の出現度合いを示す位置特異的スコアを取得し、当該位置特異的スコアに基づき、前記側鎖サイズ算出部が算出した平均側鎖サイズが最小となる位置を基準位置とする、当該基準位置からN末端側及びC末端側に連続する所定の残基数のアミノ酸残基からなる所定の領域におけるアミノ酸残基の部分配列の各アミノ酸残基の位置特異的スコアを特定し、当該各アミノ酸残基の位置特異的スコアを示す数値列であるスコア数値列を生成し、
前記GPIアンカー型タンパク質の判定装置の分類部は、既知のGPIアンカー型タンパク質の前記スコア数値列を入力とした場合に、期待値として1を出力し、既知の非GPIアンカー型タンパク質の前記スコア数値列を入力した場合に、期待値として0を出力するように学習され、前記スコア数値列生成部が生成したスコア数値列を入力し、GPIアンカー型タンパク質であるか否かを示す0以上1以下の期待値を出力し、
前記GPIアンカー型タンパク質の判定装置のGPIアンカー型タンパク質判定部は、前記分類部が出力した期待値が0.5未満であると判定した場合に、前記検査対象タンパク質がGPIアンカー型タンパク質でないと判定する
ことを特徴とする判定方法。

【請求項19】
検査対象タンパク質がGPIアンカー型タンパク質であるか否かを判定するGPIアンカー型タンパク質の判定装置を、
前記検査対象タンパク質のアミノ酸配列情報を取得する配列取得部、
前記配列取得部が取得したアミノ酸配列情報における既知のGPIアンカー型タンパク質のプロペプチド領域を含む領域として、前記アミノ酸配列情報のC末端から予め定められた残基数の領域を特定し、当該プロペプチド領域を含む領域のアミノ酸残基を抽出し、当該抽出したアミノ酸残基のそれぞれに対して、当該プロペプチド領域を含む領域のアミノ酸残基の側鎖サイズの平均化に用いる残基数である側鎖サイズ特性抽出必要数を用いて、連続する当該側鎖サイズ特性抽出必要数分のアミノ酸残基の各側鎖サイズ指標値の平均値である平均側鎖サイズを1残基ずつずらしながら複数算出する側鎖サイズ算出部、
既知のGPIアンカー型タンパク質の所定の領域内の位置に存在するアミノ酸残基の種類の出現頻度と既知の非GPIアンカー型タンパク質の所定の領域内の位置に存在するアミノ酸残基の種類の出現頻度とから求められる既知のGPIアンカー型タンパク質のアミノ酸残基位置におけるアミノ酸残基の種類の出現度合いを示す位置特異的スコアを取得し、当該位置特異的スコアに基づき、前記側鎖サイズ算出部が算出した平均側鎖サイズが最小となる位置を基準位置とする、当該基準位置からN末端側及びC末端側に連続する所定の残基数のアミノ酸残基からなる所定の領域におけるアミノ酸残基の部分配列の各アミノ酸残基の位置特異的スコアを特定し、当該各アミノ酸残基の位置特異的スコアを示す数値列であるスコア数値列を生成するスコア数値列生成部、
前記スコア数値列生成部が生成したスコア数値列を入力し、GPIアンカー型タンパク質であるか否かを示す0以上1以下の期待値を出力する分類部であって、既知のGPIアンカー型タンパク質の前記スコア数値列を入力とした場合に、期待値として1を出力し、既知の非GPIアンカー型タンパク質の前記スコア数値列を入力した場合に、期待値として0を出力するように学習された分類部、
前記分類部が出力した期待値が0.5未満であると判定した場合に、前記検査対象タンパク質がGPIアンカー型タンパク質でないと判定するGPIアンカー型タンパク質判定部
として機能させるための判定プログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2010169324thum.jpg
出願権利状態 登録
掲載中の発明について更に詳しい内容の説明を御希望の際は、お気軽にお問い合せください。


PAGE TOP

close
close
close
close
close
close
close