Top > Search of International Patents > METHOD OF CLASSIFYING PROTEIN/COMPOUND PAIRS

METHOD OF CLASSIFYING PROTEIN/COMPOUND PAIRS

Foreign code F080001981
File No. F080001981
Posted date Nov 27, 2008
Country WIPO
International application number 2007JP071236
International publication number WO 2008/053924
Date of international filing Oct 31, 2007
Date of international publication May 8, 2008
Priority data
  • P2006-297111 (Oct 31, 2006) JP
Title METHOD OF CLASSIFYING PROTEIN/COMPOUND PAIRS
Abstract It is intended to provide a method of constructing a pattern recognizer, wherein comprehensively applicable protein data and compound data are employed, with the use of generally usable and easily available data. It is also intended to provide an estimation method of estimating the interaction of a pair the interaction of which is unknown by using the above method of constructing a pattern recognizer. In a first pair having a first interaction and a second pair having a second interaction, more specifically speaking, at least one factor selected from four factors (i.e., the peak position in mass spectral data obtained for each compound, the peak position and intensity, the interval between two peaks, and the interval between two peaks and the intensity corresponding thereto) is vectorized by using data relating to interactions (binding, etc.) between proteins and compounds as indication. Next, the amino acid sequence of each protein is vectorized and a vector involving the element of the above vector derived from each protein and the element of the above vector derived from each compound is formed. On this vector, learning is made with the use of a support vector machine (SVM). Thus, a pattern recognizer capable of distinguishing the class to which the first pair belongs from the class to which the second pair belongs is constructed.
Scope of claims (In Japanese)
【請求項1】第1の相互作用をする第1のタンパク質と化合物のペア及び第2の相互作用をする第2のタンパク質と化合物のペアに対して、第1のペアが属するクラス及び第2のペアが属するクラスを識別するパターン認識器の構成方法であって、各化合物について得られたマススペクトルデータの少なくとも1つの因子をベクトル化し、それぞれベクトルa1~ax(xは1以上の整数)とする工程と、各タンパク質をベクトル化し、ベクトルb1~by(yは1以上の整数)とする工程と、少なくとも各化合物に由来して作成された前記ベクトルa1~axのうちの1つと該化合物とペアである前記タンパク質に由来して作成された当該ベクトルbk(kは1~yのいずれかの整数)とを結合させ、サポートベクターマシン(SVM)を適用して学習させることを特徴とするパターン認識器構成方法。

【請求項2】前記マススペクトルデータの少なくとも1つの因子が、ピークの位置、ピークの位置及び強度、2つのピークの間隔、2つのピークの間隔及び対応する強度、の4つの因子から選ばれることを特徴とする請求項1に記載のパターン認識器構成方法。

【請求項3】前記ベクトルb1~byは、前記タンパク質における所定のアミノ酸配列の出現頻度を要素とするベクトルであることを特徴とする請求項1または2に記載のパターン認識器構成方法。

【請求項4】各化合物に由来して作成された前記ベクトルの1つは、下記式(1)でベクトル化されるベクトルF(c)であることを特徴とする請求項1~3のいずれかに記載のパターン認識器構成方法。式(1):式中、Mは、全ての化合物に対して観測されるピークのm/z値の集合であり、M(c)は当該ペアの化合物に対して観測されるピークのm/z値の集合であり、I(m)は当該ペアの化合物に対して観測されるピークのm/z値におけるピークの強度を表す。

【請求項5】各化合物に由来して作成された前記ベクトルの1つは、以下の数式でベクトル化されるベクトルF’(c)であることを特徴とする請求項1~3のいずれか1項に記載のパターン認識器構成方法。式(2):式中、Mは、全ての化合物に対して観測されるピークのm/z値の集合であり、M(c)は当該ペアの化合物に対して観測されるピークのm/z値の集合を表す。

【請求項6】各化合物に由来して作成された前記ベクトルの1つは、以下の数式でベクトル化されるベクトルであることを特徴とする請求項1~3のいずれか1項に記載のパターン認識器構成方法。式(3):式中、Mgは、分類する全ての化合物に対して観察される2つのピークのm/z値の差の集合であり、Mg(c)は当該ペアの化合物に対して観察されるm/z値i及びjにおける2つのピークのm/z値の差j-iの集合であり、ここで、式(4):式中、M(c)は、当該ペアの化合物で観測されるピークのm/z値の集合であり、ここで、式(5):式中、Ii,Ijは、m/z値i及びjにおける2つのピークの強度であり、tはギャップを考慮する強度の閾値であり、wはm/z値i及びjにおける2つのピークのm/z値の差j-iの閾値である。

【請求項7】各化合物に由来して作成された前記ベクトルの1つは、以下の数式でベクトル化されるベクトルであることを特徴とする請求項1~3のいずれか1項に記載のパターン認識器構成方法。式(6):式中、Mgは、分類する全ての化合物に対して観察される2つのピークのm/z値の差の集合であり、Mg(c)は第3のペアの化合物に対して観察される2つのピークのm/z値の差の集合である。

【請求項8】各化合物に由来して作成された前記ベクトルと、該化合物とペアである前記タンパク質に由来して作成された前記ベクトルを結合させて、ベクトル(al,bk)または(ap,aq,bk)を作成し、当該ベクトルにサポートベクターマシン(SVM)を適用することを特徴とする請求項1~7に記載のパターン認識器構成方法。(式中、l、p、qは1~xのいずれか、kは1~yのいずれかである。)

【請求項9】各化合物の物理化学的特性値、化学式、構造式、3次元立体構造の4つの因子から選ばれた少なくとも1つの因子をベクトル化してベクトルDとし、該化合物に由来して作成された前記ベクトルと、該化合物とペアである前記タンパク質に由来して作成された前記ベクトルと、前記ベクトルDを結合させて、ベクトル(al,D,bk)または(ap,aq,D,bk)を作成し、当該ベクトルにサポートベクターマシン(SVM)を適用することを特徴とする請求項1~7のいずれか1項に記載のパターン認識器構成方法。(式中、l、p、qは1~xのいずれか、kは1~yのいずれかである)

【請求項10】サポートベクターマシンの識別関数が、下式(7)のように表現されることを特徴とする請求項1~9のいずれか1項に記載のパターン認識器構成方法。式(7):

【請求項11】前記式(7)Kに下式(8)Kconc.を適用することを特徴とする請求項10に記載のパターン認識器構成方法。式(8):

【請求項12】前記式(7)Kに下式(9)Kcombiを適用することを特徴とする請求項10に記載のパターン認識器構成方法。式(9):

【請求項13】サポートベクターマシンが、linearカーネル、polynomialカーネル、RBF(Radial Basis Function)カーネル、またはsigmoidカーネルを利用することを特徴とする請求項1~12のいずれか1項に記載のパターン認識器構成方法。

【請求項14】前記相互作用が、タンパク質と化合物の物理的結合であって、第1の相互作用は、タンパク質と化合物が結合することであり、第2の相互作用は、タンパク質と化合物が結合しないことであり、タンパク質と化合物のペアを、結合するかしないかで分類することを特徴とする請求項1~13のいずれかに記載のパターン認識器構成方法。

【請求項15】前記相互作用が、タンパク質と化合物の機能的結合であって、第1の相互作用は、アゴニストとして化合物がタンパク質と結合することであり、第2の相互作用は、アンタゴニストとして化合物がタンパク質と結合することであり、化合物がタンパク質に対しアゴニストとして結合するか、アンタゴニストとして結合するか、によって、前記タンパク質と前記化合物のペアを分類することを特徴とする請求項1~13のいずれかに記載のパターン認識器構成方法。

【請求項16】タンパク質と化合物の相互作用を予測する予測方法であって、第1の相互作用をするタンパク質と化合物の第1のペア、第2の相互作用をするタンパク質と化合物の第2のペア、前記予測するべきタンパク質と化合物の第3のペアに対し、請求項1~15のいずれかに記載のパターン認識器構成方法により、第1のペアが属するクラス及び第2のペアが属するクラスを識別するパターン認識器を構成する工程と、第3のペアを用いて作成されたベクトルBに対して前記パターン認識器を適用して、第3のペアが、前記2つのクラスのどちらのクラスに入るかを識別する工程と、を含むことを特徴とする予測方法。

【請求項17】化合物ライブラリーの中から、特定のタンパク質に結合する化合物をスクリーニングするスクリーニング方法であって、前記化合物ライブラリーに含まれる各化合物に対して請求項16に記載の予測方法を行なって、前記タンパク質と当該化合物の相互作用を予測する工程を含むことを特徴とするスクリーニング方法。

【請求項18】タンパク質ライブラリーの中から、特定の化合物に結合するタンパク質をスクリーニングするスクリーニング方法であって、前記タンパク質ライブラリーに含まれる各タンパク質に対して請求項16に記載の予測方法を行なって、前記化合物と当該タンパク質の相互作用を予測する工程を含むことを特徴とするスクリーニング方法。

【請求項19】第1の相互作用をする第1のタンパク質と化合物のペア及び第2の相互作用をする第2のタンパク質と化合物のペアに対して、第1のペアが属するクラス及び第2のペアが属するクラスを識別するパターン認識器の構成方法であって、各化合物について得られたマススペクトルデータの少なくとも1つの因子をベクトル化し、それぞれベクトルa1~ax(xは1以上の整数)とする工程と、各化合物に由来して作成された前記ベクトルa1~axを用いて、サポートベクターマシン(SVM)を適用して学習させることを特徴とするパターン認識器構成方法。
  • Applicant
  • ※All designated countries except for US in the data before July 2012
  • Keio University
  • Inventor
  • Sakakibara, Yasubumi
  • Nagamine, Nobuyoshi
IPC(International Patent Classification)
Specified countries AE AG AL AM AT AU AZ BA BB BE BF BG BH BJ BR BW BY BZ CA CF CG CH CI CM CN CO CR CU CY CZ DE DK DM DO DZ EC EE EG ES FI FR GA GB GD GE GH GM GN GQ GR GT GW HN HR HU ID IE IL IN IS IT JP KE KG KM KN KP KR KZ LA LC LK LR LS LT LU LV LY MA MC MD ME MG MK ML MN MR MT MW MX MY MZ NA NE NG NI NL NO NZ OM PG PH PL PT RO RS RU SC SD SE SG SI SK SL SM SN SV SY SZ TD TG TJ TM TN TR TT TZ UA UG US UZ VC VN ZA ZM ZW
Please contact us by E-mail or facsimile if you have any interests on this patent.

PAGE TOP

close
close
close
close
close
close