AUTOMATED ESTIMATION METHOD OF INTRACELLULAR INTERMOLECULAR NETWORK BASED ON COMPREHENSIVE MULTI-LAYERED DATA
外国特許コード | F140008047 |
---|---|
整理番号 | S2013-0197-C0 |
掲載日 | 2014年12月4日 |
出願国 | 世界知的所有権機関(WIPO) |
国際出願番号 | 2013JP080103 |
国際公開番号 | WO 2014080767 |
国際出願日 | 平成25年11月7日(2013.11.7) |
国際公開日 | 平成26年5月30日(2014.5.30) |
優先権データ |
|
発明の名称 (英語) | AUTOMATED ESTIMATION METHOD OF INTRACELLULAR INTERMOLECULAR NETWORK BASED ON COMPREHENSIVE MULTI-LAYERED DATA |
発明の概要(英語) | [Problem] To provide a technique for identifying, in a data driven manner, regulatory pathways over multiple layers on the basis of comprehensive data of metabolomes, phosphoproteomes and transcriptomes. [Solution] The intermolecular network estimation according to the present invention comprises: inputting metabolomic data as first input data; identifying a metabolite that shows a significant concentration change in the metabolomic data; assuming that a change in enzymatic activity causing the concentration change is induced by modification such as phosphorylation; and thus tracing back a causal relationship. Then, the estimation results of a metabolism controlling network, which mediates signaling from a stimulus, via a responsible modified enzyme and a boundary enzyme, to the metabolite, are output. |
|
|
|
|
国際特許分類(IPC) |
|
指定国 |
National States: AE AG AL AM AO AT AU AZ BA BB BG BH BN BR BW BY BZ CA CH CL CN CO CR CU CZ DE DK DM DO DZ EC EE EG ES FI GB GD GE GH GM GT HN HR HU ID IL IN IR IS KE KG KN KP KR KZ LA LC LK LR LS LT LU LY MA MD ME MG MK MN MW MX MY MZ NA NG NI NO NZ OM PA PE PG PH PL PT QA RO RS RU RW SA SC SD SE SG SK SL SM ST SV SY TH TJ TM TN TR TT TZ UA UG US UZ VC VN ZA ZM ZW ARIPO: BW GH GM KE LR LS MW MZ NA RW SD SL SZ TZ UG ZM ZW EAPO: AM AZ BY KG KZ RU TJ TM EPO: AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR OAPI: BF BJ CF CG CI CM GA GN GQ GW KM ML MR NE SN TD TG |
日本語項目の表示
発明の名称 | 多階層網羅的データに基づく細胞内分子間ネットワーク自動推定方法 |
---|---|
発明の概要 | 【課題】 メタボロームやリン酸化プロテオーム、トランスクリプトームといった網羅的データから多階層にまたがる調節経路をデータドプリンに同定する技術を提供する。 【解決手段】 本発明の分子間ネットワーク推定においては、メタボロームデータを最初の入力データとし、そのメタボロームデータ中から濃度変化が有意な代謝物質を同定し、その濃度変化を起こす酵素活性の変化をリン酸化等の修飾が引き起こしていると仮定し、因果関係を遡るものである。そして刺激から責任修飾酵素、境界酵素、代謝物質に至るまでのシグナル伝達を介する代謝制御ネットワークの推定結果を出力する。 |
特許請求の範囲 |
[請求項1] コンピュータによる分子間ネットワークの自動推定方法であって、 細胞又はその集合体(以下、総称して細胞と呼ぶ)に対する任意の刺激に対して、初期状態及び時系列の代謝データであるメタボロームデータをコンピュータに入力するメタボロームデータ入力ステップ、 着目代謝物質同定手段が、該メタボロームデータ中から濃度変化が有意な代謝物質を同定する着目代謝物質同定ステップ、 境界酵素抽出手段が、予め備えた代謝経路データベースを参照し、該着目代謝物質を基質又は産物のいずれかとする酵素を検索することにより、上記濃度変化に関与する酵素である境界酵素を抽出する境界酵素抽出ステップ、 該境界酵素について、酵素活性を変動させる可能性のある所定の修飾の強度の測定結果をコンピュータに入力する修飾強度値入力ステップ、 修飾強度変動境界酵素同定手段が、該境界酵素に係る修飾強度値変動の測定結果を解析し、修飾強度値が変動した修飾強度変動境界酵素を同定する修飾強度変動境界酵素同定ステップ、 責任修飾酵素同定手段が、該修飾強度変動境界酵素について、当該境界酵素の修飾強度値変動に寄与した責任修飾酵素を同定する責任修飾酵素同定ステップ、 ネットワーク推定結果出力手段が、刺激から責任修飾酵素、境界酵素、代謝物質に至るまでのシグナル伝達を介する代謝制御ネットワークの推定結果を出力するネットワーク推定結果出力ステップ を有することを特徴とする分子間ネットワークの自動推定方法。 [請求項2] 前記責任修飾酵素同定ステップにおいて、前記責任修飾酵素同定手段が、 前記修飾強度変動境界酵素について、当該境界酵素が任意の修飾酵素によって修飾される確率を導出し、その確率に応じて特定される修飾酵素を、境界酵素を修飾するのに寄与した責任修飾酵素と同定する 請求項1に記載の分子間ネットワークの自動推定方法。 [請求項3] 前記責任修飾酵素同定ステップにおいて、 任意の修飾酵素毎に、アミノ酸配列を入力すると、その配列が特定の修飾酵素に修飾される確率を出力する確率モデルを用い、 前記境界酵素の修飾部位近辺のアミノ酸配列を、該確率モデルに入力することにより、各修飾酵素について、該アミノ酸配列の責任修飾酵素である確率を得る 請求項2に記載の分子間ネットワークの自動推定方法。 [請求項4] 前記着目代謝物質同定ステップにおいて、前記着目代謝物質同定手段が、 前記メタボロームデータ中からコントロール時系列のデータにおける標準偏差内のグラフの範囲と、該コントロール時系列と異なる刺激条件下で測定した時系列グラフの範囲とを比較し、後者のグラフ範囲が大となる所定の条件を満たす時に、前記濃度変化が有意な代謝物質と同定する 請求項1ないし3のいずれかに記載の分子間ネットワークの自動推定方法。 [請求項5] 前記分子間ネットワークの自動推定方法のネットワーク推定結果出力ステップにおいて、 前記ネットワーク推定結果出力手段が、予め備える酵素データベースを参照し、前記代謝物質から前記境界酵素へのフィードバック制御経路を同定する 請求項1ないし4のいずれかに記載の分子間ネットワークの自動推定方法。 [請求項6] 前記所定の修飾がリン酸化による修飾であって、前記修飾強度値変動の測定結果がリン酸化プロテオームの解析によって得られる 請求項1ないし5のいずれかに記載の分子間ネットワークの自動推定方法。 [請求項7] コンピュータを用いた分子間ネットワークの自動推定装置であって、 細胞又はその集合体(以下、総称して細胞と呼ぶ)に対する任意の刺激に対して、初期状態及び時系列の代謝データであるメタボロームデータの入力を受理するメタボロームデータ受理手段と、 該メタボロームデータ中から濃度変化が有意な代謝物質を同定する着目代謝物質同定手段と、 予め備えた代謝経路データベースを参照し、該着目代謝物質を基質又は産物のいずれかとする酵素を検索することにより、上記濃度変化に関与する酵素である境界酵素を抽出する境界酵素抽出手段と、 該境界酵素について、酵素活性を変動させる可能性のある所定の修飾の強度の測定結果の入力を受理する修飾強度値受理手段と、 該境界酵素に係る修飾強度値変動の測定結果を解析し、修飾強度値が変動した修飾強度変動境界酵素を同定する修飾強度変動境界酵素同定手段と、 該修飾強度変動境界酵素について、当該境界酵素の修飾強度値変動に寄与した責任修飾酵素を同定する責任修飾酵素同定手段と、 刺激から責任修飾酵素、境界酵素、代謝物質に至るまでのシグナル伝達を介する代謝制御ネットワークの推定結果を出力するネットワーク推定結果出力手段と を備えたことを特徴とする分子間ネットワークの自動推定装置。 [請求項8] 前記責任修飾酵素同定手段が、 前記修飾強度変動境界酵素について、当該境界酵素が任意の修飾酵素によって修飾される確率を導出し、その確率に応じて特定される修飾酵素を、境界酵素を修飾するのに寄与した責任修飾酵素と同定する 請求項7に記載の分子間ネットワークの自動推定装置。 [請求項9] 前記責任修飾酵素同定手段が、 任意の修飾酵素毎に、アミノ酸配列を入力すると、その配列が特定の修飾酵素に修飾される確率を出力する確率モデルを用い、 前記境界酵素の修飾部位近辺のアミノ酸配列を、該確率モデルに入力することにより、各修飾酵素について、該アミノ酸配列の責任修飾酵素である確率を得る 請求項8に記載の分子間ネットワークの自動推定装置。 [請求項10] 前記着目代謝物質同定手段が、 前記メタボロームデータ中からコントロール時系列のデータにおける標準偏差内のグラフの範囲と、該コントロール時系列と異なる刺激条件下で測定した時系列グラフの範囲とを比較し、後者のグラフ範囲が大となる所定の条件を満たす時に、前記濃度変化が有意な代謝物質と同定する 請求項7ないし9のいずれかに記載の分子間ネットワークの自動推定装置。 [請求項11] 前記ネットワーク推定結果出力手段が、予め備える酵素データベースを参照し、前記代謝物質から前記境界酵素へのフィードバック制御経路を同定する 請求項7ないし10のいずれかに記載の分子間ネットワークの自動推定装置。 [請求項12] 前記所定の修飾がリン酸化による修飾であって、前記修飾強度値変動の測定結果がリン酸化プロテオームの解析によって得られる 請求項7ないし11のいずれかに記載の分子間ネットワークの自動推定装置。 |
明細書 |
明 細 書 発明の名称 : 多階層網羅的データに基づく細胞内分子間ネットワーク自動推定方法 技術分野 [0001] 本発明は、細胞内分子間ネットワークの網羅的推定方法に関する。 背景技術 [0002] 生命システムが示す様々な表現型は、代謝物、タンパク質、mRNAなどの多階層にまたがる分子ネットワークによって調節されている。インスリンによる代謝制御はその好例で、シグナル伝達系が代謝酵素のリン酸化や転写制御を介して糖代謝を調節することが知られている。 [0003] こうした多階層にわたる調節メカニズムを解明するため、従来の生物学では一部の分子の周囲のみを多階層にわたって解析する研究や、一つの階層のみを網羅的に解析する研究を行ってきた。 しかし、これらの従来型アプローチは研究者の主観によって解析対象にバイアスがかかるため、鍵となる経路や分子を取り逃す可能性が否めない。 [0004] 関連する従来の技術として、特許文献1に記載の支援装置では、代謝物や代謝酵素の測定値データについて、専門家による分析検討を支援する方法として、支援装置の座標取得部が代謝パスウェイマップ上における代謝物、代謝酵素の位置座標を取得し、関連性強度算出部が測定値データ格納部に格納された代謝物等の測定値データから、各々の代謝パスウェイの関連性強度を算出する。さらに、表示内容決定部が選択入力受付部で受け付けた代謝パスウェイの選択入力等に基づき、代謝パスウェイマップ上において、座標取得部が取得した座標の位置に存在する代謝物等の測定値の増減が識別可能であるように表示内容を決定し、表示装置に表示する技術を開示している。 [0005] 特許文献1に関連して、三井情報株式会社製代謝経路解析システム「CrossPath」(非特許文献1参照)では、膨大なメタボロミクスデータの中から変動している代謝経路(パスウェイ)を自動的に抽出し、各代謝物の変動量をパスウェイ上に視覚的にマッピングする。本システムには4つのモジュールが含まれ、それらは(1)代謝物の測定データを読み込み、代謝物の変動量、変動確率を計算し代謝パスウェイのエントロピーを計算する代謝物変動解析モジュール、(2)解析時に参照する代謝パスウェイデータベース、(3)抽出した代謝パスウェイ上に、代謝物の変動量をグラフィカルにマッピングするパスウェイ表示インターフェース、(4)蓄積された解析結果から、現在の解析結果と似た解析結果を検索する代謝物変動同定モジュールである。 [0006] 特許文献2には、生体に及ぼす作用を定量的に統合的に記述してプロファイリングすることにより、標的分子を推定し、薬効プロファイルを推定し、副作用や毒性を予測し、化合物を選別することが提案されている。本方法では、任意の対象化合物を生物材料又は動物に投与し、生物学的機能既知や、未知の1又は2以上の観測分子に与える量的変動、時間的変動を測定して解析することにより、該対象化合物の標的分子が関わる生物学的機能や疾患を推定している。 [0007] 特許文献3には、多様な生体応答や現象を生体分子の機能とその分子間の関わりにおいて理解するための仕組みと方法を提供する技術が提案されている。 本技術では、2以上の生体分子間のつながりを示す情報からなる第1の分子ネットワークに含まれる生体分子の中からユーザが指定した生体分子を起点とし、設定された数の連続的な分子のつながりを示す情報を生成するための生体分子対の情報を、生体分子対の情報を含むデータベースを用いて検索し、生体分子対情報の検索によって得られた生体分子対情報に基づいて、ユーザが指定した生体分子を起点とした連続的な分子のつながりを示す情報と第1の分子ネットワークとを含む第2の分子ネットワークを生成・表示し、生体イベントと、該生体イベントの引き金となる生体分子等を関係付けた生体イベント情報を用いて、第2の分子ネットワークに含まれる生体分子等に関係付けられた生体イベント情報を検索・表示している。 先行技術文献 特許文献 [0008] 特許文献1 : 国際公開WO/2011/055820 特許文献2 : 特開2003-325076号公報 特許文献3 : 特開2010-92492号公報 非特許文献 [0009] 非特許文献1 : 三井情報株式会社ニュースリリース 2011年6月30日(インターネットURL: http://prtimes.jp/data/corp/1519/c8dc2226b64358f97ce9277984f1204b.pdf) 発明の概要 発明が解決しようとする課題 [0010] 本発明は、従来技術における問題点に鑑みて創出したものであり、メタボロームやリン酸化プロテオーム、トランスクリプトームといった網羅的データから多階層にまたがる調節経路をデータドプリンに同定することを課題とする。 課題を解決するための手段 [0011] 本発明は上記課題を解決するために次の手段を用いる。 すなわち、請求項1に記載の発明は、コンピュータによる分子間ネットワークの自動推定方法であって、次の各ステップを有する。 (S1)細胞又はその集合体(以下、総称して細胞と呼ぶ)に対する任意の刺激に対して、初期状態及び時系列の代謝データであるメタボロームデータをコンピュータに入力するメタボロームデータ入力ステップ、 (S2)着目代謝物質同定手段が、メタボロームデータ中から濃度変化が有意な代謝物質を同定する着目代謝物質同定ステップ、 (S3)境界酵素抽出手段が、予め備えた代謝経路データベースを参照し、着目代謝物質を基質又は産物のいずれかとする酵素を検索することにより、上記濃度変化に関与する酵素である境界酵素を抽出する境界酵素抽出ステップ、 (S4)境界酵素について、酵素活性を変動させる可能性のある所定の修飾の強度の測定結果をコンピュータに入力する修飾強度入力ステップ、 (S5)修飾強度変動境界酵素同定手段が、境界酵素に係る修飾強度変動の測定結果を解析し、修飾強度が変動した修飾強度変動境界酵素を同定する修飾強度変動境界酵素同定ステップ、 (S6)責任修飾酵素同定手段が、修飾強度変動境界酵素について、当該境界酵素の修飾強度変動に寄与した責任修飾酵素を同定する責任修飾酵素同定ステップ、 (S7)ネットワーク推定結果出力手段が、刺激から責任修飾酵素、境界酵素、代謝物質に至るまでのシグナル伝達を介する代謝制御ネットワークの推定結果を出力するネットワーク推定結果出力ステップ を有することを特徴とする分子間ネットワークの自動推定方法を提供する。 [0012] 請求項2に記載の発明は、上記の責任修飾酵素同定ステップにおいて、責任修飾酵素同定手段が、修飾強度変動境界酵素について、当該境界酵素が任意の修飾酵素によって修飾される確率を導出し、その確率に応じて特定される修飾酵素を、境界酵素を修飾するのに寄与した責任修飾酵素と同定することを特徴とする。 [0013] 請求項3に記載の発明は、上記の責任修飾酵素同定ステップにおいて、任意の修飾酵素毎に、アミノ酸配列を入力すると、その配列が特定の修飾酵素に修飾される確率を出力する確率モデルを用い、境界酵素の修飾部位近辺のアミノ酸配列を、確率モデルに入力することにより、各修飾酵素について、アミノ酸配列の責任修飾酵素である確率を得ることを特徴とする。 [0014] 請求項4に記載の発明は、上記の着目代謝物質同定ステップにおいて、着目代謝物質同定手段が、メタボロームデータ中からコントロール時系列のデータにおける標準偏差内のグラフの範囲と、コントロール時系列と異なる刺激条件下で測定した時系列グラフの範囲とを比較し、後者のグラフ範囲が大となる所定の条件を満たす時に、上記の濃度変化が有意な代謝物質と同定することを特徴とする。 [0015] 請求項5に記載の発明は、上記の分子間ネットワークの自動推定方法のネットワーク推定結果出力ステップにおいて、上記のネットワーク推定結果出力手段が、予め備える酵素データベースを参照し、上記の代謝物質から上記の境界酵素へのフィードバック制御経路を同定することを特徴とする。 [0016] 請求項6に記載の発明は、上記所定の修飾がリン酸化による修飾であって、前記修飾強度値変動の測定結果がリン酸化プロテオームの解析によって得られることを特徴とする。 なお、本発明にかかるタンパク質の修飾は、リン酸化によるものに限らず、アセチル化、メチル化、ユビキチン化など他の修飾の強度の変動に着目することもできる。 [0017] 請求項7に記載の発明は、コンピュータを用いた分子間ネットワークの自動推定装置であって、細胞又はその集合体(以下、総称して細胞と呼ぶ)に対する任意の刺激に対して、初期状態及び時系列の代謝データであるメタボロームデータの入力を受理するメタボロームデータ受理手段と、メタボロームデータ中から濃度変化が有意な代謝物質を同定する着目代謝物質同定手段と、予め備えた代謝経路データベースを参照し、着目代謝物質を基質又は産物のいずれかとする酵素を検索することにより、上記濃度変化に関与する酵素である境界酵素を抽出する境界酵素抽出手段と、境界酵素について、酵素活性を変動させる可能性のある所定の修飾の強度の変動の測定結果の入力を受理する修飾強度値受理手段と、境界酵素に係る修飾強度値変動の測定結果を解析し、修飾強度値が変動した修飾強度変動境界酵素を同定する修飾強度変動境界酵素同定手段と、修飾強度変動境界酵素について、当該境界酵素の修飾強度値変動に寄与した責任修飾酵素を同定する責任修飾酵素同定手段と、刺激から責任修飾酵素、境界酵素、代謝物質に至るまでのシグナル伝達を介する代謝制御ネットワークの推定結果を出力するネットワーク推定結果出力手段とを備えたことを特徴とする。 [0018] 請求項8に記載の発明は、上記の責任修飾酵素同定手段が、修飾強度変動境界酵素について、当該境界酵素が任意の修飾酵素によって修飾される確率を導出し、その確率に応じて特定される修飾酵素を、境界酵素を修飾するのに寄与した責任修飾酵素と同定することを特徴とする。 [0019] 請求項9に記載の発明は、上記の責任修飾酵素同定手段が、任意の修飾酵素毎に、アミノ酸配列を入力すると、その配列が特定の修飾酵素にリン酸化される確率を出力する確率モデルを用い、上記の境界酵素のリン酸化部位近辺のアミノ酸配列を、確率モデルに入力することにより、各修飾酵素について、アミノ酸配列の責任修飾酵素である確率を得ることを特徴とする。 [0020] 請求項10に記載の発明は、上記の着目代謝物質同定手段が、上記のメタボロームデータ中からコントロール時系列のデータにおける標準偏差内のグラフの範囲と、コントロール時系列と異なる刺激条件下で測定した時系列グラフの範囲とを比較し、後者のグラフ範囲が大となる所定の条件を満たす時に、上記の濃度変化が有意な代謝物質と同定することを特徴とする。 [0021] 請求項11に記載の発明は、上記のネットワーク推定結果出力手段が、予め備える酵素データベースを参照し、上記の代謝物質から上記の境界酵素へのフィードバック制御経路を同定することを特徴とする。 [0022] 請求項12に記載の発明は、前記所定の修飾がリン酸化による修飾であって、前記修飾強度値変動の測定結果がリン酸化プロテオームの解析によって得られることを特徴とする。 発明の効果 [0023] 本発明は、以上の構成を備えることにより、メタボロームやリン酸化プロテオーム、トランスクリプトームといった網羅的データから多階層にまたがる調節経路をデータドプリンに同定することができる。 特に、トランスクリプトーム、プロテオーム、メタボロームといった各種オミクス階層間にまたがる、これまで手つかずの大規模ネットワークを網羅的に推定できる。また、従来の生物学のように、一部の分子の周囲のみを注目したり、一つのオミクス階層に特化したりといった研究者の主観による偏りがないため、鍵となる経路や分子を取り逃す可能性を大幅に低下させることができる。 図面の簡単な説明 [0024] [図1] 本発明に係る階層間調節ネットワークの自動推定方法の模式図である。 [図2] 本発明に係る分子間ネットワークの推定装置の構成図である。 [図3] 本発明に係る分子間ネットワークの推定方法のフローチャートである。 [図4] 本発明におけるメタボロームデータの一例である。 [図5] 本実施例に係るインスリン刺激によって変動する物質の同定手法の説明図である。 [図6] 本発明に係る着目代謝物質同定ステップにおける計算結果の一例である。 [図7] 本発明による分子間ネットワークの自動推定方法のネットワーク推定結果である。 発明を実施するための形態 [0025] 以下、本発明の実施形態を、図面に示す実施例を基に説明する。なお、実施形態は下記に限定されるものではない。 本発明において分子間ネットワーク推定をするにあたり、スタート地点とするのはメタボロームデータである。本発明を大約すれば、メタボロームデータ中から濃度変化が有意な代謝物質を同定し、その濃度変化を起こす酵素活性の変化をリン酸化が引き起こしていると仮定し、因果関係を遡るものである。 [0026] 図1には、本発明に係る階層間調節ネットワークの自動推定方法の模式図を示す。図示するように本実施例における刺激としては細胞にインスリン刺激を行った場合を一例としてあげる。しかし、本発明の適用において、インスリンに限定されないことはもちろんであり、広くシグナル伝達を介する代謝制御ネットワークの同定に応用することができる。 また、細胞に対する刺激に限定されず、細胞、組織、生物個体などあらゆる細胞の集合体を対象とすることができる。 [0027] 図1において、まず濃度が有意に変動した代謝物質をメタボロームデータから同定する(1)(図中の丸数字に対応)。図に示されるように、濃度が増加する代謝物質と、減少する代謝物質とがある。 そして、濃度変動に関与する酵素を代謝経路図から推定する(2)。本実施例における代謝経路図としてはKEGGデータベース(インターネットURL:http://www.genome.jp/kegg/ 参照)を使用する。 [0028] 推定された酵素のうち、リン酸化レベルが有意に変動するものを同定する。さらに、リン酸化の責任キナーゼを推定する(3)。責任キナーゼの推定には、推定できる責任キナーゼの種類の豊富さと実験データの裏付けを考慮してNetPhorest(インターネットURL:http://netphorest.info 参照)を用いている。 (3)で推定した責任キナーゼからシグナル伝達経路(KEGGデータベースに所収)を遡上し、インスリンに至るまでの経路を推定する(4)。 [0029] さらに本発明では、代謝物質から酵素へのフィードバック制御経路を同定することもできる。例えば酵素データベースBRENDA(インターネットURL:http://www.brenda-enzymes.info 参照)を参照して、Activatorとinhibitorの情報を抽出してフィードバック経路推定を行う。 [0030] 以上のような分子間ネットワークの推定を行うために、図2に示すような推定装置(1)を用いる。また、推定装置(1)におけるデータの処理のフローチャートを図3に示す。 本発明に係る推定装置(1)は、公知のコンピュータによって構成される。このようなコンピュータの構成は周知であるから説明を省略する。 [0031] 推定装置(1)は、CPU(10)と、コンピュータ内に入力されるデータを受理するための入力受理部(11)、本発明で用いるデータベースや処理途上のデータを格納するための記憶手段(20)~(22)を備えている。必要に応じて、外部ネットワークと接続するためのネットワークアダプタ(12)を付設してもよい。 入力受理部(11)としては、データをユーザが入力するキー入力装置や、マウス、タブレット、タッチパネルの他、ネットワークアダプタにより外部ネットワークからのデータを受理する構成でもよい。 以上の他に、結果を出力するための表示モニタ(図示しない)や、結果を書き出すための記憶手段を備えてもよい。 [0032] CPU(10)は、図示しないコンピュータプログラムによって機能を実現する各処理部、すなわち着目代謝物質同定処理部(100)、境界酵素抽出処理部(101)、リン酸化境界酵素同定処理部(102)、責任キナーゼ同定処理部(103)、出力処理部(103)を含んでいる。 本実施例では、推定装置(1)内、又は外部装置に、責任キナーゼ同定処理部(103)で用いる責任キナーゼ確率算出処理部(30)を備えている。 [0033] 本発明における各ステップを次に説明する。 (メタボロームデータ取得ステップ)(S10) まず細胞に対する任意の刺激に対して、初期状態及び時系列の代謝データであるメタボロームデータを取得する。本実施例では細胞にインスリン刺激をした場合のクエン酸回路(TCA cycle)の濃度時系列データで説明する。図4は、この濃度時系列データを示している。 [0034] 本時系列データは、インスリン100nM(点線)、1nM(一点鎖線)、0.01nM(実線)の3種類の用量条件において、0分から60分までの各代謝物の濃度時系列を示している。0.01nMの用量をコントロールとし、図から、クエン酸(41)、cis-アコニット酸(42)、イソクエン酸(42)がインスリン刺激によって濃度が増加した代謝物と分かる。 反対に(S)-リンゴ酸(43)、フマル酸(44)は、濃度が減少した代謝物である。コハク酸(45)については有意な変化は認められない。 [0035] (メタボロームデータ入力ステップ)(S11) このようなメタボロームデータは膨大なデータであるから、図示しない記憶手段等に格納されたデータを入力受理部(11)によってCPU(10)に読み込み、代謝データ(20)として保存する。以下の処理では代謝データ(20)から順次読み出すことによってメタボロームデータを使用する。 [0036] (着目代謝物質同定ステップ)(S12) 入力されたメタボロームデータについて、濃度が有意に増加したか、減少したか、変化無しかをコンピュータにより判断し、以下のステップで着目する代謝物質を同定するため着目代謝物質同定処理部(100)では次の処理を行う。 図5は、インスリン刺激によって変動する物質の同定手法の説明図である。 [0037] 左側のグラフにおいて、3種類のインスリン用量条件下で測定した3本の時系列グラフによって囲まれる面積をS1とする。また右側のグラフにおいて、コントロール(insulin用量=0.01nM)の時系列グラフの上下に標準偏差の幅をとり、その面積をS0とする。本実施例では標準偏差を時刻0でのみ測定しているが、標準偏差の取り方は任意である。 [0038] 標準偏差σをとると、範囲S0はランダムな変動の大きさに相当する。そしてS1/S0の値を計算し、これが1を上回っていた場合には、その物質は有意に変動したと判定する。1を下回ったら変動なしとする。 増加・減少は、インスリン刺激した際の時系列がコントロール時系列の上側すなわち、増加分(51)・下側すなわち減少分(50)にある面積のどちらが大きいかで判定する。 [0039] 本発明による上記の判定手法によって計算した結果を一例として図6に示す。図6(a)はコハク酸の計算結果であり、S1/S0=0.57となった。図6(b)はクエン酸のグラフで、S1/S0=5.78となった。図6(c)はホスホエノールピルビン酸のグラフで、S1/S0=1.09となった。図6(d)はL-アラニンのグラフで、S1/S0=47.8となった。 視覚的に判断した結果と比較しても、S1/S0について1を判定の境界とする上記手法は、有意な濃度変化があったかどうかの判定方法として有効であることが分かる。 [0040] 以上の計算処理はコンピュータによって自動化可能であり、ここで用いた判定条件は適宜変更することができる。 メタボロームデータ入力ステップで入力されたデータが大量であるため、本発明はこのように独自の自動化手法を用いて濃度が変動した代謝物質を見つけている。これにより、最初の段階から網羅的な処理に寄与している。 [0041] (境界酵素抽出ステップ)(S13) 次に、境界酵素抽出処理部(101)が、予め備えた代謝経路データベースを参照し、着目代謝物質を基質又は産物のいずれかとする酵素を検索することにより、上記濃度変化に関与する酵素である境界酵素を抽出する。 ここで、上記の代謝物の変動は、合成と分解のバランスの変化によるものであり、その合成とバランスの変化はそれぞれを担う代謝酵素の活性の変化による。本発明では、このような酵素を境界酵素と定義している。言い換えれば、ある代謝物を変動させるのはXを基質又は産物とする境界酵素と考える。 [0042] 上述したKEGGデータベースには糖質代謝、脂質代謝、アミノ酸代謝等に分類される代謝経路データベースが含まれており、本発明はこれを例とする予め用意された代謝経路データベース(21)を用いる。図示するように代謝経路データベース(21)は推定装置(1)に格納して利用してもよいし、ネットワークアダプタ(12)を介して、外部に格納されたデータにアクセスして利用してもよい。 [0043] KEGGでは、API(アプリケーションプログラミングインタフェース)が提供されている(インターネットURL:http://www.genome.jp/kegg/soap/ 参照)ので、本実施例の境界酵素抽出処理部(101)ではこのAPIを利用して、KEGGのデータベースから境界酵素を抽出する。抽出作業は、KEGGの全データを対象として行い、着目代謝物質を基質又は産物とする酵素(境界酵素)をすべて抽出する。 [0044] (リン酸化プロテオーム測定ステップ)(S14) ところで、本実施例におけるインスリンにより代謝物が変動するのはリン酸化を介したネットワークによると考えられる。1次的には、これらのシグナル経路を介して、境界酵素をリン酸化することによりその酵素活性を変動させて代謝物質を制御している可能性が高い。つまり、リン酸化された境界酵素はインスリンによる代謝調節の作用点の候補である。 [0045] 本発明はこの点に着目し、リン酸化プロテオーム解析を行う。リン酸化プロテオーム解析は公知の手法を用いることができるが、現在のプロテオーム解析における基盤的技術として、二次元電気泳動と液体クロマトグラフィー・タンデム質量分析 (LC-MS/MS)の2種類の方法がある。これらの解析手法により、リン酸化の検出のみならず、後述するキナーゼ基質の同定や、リン酸化部位の同定なども高感度に行えるようになってきている。 [0046] 入力受理部(11)が実測されたリン酸化プロテオームデータをCPU(10)に入力し、リン酸化プロテオームデータ(22)として格納する。 [0047] (リン酸化境界酵素同定ステップ)(S15) 次に、リン酸化境界酵素同定処理部(102)が、境界酵素のリン酸化プロテオームの測定結果(22)を解析し、リン酸化レベルが変動したリン酸化境界酵素を同定する。すなわち、境界酵素と、リン酸化プロテオームデータ(22)とを対照し、リン酸化レベルが変動したものを同定する。 具体的には、リン酸化レベルの有意な変動を判定する際には、時刻0分、2分時点と比較して1.5倍以上のリン酸化レベル上昇もしくは2/3倍以下のリン酸化レベル低下を示すことを本実施例では基準としている。この閾値に関しては、もちろん任意に変更可能である。 本処理によりリン酸化を示した代謝酵素(リン酸化境界酵素)に絞り込みを行った。 [0048] (責任キナーゼ同定ステップ)(S16) 責任キナーゼ同定処理部(103)は、リン酸化境界酵素について、当該境界酵素をリン酸化するのに寄与した責任キナーゼを同定する。 本発明では、責任キナーゼの同定方法にも特徴を有する。すなわち、上記で絞り込まれたリン酸化境界酵素について、当該境界酵素が任意のキナーゼによってリン酸化される確率を導出し、その確率に応じて特定されるキナーゼを、境界酵素をリン酸化するのに寄与した責任キナーゼと同定する。例えば、確率の高い方から所定数のキナーゼにより責任キナーゼを同定することができる。 [0049] このリン酸化される確率は、任意のキナーゼ毎に、アミノ酸配列を入力すると、その配列が特定のキナーゼにリン酸化される確率を出力する確率モデル(31)を用いることで導出している。 具体的には、上述したNetPhorestを用いる。NetPhorestはその内部に、タンパク質キナーゼと基質アミノ酸配列の組み合わせの確からしさを評価する確率モデルを保持している。 この確率モデルにリン酸化部位近辺のアミノ酸配列を入力すると、179 種類のタンパク質キナーゼについて、当該アミノ酸配列の責任キナーゼである確率を出力する。 [0050] NetPhorestについては公知であるから簡単に説明を加えると、NetPhorestの確率モデルは実験データに基づいて構築されている。ニューラルネットワークおよび位置特異的スコア行列に、 ・タンパク質キナーゼのターゲット部位のデータ (in vivo) ・ペプチドライブラリに対するタンパク質キナーゼの特異性データ (in vitro) の2つのデータを正例として与えて学習させたものである。この学習により、「アミノ酸配列を入力すると、その配列が特定のキナーゼにリン酸化される確率を出力する確率モデル」が各キナーゼごとに構築されている。 [0051] 本実施例では、境界酵素のリン酸化部位近辺のアミノ酸配列を、確率モデルを実現する責任キナーゼ確率算出処理部(30)に入力することにより、各キナーゼについて、アミノ酸配列の責任キナーゼである確率を得、その第1位を責任キナーゼとして同定している。 [0052] 具体的には、まず全タンパク質について、責任キナーゼ一覧をつくる。ラットの全タンパク質をNetPhorestに入力し、全タンパク質の全リン酸化部位およびその責任キナーゼを推定する。 NetPhorestからは残基Rが任意のキナーゼK1, K2, …. Knにリン酸化される確率が出力されるので、これらのうち最大の確率値を持つキナーゼをRの責任キナーゼとする。 そして、リン酸化境界酵素同定ステップで得られたリン酸化境界酵素と全タンパク質の責任キナーゼ一覧とを照合し、境界酵素をリン酸化した責任キナーゼを同定する。 [0053] (ネットワーク推定結果出力ステップ)(S17) 最後に、出力処理部(104)が、刺激から責任キナーゼ、境界酵素、代謝物質に至るまでのシグナル伝達を介する代謝制御ネットワークの推定結果を出力する。 [0054] 本実施例では、細胞に対するインスリン刺激を例として検討したが、処理の過程において責任キナーゼは全部で25種類出てきた。これは、インスリンシグナリングから代謝酵素まで最大25個のリン酸化経路を介して制御していることを意味している。 責任キナーゼとして出てきたものには例えば代謝酵素ATP-クエン酸リアーゼについてAKTが認められた。 [0055] 責任キナーゼからインスリンまでの経路の多くは既知であり、KEGG Pathway Maps (http://www.genome.jp/kegg/kegg3a.html参照)でも同定できる。これと対比し、本発明によるネットワークの推定方法が十分に有効であることが検証できた。 一連の処理によりインスリンから責任キナーゼを介したシグナル経路による代謝酵素リン酸化までの経路が明らかになる。すなわち、「インスリン→シグナル伝達→責任キナーゼ→代謝酵素リン酸化→代謝物変動」の一連の調節パスウェイが明らかとなった。 図7には本発明による分子間ネットワークの自動推定方法のネットワーク推定結果の一例を示す。図示において、各階層は、上から順にシグナル伝達系(リン酸化プロテオーム)(70)、代謝酵素(リン酸化プロテオーム)(71)、代謝物質(メタボローム)(72)である。 [0056] 「インスリン→シグナル伝達→責任キナーゼ→代謝酵素リン酸化→代謝物変動」の一連の調節パスウェイを経て濃度が変動した代謝物の一部は、ActivatorまたはInhibitorとして代謝酵素に結合し、フィードバック調節を行う。分子間ネットワークの自動推定方法のネットワーク推定結果出力ステップ(S17)において、出力処理部(104)が、予め備える酵素データベースを参照し、前記代謝物質から前記境界酵素へのフィードバック制御経路を同定する。酵素データベースとしては、BRENDA(インターネットURL:http://www.brenda-enzymes.info 参照)を用い、これを参照して、Activatorとinhibitorの情報を抽出してフィードバック経路推定を行う。 [0057] 本発明は任意の細胞等に対する刺激からその分子間ネットワークを推定する方法に関するものであり、インスリン刺激に限らず、細胞外刺激によりシグナル伝達を介した代謝調節経路を網羅的に同定する初めての手法を提供することができた。 本発明は、図7に示すように、これまで把握することの出来なかった大規模ネットワークを網羅的に推定できる画期的な技術を提供するものである。 符号の説明 [0058] 20 代謝データ 21 代謝経路データベース 22 リン酸化プロテオーム 31 責任キナーゼ確率モデル S10 メタボロームデータ取得ステップ S11 メタボロームデータ入力ステップ S12 着目代謝物質同定ステップ S13 境界酵素抽出ステップ S14 リン酸化プロテオーム測定ステップ S15 リン酸化境界酵素同定ステップ S16 責任キナーゼ同定ステップ S17 ネットワーク推定結果出力ステップ |
『 AUTOMATED ESTIMATION METHOD OF INTRACELLULAR INTERMOLECULAR NETWORK BASED ON COMPREHENSIVE MULTI-LAYERED DATA 』に関するお問合せ
- 東京大学TLO
- URL: https://todaitlo.com/
-
E-mail:
- Address: 〒113-0033 東京都文京区本郷7-3-1産学連携プラザ
- TEL: 03-5805-7661
- FAX: 03-5805-7699