TOP > 国内特許検索 > 肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体 > 明細書

明細書 :肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体

発行国 日本国特許庁(JP)
公報種別 再公表特許(A1)
発行日 平成29年11月2日(2017.11.2)
発明の名称または考案の名称 肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体
国際特許分類 G01N  33/574       (2006.01)
G01N  33/68        (2006.01)
G01N  33/48        (2006.01)
FI G01N 33/574
G01N 33/68
G01N 33/48 Z
国際予備審査の請求 未請求
全頁数 26
出願番号 特願2016-572030 (P2016-572030)
国際出願番号 PCT/JP2016/052072
国際公開番号 WO2016/121715
国際出願日 平成28年1月26日(2016.1.26)
国際公開日 平成28年8月4日(2016.8.4)
優先権出願番号 2015012728
優先日 平成27年1月26日(2015.1.26)
優先権主張国 日本国(JP)
指定国 AP(BW , GH , GM , KE , LR , LS , MW , MZ , NA , RW , SD , SL , ST , SZ , TZ , UG , ZM , ZW) , EA(AM , AZ , BY , KG , KZ , RU , TJ , TM) , EP(AL , AT , BE , BG , CH , CY , CZ , DE , DK , EE , ES , FI , FR , GB , GR , HR , HU , IE , IS , IT , LT , LU , LV , MC , MK , MT , NL , NO , PL , PT , RO , RS , SE , SI , SK , SM , TR) , OA(BF , BJ , CF , CG , CI , CM , GA , GN , GQ , GW , KM , ML , MR , NE , SN , TD , TG) , AE , AG , AL , AM , AO , AT , AU , AZ , BA , BB , BG , BH , BN , BR , BW , BY , BZ , CA , CH , CL , CN , CO , CR , CU , CZ , DE , DK , DM , DO , DZ , EC , EE , EG , ES , FI , GB , GD , GE , GH , GM , GT , HN , HR , HU , ID , IL , IN , IR , IS , JP , KE , KG , KN , KP , KR , KZ , LA , LC , LK , LR , LS , LU , LY , MA , MD , ME , MG , MK , MN , MW , MX , MY , MZ , NA , NG , NI , NO , NZ , OM , PA , PE , PG , PH , PL , PT , QA , RO , RS , RU , RW , SA , SC , SD , SE , SG , SK , SL , SM , ST , SV , SY , TH , TJ , TM , TN , TR , TT , TZ , UA , UG , US
発明者または考案者 【氏名】高橋 隆
【氏名】柳澤 聖
【氏名】平川 晃弘
【氏名】中杤 昌弘
出願人 【識別番号】504139662
【氏名又は名称】国立大学法人名古屋大学
個別代理人の代理人 【識別番号】100167689、【弁理士】、【氏名又は名称】松本 征二
審査請求 未請求
テーマコード 2G045
Fターム 2G045AA26
2G045DA36
2G045FB08
2G045JA01
2G045JA03
要約 初期段階の肺がんであっても種類を問わず再発可能性を予測できる方法を提供する。肺がん患者の予後を予測するための情報を提供する方法であって、肺がん患者由来のサンプルにおいて、少なくとも、g1027(Accession No.sp|P12814|ACTN1_HUMAN)、g1237(Accession No.sp|P22392-2|NDKB_HUMAN)、g1463(Accession No.sp|P35221|CTNA1_HUMAN)及びg1821(Accession No.sp|P51690|ARSE_HUMAN)の4種類のタンパク質の発現量を測定する工程、を含む肺がん患者の予後を予測するための情報を提供する方法により、初期段階の肺がんであっても種類を問わず再発可能性を予測できる。
特許請求の範囲 【請求項1】
肺がん患者の予後を予測するための情報を提供する方法であって、
肺がん患者由来のサンプルにおいて、少なくとも、g1027(Accession No.sp|P12814|ACTN1_HUMAN)、g1237(Accession No.sp|P22392-2|NDKB_HUMAN)、g1463(Accession No.sp|P35221|CTNA1_HUMAN)及びg1821(Accession No.sp|P51690|ARSE_HUMAN)の4種類のタンパク質の発現量を測定する工程、
を含む肺がん患者の予後を予測するための情報を提供する方法。
【請求項2】
請求項1に記載の少なくとも4種類のタンパク質の発現量に基づいて、肺がん患者の再発可能性を予測する工程、
を含む肺がん患者の予後予測方法。
【請求項3】
前記肺がん患者の再発可能性を予測する工程が、
前記少なくとも4種類のタンパク質を含むタンパク質群を用いてPartial Cox regression解析に基づき構築した最終予後予測モデルに、請求項1に記載の少なくとも4種類のタンパク質の発現量を当てはめリスクスコアを算出する工程、
を含む請求項2に記載の肺がん患者の予後予測方法。
【請求項4】
請求項1に記載の少なくとも4種類のタンパク質を含むタンパク質群の発現量に基づき構築した最終予後予測モデル又は閾値を格納した記憶手段、
肺がん患者のサンプルに含まれる前記少なくとも4種類のタンパク質の発現量を、前記記憶手段に記憶された最終予後予測モデルに当てはめリスクスコアを算出、又は閾値と比較することで肺がん患者の再発可能性を予測する予測手段、
を含む肺がん患者の予後予測装置。
【請求項5】
前記最終予測モデルが、Partial Cox regression解析に基づき構築したモデルであることを特徴とする請求項4に記載の肺がん患者の予後予測装置。
【請求項6】
コンピュータを、請求項4又は5に記載の肺がん患者の予後予測装置として機能させるためのプログラム。
【請求項7】
請求項6に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項8】
請求項1に記載の少なくとも4種類のタンパク質と同じアミノ酸配列を有する合成タンパク質を含み、
前記合成タンパク質の各々が、同位体標識されたアミノ酸を含む内部標準。
【請求項9】
請求項1に記載の少なくとも4種類のタンパク質を検出するための抗体。
発明の詳細な説明 【技術分野】
【0001】
本発明は、肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体に関する。特に、肺がん患者由来のサンプル中の特定タンパク質の発現量を測定することで肺がん患者の手術後の再発可能性を予測し、肺がん患者に最適な術後治療を実施すための肺がん患者の予後予測方法、予後予測方法に用いられる肺がん患者の予後を評価するための情報を提供する方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体に関する。
【背景技術】
【0002】
日本を含む殆どの先進諸国において、癌による部位別死亡者数の中で、肺がんによる死亡は第1位を占めている。肺がんに対しては、様々な治療法の改良及び早期発見用の検査方法の改良が行われているが、日本においは毎年約70,000人の肺がん患者(以下、単に「患者」と記載することがある。)が死亡している。
【0003】
患者の手術後の主な死亡原因は転移による再発である。そのため、日本においては、画像診断や手術時の目視では発見しきれないがん細胞の転移を抑えるため、手術後にテガフール・ウラシル(UFT(登録商標))等の副作用が比較的少ない抗がん剤を約2年程度飲み続ける術後治療が行われている。この術後治療により、手術のみで経過観察を行う治療方法より、患者の再発を抑えることができる。しかしながら、統計的には、患者の約7割は手術により治癒するといわれている。そのため、約7割の患者は、本来は不要である抗がん剤治療を術後に受けることになり、体にダメージを与えるのみでなく、経済的にも大きな負担になっている。
【0004】
一方、残りの約3割については、手術ではがん細胞を取り切れずに、再発すると言われている。この約3割の患者に対しては、手術後に、UFTより更に強い抗がん剤治療を施すことが望ましい。しかしながら、現状では手術後は一律にUFT等の抗がん剤を投与している。したがって、手術後の患者毎に再発の可能性の有無を調べ、患者に最も適した術後治療を施すことが望ましい。
【0005】
また、欧米においては、比較的症状の軽いI期の場合は「経過観察」が主流である。しかしながら、I期の患者の中には進行性の患者も含まれている。そのため、進行性の患者に対しては、手術や抗がん剤投与等の適切な治療を早期に実施することが望ましいが、現状では、一律に経過観察が行われている。
【0006】
患者の手術後の予後を予測する方法としては、肺腺がん患者から採取した生体由来試料における、ミオシンIIA及び/又はビメンチン発現量を測定することで、予後を予測する方法が知られている(特許文献1参照)。
【先行技術文献】
【0007】

【特許文献1】特許第5147852号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1に記載されている方法は、肺がんの中でも肺腺がんに限定されており、他の肺がんである、扁平上皮、腺扁平上皮、大細胞等に応用できるのか明らかではないという問題がある。本発明は、上記従来の問題を解決するためになされた発明であり、鋭意研究を行ったところ、患者由来のサンプルにおいて、少なくとも、g1027(Accession No.sp|P12814|ACTN1_HUMAN)、g1237(Accession No.sp|P22392-2|NDKB_HUMAN)、g1463(Accession No.sp|P35221|CTNA1_HUMAN)及びg1821(Accession No.sp|P51690|ARSE_HUMAN)の4種類のタンパク質の発現量を測定し、当該発現量に基づき肺がん患者の再発可能性を予測することで、初期段階の肺がんであっても種類を問わず再発可能性を予測できることを新たに見出した。なお、本発明のAccession No.は、全てUniprotデータベースの番号である。
【0009】
すなわち、本発明の目的は、肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体を提供することである。
【課題を解決するための手段】
【0010】
本発明は、以下に示す、肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体に関する。
【0011】
(1)肺がん患者の予後を予測するための情報を提供する方法であって、
肺がん患者由来のサンプルにおいて、少なくとも、g1027(Accession No.sp|P12814|ACTN1_HUMAN)、g1237(Accession No.sp|P22392-2|NDKB_HUMAN)、g1463(Accession No.sp|P35221|CTNA1_HUMAN)及びg1821(Accession No.sp|P51690|ARSE_HUMAN)の4種類のタンパク質の発現量を測定する工程、
を含む肺がん患者の予後を予測するための情報を提供する方法。
(2)上記(1)に記載の少なくとも4種類のタンパク質の発現量に基づいて、肺がん患者の再発可能性を予測する工程、
を含む肺がん患者の予後予測方法。
(3)前記肺がん患者の再発可能性を予測する工程が、
前記少なくとも4種類のタンパク質を含むタンパク質群を用いてPartial Cox regression解析に基づき構築した最終予後予測モデルに、上記(1)に記載の少なくとも4種類のタンパク質の発現量を当てはめリスクスコアを算出する工程、
を含む上記(2)に記載の肺がん患者の予後予測方法。
(4)上記(1)に記載の少なくとも4種類のタンパク質を含むタンパク質群の発現量に基づき構築した最終予後予測モデル又は閾値を格納した記憶手段、
肺がん患者のサンプルに含まれる前記少なくとも4種類のタンパク質の発現量を、前記記憶手段に記憶された最終予後予測モデルに当てはめリスクスコアを算出、又は閾値と比較することで肺がん患者の再発可能性を予測する予測手段、
を含む肺がん患者の予後予測装置。
(5)前記最終予測モデルが、Partial Cox regression解析に基づき構築したモデルであることを特徴とする上記(4)に記載の肺がん患者の予後予測装置。
(6)コンピュータを、上記(4)又は(5)に記載の肺がん患者の予後予測装置として機能させるためのプログラム。
(7)上記(6)に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
(8)上記(1)に記載の少なくとも4種類のタンパク質と同じアミノ酸配列を有する合成タンパク質を含み、
前記合成タンパク質の各々が、同位体標識されたアミノ酸を含む内部標準。
(9)上記(1)に記載の少なくとも4種類のタンパク質を検出するための抗体。
【発明の効果】
【0012】
患者由来のサンプル中の、少なくとも、g1027、g1237、g1463、及びg1821タンパク質の発現量に基づき再発可能性を予測することで、初期段階の肺がんであっても種類を問わず再発可能性を予測できる。したがって、再発の可能性が低い患者に対しては不要な抗がん剤治療を回避することができ、逆に、再発の可能性が高い患者に対しては、手術後の早い段階から患者に適した抗がん剤治療を行うことができる。
【0013】
本発明の予後予測装置に、インターネット回線を用いて肺がん患者の予後を予測するための情報を入力することで、症例の少ない遠隔地等の病院の患者に対しても適切な術後治療を実施することができる。
【0014】
コンピュータを肺がん患者の予後予測装置として機能させるプログラム、当該プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することで、症例の少ない遠隔地等の病院のコンピュータを予後予測装置として機能させることができるので、遠隔地の患者に対しても適切な術後治療を実施することができる。
【0015】
また、内部標準、抗体を提供することで、患者から得られたサンプルに含まれるタンパク質の発現量の絶対値を簡単に分析することができる。
【図面の簡単な説明】
【0016】
【図1】図1は、肺がん患者の予後予測装置の概略を示す図である。
【図2】図2は、本発明の予後予測装置を用いて、患者の予後を予測するための工程を示す図である。
【図3】図3は、予後予測タンパク質を同定するための統計処理手順を示す図である。
【図4】図4は、Partial Cox regression解析に用いられるタンパク質を4~100種類に選択した際のCross validation testにおける平均c-index値を示すグラフである。
【図5】図5は、実施例2で作成した最終予後予測モデルにより予測した結果と、実際に観察された予後との相関を示すグラフである。
【図6】図6は、実施例2で構築した最終予後予測モデルを用いて、教師群115サンプルを低危険群(46サンプル)と高危険群(69サンプル)に予測したグラフ、検証群58サンプルを低危険群(35サンプル)と高危険群(23サンプル)に予測したグラフを示している。
【図7】図7は、実施例3で構築した最終予後予測モデルを用いて、教師群55サンプルを低危険群(34サンプル)と高危険群(21サンプル)に予測したグラフ、検証群39サンプルを低危険群(28サンプル)と高危険群(11サンプル)に予測したグラフを表している。
【発明を実施するための形態】
【0017】
以下に、本発明の肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体について詳しく説明する。

【0018】
先ず、本発明における「肺がん」の種類は、腺がん、扁平上皮がん、腺扁平上皮がん、大細胞がん、等が挙げられる。「肺がん患者由来のサンプル」とは、タンパク質を測定することができるサンプルを意味し、例えば、手術の際に採取したがん細胞、血液、尿、肺胞洗浄液、呼気に含まれる肺がん由来タンパク質等が挙げられる。

【0019】
本発明の、肺がん患者の予後を評価するための情報を提供する方法は、肺がん患者由来のサンプル中で発現している各種タンパク質の内、少なくとも、g1027、g1237、g1463、及びg1821タンパク質の発現量を測定することを特徴としている。なお、本発明の「タンパク質の発現量を測定する」とは、目的とするタンパク質の発現量を測定できれば方法等については特に制限は無く、例えば、完全長のタンパク質を測定してもよいし、目的とするタンパク質のプロセス体(タンパク質断片)を測定することで、目的とするタンパク質の発現量を測定してもよい。

【0020】
後述する実施例に示すとおり、前記少なくとも4種類のタンパク質は術後のがんの再発に関与している。そのため、前記少なくとも4種類のタンパク質の発現量の情報を提供することで、患者の再発可能性を予測することができる。したがって、手術後の抗がん剤の投与が不要、又はより適切な抗がん剤の投与等、患者毎の適切な術後治療のための予後予測を提供することができる。

【0021】
本発明の、肺がん患者の予後予測方法は、上記の少なくとも4種類のタンパク質の発現量に基づいて、予後を予測することを特徴としている。予後の予測は、測定した上記少なくとも4種類のタンパク質の発現量に基づいて、予後を予測できるものであれば特に制限はない。以下に、質量分析(MS)を用いたサンプル中のタンパク質の発現量の比較定量結果から、統計的手段を用いて最終予後予測モデル(判別式)を作成し、予後を予測する手順を示す。
(1)採取・保存した患者の一定数のサンプルを教師群と検証群に分ける。
(2)教師群に割り当てられたサンプルを、複数サンプル間でタンパク質の存在量を網羅的に比較できるiTRAQ(登録商標)試薬(ABSciex社)等を用いて質量分析を行うことでサンプル中のタンパク質の発現量を測定し、データベース化する。なお、データベース化の際には、測定したタンパク質の発現量とその患者の実際に観察された予後、例えば、手術した3か月間後に再発、5年後に再発、9年間無再発等の情報を関連付けて記憶しておく。
(3)上記(2)で得られたデータを、統計処理し、手術後に再発の可能性が高いタンパク質群を同定する。統計処理は、例えば、サンプルを教師群(training dataset)と検証群(Validation dataset)に分け、教師群を更にランダムにtraining dataとtest dataに分け、training dataを生存に関わる多変数の効果を調べる回帰モデルであるコックス比例ハザードモデル(Cox regression analysis)を用いて、再発に関連する候補タンパク質を限定する。
(4)上記(3)で限定した候補タンパク質群を、複数の変数を用いて予測モデルを構築できるPartial Cox regression解析を用いて、予後予測モデルの作成を行う。作成した予後予測モデルは、test dataを利用してc-index(concordance indices)に基づいた予測性能の評価を行う。
(5)候補タンパク質を10%ずつ減らしながら、上記(4)を繰り返すことで、候補タンパク質の数(m)が異なるセットを作成する。
(6)更に、(3)~(5)をn回繰り返すことで、候補タンパク質の数がmであるセットをn個作成することができる。作成した候補タンパク質の数が異なる判別モデルの精度をc-indexを指標に評価を行い、最終予後予測モデル作成に適切な候補タンパク質数Mを決定する。候補タンパク質の数がMであるセットをn個作成することで、M×n個のタンパク質(重複を含む)が得られ、n個のモデルの中で最も高い頻度で選択されたタンパク質からM番目までのタンパク質をM個選択し、当該選択したタンパク質を用いてPartial Cox regression解析に基づく最終予後予測モデル(判別式)を構築する。なお、最終予後予測モデルとは、M×n個の候補タンパク質(重複を含む)の中から選択したタンパク質M個に基づいて、教師群の全症例を予測できるようにPartial Cox regression解析を用いて作成したモデルを意味し、(4)の予測モデル(m個を選択したモデル)とは異なる。
(7)構築した最終予後予測モデルは、作成に用いた教師群とは別の検証群のデータを用いて検証を行うことで、作成した最終予後予測モデルの信頼性の評価をすることができる。
(8)そして、予後を予測するためには、サンプル中のタンパク質の発現量を測定し、測定した発現量を最終予後予測モデルに当てはめ、リスクスコアを算出することで、再発の危険度を予測すればよい。

【0022】
なお、上記に示す手順は、統計的手段の一例を示すもので、上記の手段に限定されるものではない。例えば、重み付け得票分類(weighted-voting)、教師あり学習を用いるパターン認識モデルの一つであるサポートベクターマシン(support vector machines)等のモデルを用いて、最終予後予測モデルを作成してもよい。

【0023】
また、上記に示す方法は、サンプル中の各種タンパク質の発現量の比較定量結果から、最終予後予測モデルを作成する手順を示しているが、測定したタンパク質の発現量の絶対値に基づき、予後を予測する最終予後予測モデルを作成してもよい。絶対値に基づく場合でも、Partial cox regression解析、weighted voting、support vector machineなどを応用して、最終予後予測モデルを作成することができる。また、絶対値の場合、手術後の実際に観察された予後に関する情報が分かっているサンプルについて、上記少なくとも4種類のタンパク質の発現量の絶対値を調べ、どの程度の発現量であれば再発するリスクが高いのかデータ処理して閾値を設定し、当該閾値と比較することで再発可能性を予測できるようにしてもよい。タンパク質の発現量の絶対値の測定は、例えば、液体クロマトグラフィー質量分析法(LC-MS/MS)、ELISA(Enzyme-Linked ImmunoSorbent Assay)、免疫組織染色等、公知の方法を用いることができる。

【0024】
LC-MS/MSを用いる場合は、サンプル中の測定対象タンパク質と同様のアミノ酸配列の内部標準を同時に分析し、内部標準との測定値を比較することで測定対象タンパク質の発現量の絶対値を測定することができる。内部標準は、測定対象タンパク質の一部、例えば、末端のアミノ酸のみを、2H、13C、15N等の同位体標識した人工アミノ酸を用いて合成した合成タンパク質を用いればよい。後述するように、本発明では、予後を予測するタンパク質を4、5、6、7、8、9、10、11、12、14、15、17、19、21種類選択したモデルを作成している。内部標準は、それぞれのモデルのタンパク質に対応する同位体標識した合成タンパク質で作成すればよい。内部標準は、配列を提供すれば、例えば、SIGMA社等の試薬メーカーから入手することができる。

【0025】
ELISAの場合は、測定対象タンパク質のみを特異的に認識する抗体を作成し、公知の手順で測定対象タンパク質の発現量を測定すればよい。また、免疫組織染色についても、公知の手順で発現量を測定すればよい。内部標準、抗体は、発現量の測定に必要な試薬と共に、キットとしてもよい。

【0026】
なお、後述する実施例に示すとおり、本発明では、予後を予測するタンパク質を4、5、6、7、8、9、10、11、12、14、15、17、19、21種類選択したモデルを作成しているが、最終予後予測モデルの精度が高ければ、タンパク質の組み合わせ数及び種類を適宜変更してもよい。例えば、表2に示す29,000セットのタンパク質の中で選択された回数の多いタンパク質を単独、又は適宜組み合わせてタンパク質群を作成してもよい。

【0027】
本発明では、後述する実施例に示すように、手術後の実際に観察された予後の情報を関連付けたサンプルを分析することで、予後予測の指標となるタンパク質を同定した。また、当該タンパク質の発現量に基づいて構築した最終予後予測モデルを用いることで、患者の予後を予測ができることを明らかにしている。そのため、当該最終予後予測モデルや閾値をコンピュータの記憶手段に記憶しておくことで、コンピュータを肺がん患者の予後予測装置として用いることもできる。

【0028】
図1は、肺がん患者の予後予測装置の概略を示す図である。予後予測装置1は、入力手段2、最終予後予測モデル又は閾値を記憶する記憶手段3、予測手段4、制御部5及びプログラムメモリ6を少なくとも含んでいる。

【0029】
入力手段2は、予後予測装置1に、患者サンプルから得られた発現量の情報を入力できれば特に制限はなく、キーボード、USB等が挙げられる。また、入力手段2はインターネット回線を使用しても良い。例えば、インターネット回線を用いて遠隔地の病院で取得した患者サンプルの発現量の情報を予後予測装置1に送信・入力し、インターネット回線を通じて予後予測結果を送付することで遠隔地の病院の患者に対しても適切な術後治療を実施することができる。

【0030】
記憶手段3には、患者の予後を予測する為の最終予後予測モデル又は閾値が記憶されている。予測手段4は、入力手段2により入力された患者サンプルから得られた発現量の情報を記憶手段3に記憶されている最終予後予測モデルに当てはめリスクスコアを算出する、又は閾値と比較することで、再発の危険度を予測することができる。プログラムメモリ6には、例えば、図1に示すコンピュータを予後予測装置1として機能させるためのプログラムが格納されている。このプログラムが制御部5により読み出され実行されることで、入力手段2、記憶手段3及び予測手段4の動作制御が行われる。プログラムは、予めコンピュータに記憶しておいても良いし、記録媒体に最終予後予測モデル、閾値と共に記録され、インストール手段を用いてプログラムメモリ6に格納されるようにしてもよい。

【0031】
図2は、本発明の予後予測装置を用いて、患者の予後を予測するための工程を示す図である。プログラムメモリ6に格納されたプログラムが制御部5に読み出されて実行し、先ず、入力手段2により、サンプル中のタンパク質の発現量を入力する(S100)。なお、サンプル中のタンパク質の発現量は、予後予測装置と接続している発現量の測定装置の測定結果を直接入力してもよいし、別途測定した測定値を入力してもよい。次に、入力手段2により入力された発現量の情報を、記憶手段3に記憶されている最終予後予測モデルに当てはめリスクスコアを算出する、又は閾値と比較する(S110)。そして、得られた予後の予測結果を表示する(S120)。表示方法は、コンピュータの表示手段に表示してもよいし、紙等にプリントアウトしてもよい。

【0032】
以下に実施例を掲げ、本発明を具体的に説明するが、この実施例は単に本発明の説明のため、その具体的な態様の参考のために提供されているものである。これらの例示は本発明の特定の具体的な態様を説明するためのものであるが、本願で開示する発明の範囲を限定したり、あるいは制限することを表すものではない。
【実施例】
【0033】
<実施例1>
以下の手順により、肺がん患者の予後を予測するために必要なタンパク質の同定と予後予測モデルの構築を行った。
〔サンプル〕
肺がん患者から採取した手術摘出肺がん試料であって、手術後の実際に観察された予後に関する情報(最長は手術後9年まで経過観察)を有する173サンプルを準備した。
【実施例】
【0034】
〔タンパク質発現量の比較定量及びデータベースの作製〕
(1)上記173サンプルを、
・教師群:115サンプル(腺:73症例、扁平上皮:24症例、腺扁平上皮:5症例、大細胞:13症例)
・検証群:58サンプル(腺:37症例、扁平上皮:12症例、腺扁平上皮:2症例、大細胞:7症例)に割り当てを行った。
(2)教師群のサンプル中に特異的に発現しているタンパク質を探索するために、先ず、次の手順により、サンプル内タンパク質の網羅的解析を行った。
(i)対照として、肺がん細胞株20種類から抽出したタンパク質を混合した試料を準備した。
(ii)上記対照試料と手術摘出肺がん組織試料から抽出したタンパク質、或いは、正常肺から抽出したタンパク質から、酵素消化によりペプチドを作成した後、iTRAQ(登録商標)試薬(ABSciex社)を用い標識を行った。
(iii)標識したペプチド試料を全て混合し、液体クロマトグラフィーによる分画化後に、質量分析装置(ABSciex社)を用いて解析を行い、試料中のタンパク質の相対比較定量結果を取得した。
(iv)分析したサンプル毎に、タンパク質の発現量及びそのサンプルの患者の無病再発期間を関連付けて分析結果をデータベース化した。検証群のサンプルについても、教師群と同様の手順で分析した。
【実施例】
【0035】
〔統計処理及び予後予測タンパク質の同定〕
上記〔タンパク質発現量の比較定量及びデータベースの作製〕で作製したデータベースを用い、図3に示す手順で統計処理を行った。
(1)教師群の115サンプルを、ランダムにtraining data(92サンプル)とtest data(23サンプル)に分けた。
(2)発現量の分散値とCox regression analysisの結果により、候補タンパク質を100個まで限定した。
(3)次に、Partial Cox regression解析を用いて、実際に観察された予後の情報(再発までの時間軸の情報)を考慮した予測モデルをtraining data(92サンプル)を用いて作成した。作成した予測モデルの予測性能は、test dataを用いCross validation testを行い、c-indexに基づいて評価した。なお、c-indexは、Cross validation testにおける正答率を意味する。
(4)次に、候補タンパク質を10%ずつ減らし、上記(3)の工程を繰り返した。なお、10%減らした際に、候補タンパク質が小数点になる場合は四捨五入した整数の候補タンパク質を選定した。次に10%を減らす際にも、同様に四捨五入し整数の候補タンパク質を選定した。具体的には、100、90、81、73・・・21、19、17、15、14、12、11、10、9、8、7、6、5及び4種類の合計29パターンについて、候補タンパク質を選定した。((1)~(4)の手順を“Random 5-fold cross validation”と記載する。)
(5)上記(1)~(4)の手順を1000回繰り返した。
(6)表1は、候補タンパク質を10%ずつ減らし、11種類まで減らした際の候補タンパク質の選択方法を示している。候補タンパク質は、1回目の“Random 5-fold cross validation”(表1では“CV1”と記載。)の際に選択された11種類のタンパク質、2回目の“Random 5-fold cross validation”(表1では“CV2”と記載。)で選択された11種類のタンパク質、・・・1,000回目の“Random 5-fold cross validation”(表1では“CV1000”と記載。)で選択された11種類のタンパク質をリストアップし、合計1000回の“Random 5-fold cross validation”で選択された回数の多い順に11種類のタンパク質を選択した。候補タンパク質を、4、5、6、7、8、9、・・・73、81、90、100種類選択する場合も、同様の手順で行った。
【実施例】
【0036】
【表1】
JP2016121715A1_000003t.gif
【実施例】
【0037】
表2は、4、・・・100種類(29パターン)のタンパク質を選択した際(29×1,000回=29,000回)に、選択回数が上位50種類のタンパク質の合計選択回数及びそのタンパク質のAccession番号を表す。
【表2】
JP2016121715A1_000004t.gif
【実施例】
【0038】
表3~16は、それぞれ、タンパク質を4、5、6、7、8、9、10、11、12、14、15、17、19、21種類選択した際の、上位タンパク質の合計選択回数(1000回中で選択された回数)及びそのAccession番号を表す。
【実施例】
【0039】
【表3】
JP2016121715A1_000005t.gif
【実施例】
【0040】
【表4】
JP2016121715A1_000006t.gif
【実施例】
【0041】
【表5】
JP2016121715A1_000007t.gif
【実施例】
【0042】
【表6】
JP2016121715A1_000008t.gif
【実施例】
【0043】
【表7】
JP2016121715A1_000009t.gif
【実施例】
【0044】
【表8】
JP2016121715A1_000010t.gif
【実施例】
【0045】
【表9】
JP2016121715A1_000011t.gif
【実施例】
【0046】
【表10】
JP2016121715A1_000012t.gif
【実施例】
【0047】
【表11】
JP2016121715A1_000013t.gif
【実施例】
【0048】
【表12】
JP2016121715A1_000014t.gif
【実施例】
【0049】
【表13】
JP2016121715A1_000015t.gif
【実施例】
【0050】
【表14】
JP2016121715A1_000016t.gif
【実施例】
【0051】
【表15】
JP2016121715A1_000017t.gif
【実施例】
【0052】
【表16】
JP2016121715A1_000018t.gif
【実施例】
【0053】
表2~16に示すように、順位は異なるものの、選択回数が上位のタンパク質には共通性が見られた。具体的には、(1)4種類までタンパク質を絞り込んだ表3のg1027、g1237、g1463及びg1821については、表4~表16においてもすべて含まれること、(2)表3~表16のタンパク質は、表2に示す29,000回でヒットした上位34タンパク質内に全て含まれていること、を確認した。したがって、予後予測には、上記4種類のタンパク質の発現量を少なくとも調べることが重要であることが判明した。
【実施例】
【0054】
図4は、Partial Cox regression解析を用いて候補タンパク質を4~100種に選択した際のCross validation testにおける平均c-index値を示すグラフである。選択したタンパク質の数が4~100種類の何れの場合もc-index値は0.61~0.62の間で、高い正答率といえる。
【実施例】
【0055】
〔最終予後予測モデルの検証〕
<実施例2>
上記のとおり、29種類の判別モデルにおけるc-indexの平均値に基づく各モデルの診断精度の評価は何れも高い正答率であったが、その中で、最も診断精度が高かった11タンパク質を用いた判別モデルを最終予後予測モデルとした。表1及び10に示すように、1000回の11タンパク質モデル構築の際に、最も多く選出されたタンパク質から11番目までを最終モデルを構築するための因子として、Partial Cox regression解析に基づく最終予後予測モデル(判別式)を、教師群全115症例を用いて、「Hongzhe Li et. al.,“Partial Cox regression analysis for high-dimensional microarray gene expression data”, BIOINFORMATICS,Vol.20 Suppl.1, 2004,pi208-i215」に記載されている手順で構築した。得られた最終予後予測モデル(判別式)を以下に示す。
【実施例】
【0056】
coefficent1×(protein1 - mean1)+coefficent2×(protein2 - mean2)+・・・coefficent10×(protein10 - mean10)+coefficent11×(protein11 - mean11)
【実施例】
【0057】
なお、上記最終予後予測モデル(判別式)の、“coefficent1”及び“mean1”とは、Partial Cox regression解析の際に得られた値で、下記表17に示す選択回数の順位が1位のタンパク質の“coefficent”及び“mean”の値である“-0.4441”、“0.0142”である。“coefficent2”及び“mean2”・・・は、順位が2位・・・のタンパク質の“coefficent”及び“mean”の値を示す。また、“protein1”、“protein2”・・・とは、115サンプル中の個々のサンプル中で発現している“順位1位のタンパク質の発現量”、“順位2位のタンパク質の発現量”・・・を表している。
上記の最終予後予測モデル(判別式)に115サンプルを当てはめることで、各々のサンプルのリスクスコアを算出した。タンパク質が11個以外の最終予後予測モデル(判別式)の場合も、同様に計算をすることでリスクスコアを算出できる。
【実施例】
【0058】
【表17】
JP2016121715A1_000019t.gif
【実施例】
【0059】
本発明のサンプルは、手術後に実際に観察された予後が明らかなサンプルを使用している。そのため、実施例2で作成した最終予後予測モデルにより予測した結果と、実際に観察された予後との相関を調べた。図5は、教師群115サンプルについての相関を示すグラフで、実際に観察された患者の予後を無再発生存(手術後、5年経過した段階で再発しなかった患者)及び再発(手術後、5年以内に再発)に分け、それらの患者のサンプルを最終予後予測モデルで予測したリスクスコア(危険度)に基づいてプロットしたグラフである。なお、図5では、リスクスコアが“0”の場合を、低危険群と高危険群の境界とした。図5から明らかなように、実際に観察された予後が無再発生存のサンプルの多くは低危険群に予測され、実際に観察された予後が再発のサンプルの多くは高危険群に予測されていた。したがって、実施例2で作成した最終予後予測モデルの精度が高いことが明らかとなった。
【実施例】
【0060】
図6は、構築した最終予後予測モデルを用いて、教師群115サンプルを低危険群(46サンプル)と高危険群(69サンプル)に予測したグラフ、検証群58サンプルを低危険群(35サンプル)と高危険群(23サンプル)に予測したグラフを示している。なお、図6に示す低危険群とは、図5に示す境界により低危険群に分類されたサンプルで、高危険群とは図5に示す境界により高危険群に分類されたサンプルである。また、図6中の実線は、高危険群又は低危険群に分類された手術摘出肺がん試料173サンプルの手術後の実際に観察された予後に関する情報を示しており、破線は95%信頼区間を示している。実施例2で構築した最終予後予測モデルは、教師群のサンプルを用いて作成したモデルであることから、p値はp=6.8×10-9と非常に小さく、信頼性が高い。そして、作成した最終予後予測モデルを検証群に適用した際のp値はp=1.1×10-5であり、作成した最終予後予測モデルを適用した検証群の予測も、信頼度が高いことが明らかとなった。
【実施例】
【0061】
表18は、教師群中で低危険群(n=46)及び高危険群(n=69)に予測されたサンプル、並びに、検証群中で低危険群(n=35)及び高危険群(n=23)に予測されたサンプルの肺がんの種類を表している。表18から明らかなように、本発明の最終予後予測モデルを用いることで、肺がんの種類によらず高精度に予後を予測できることが明らかとなった。
【実施例】
【0062】
【表18】
JP2016121715A1_000020t.gif
【実施例】
【0063】
<実施例3>
上記の173のサンプルから、肺がんとしては初期の段階であるI期の症例である94サンプルのみを選択し、当該94サンプルを教師群(55サンプル)及び検証群(39サンプル)に分けた以外は、<実施例2>と同様の手順で、最終予後予測モデルの検証を行った。
【実施例】
【0064】
図7は、実施例3で構築した最終予後予測モデルを用いて、教師群55サンプルを低危険群(34サンプル)と高危険群(21サンプル)に予測したグラフ、検証群39サンプルを低危険群(28サンプル)と高危険群(11サンプル)に予測したグラフを示している。実施例3で構築した最終予後予測モデルのp値はp=2.0×10-4であった。そして、作成した最終予後予測モデルを検証群に適用した際のp値はp=6.2×10-4であった。一般的に、p<0.05であれば統計学的に有意であると言えることから、作成した最終予後予測モデルの信頼度は高いと言える。以上の結果より、本発明の最終予後予測モデルは、初期段階の肺がん患者のサンプルからでも、高い精度で予後の予測ができることが明らかとなった。
【産業上の利用可能性】
【0065】
本発明に係る肺がん患者の予後予測方法及び予後予測装置を用いることで、肺がん患者の予後を高い精度で予測することができる。そのため、患者に適した術後治療を実施することができることから、医療機関や大学医学部などの研究機関等における肺がん患者の検査及び研究に有用である。
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6