TOP > 国内特許検索 > 遺伝子発現変動解析方法及びシステム、並びにプログラム

遺伝子発現変動解析方法及びシステム、並びにプログラム

国内特許コード P08A014133
整理番号 NIRS-283
掲載日 2008年12月12日
出願番号 特願2007-066506
公開番号 特開2008-226095
登録番号 特許第5213009号
出願日 平成19年3月15日(2007.3.15)
公開日 平成20年9月25日(2008.9.25)
登録日 平成25年3月8日(2013.3.8)
発明者
  • 安倍 真澄
  • 笠間 康次
  • 門田 幸二
出願人
  • 国立研究開発法人量子科学技術研究開発機構
発明の名称 遺伝子発現変動解析方法及びシステム、並びにプログラム
発明の概要 【課題】転写産物由来のcDNA断片の遺伝子発現プロファイルを処理するための方法及びシステム等を提供する。
【解決手段】少なくとも2回測定された遺伝子発現プロファイルを、少なくとも発現している転写産物量を示すピーク情報と該ピーク情報を有する波形位置とで表わされる波形データとして入力し、前記入力された複数の波形データに対して、関数近似に基づくピーク情報補間抽出処理を行い、前記補間抽出処理を行った少なくとも1つの波形ピークを含む前記複数の波形データ間で波形補正処理に基づく波形補正を行って、各波形データ上の相当するピークを対応付ける波形ピーク対応付け処理を行い、前記波形ピーク対応付け処理を行った結果を、転写産物の発現量を示す値とともに波形ピークリストとしてリスト出力することを特徴とする。
【選択図】図1
従来技術、競合技術の概要


(遺伝子発現解析の意義)
遺伝子の発現量が遺伝子の種類及びその発現時期に依存して異なることは、当業界の研究者により経験的に広く知られている。ここで、「発現」とは、一般には、遺伝子(DNA)が転写及び翻訳を経て、タンパク質へ変換される過程(すなわち、DNAから転写されたmRNAの情報を基にタンパク質が合成される過程)をいう。しかし、本明細書においては、タンパク質の合成に限らず、翻訳されないRNA(非コードRNA)の合成も「遺伝子の発現」に含まれる。また、本明細書において「発現(量)」というときは、特に断らない限り、遺伝子の転写産物であるmRNAの存在(量)をいうものとする。



近年、オーダーメイド治療等の開発を目的とした遺伝子発現ネットワークの解析研究が進められている。これは、生体内でどの遺伝子がどういった場合にどの程度発現しているかを解明することにより、かかる遺伝子発現の観測及び解析に基づく生体内の異変の早期発見等を実現しようというものである。したがって、こうした遺伝子発現ネットワークの解明には、ある時点において生体内でどの遺伝子がどの程度発現しているかを示す遺伝子発現プロファイルを効果的に作成する必要がある。



(DNAマイクロアレイ法等の従来の遺伝子発現解析方法)
従来、遺伝子発現プロファイルの作成方法としては、ディファレンシャルディスプレー法や、遺伝子発現の逐次分析法(SAGE)、DNAマイクロアレイ又はDNAチップ法等がある。これらの遺伝子発現プロファイル作成方法においては、塩基配列が予め分かっている遺伝子にしか対応できないこと、感度が低い(例えば、検出のために必要なmRNA量の変動量の下限は、2~3倍である)こと、大きな発現変動以外の結果の再現性に問題が見られること等の課題があった。



(次世代遺伝子発現プロファイリング解析法:HiCEP法)
近年、高精度の遺伝子発現解析を可能にした、High Coverage Expression Profiling法(以下、「HiCEP法」という。)が注目を浴びている(例えば、特許文献1参照)。HiCEP法は、制限酵素により切断されるcDNA断片の発現ピークデータを利用するという基本原理に基づいており、塩基配列が決定されていない未知遺伝子においても、その発現変動を解析することができるという特徴を持っている。このため、発現している全転写物に対して観察される転写物の割合をカバー率と定義するならば、上述した従来法のカバー率が10~30%であるのに対し、HiCEP法は70~80%のカバー率を達成している。さらに、約20%の微小な発現変動を確実に捉えることが可能である(すなわち、この場合の感度は約1.2倍となる)。上記の点において、HiCEP法は、従来のDNAマイクロアレイ法等では実現し得なかった高精度・高感度を達成している。



(HiCEP法における選択PCR法の採用)
HiCEP法は基本的にポリメラーゼ連鎖反応法(Polymerase Chain Reaction法。以下、「PCR」法)をベースに開発されたものであるが、HiCEP法が、高精度、高感度性能に加えて、特に「高カバー率」を実現できたことの理由の1つに、選択PCR法の採用が挙げられる。選択PCR法とは、膨大な種類のcDNA断片を、その後の電気泳動による分離が可能な数までに分類することを目的とした一連の段階である。
その原理は、アダプタを両脇側に結合しされた多種の2本鎖cDNA断片が、各アダプタ内側に位置するの2塩基(1つのcDNAでは計4塩基。各塩基となる)はA,T,G又はCである)(後述の図4の工程(i)におけるN1、N2、N3及びN4に相補的な塩基)の種類に基づいて44=256通りに分類できることを利用し、各種cDNA断片に対応する合成プライマを用いた選択的アニーリングにより、それぞれの塩基の位置に4種類の塩基、A,T,G,Cそれぞれに対応するフラグメントの存在を考慮して、cDNAの集団を44種類、すなわち計256種類に分類するというものである。
この分類工程が成功すれば、数万種類のcDNA集団を平均100~150程度の小さな集団に分けることが可能となる。さらに、理論上は、アダプタ内側の3塩基に対して合成プライマを用いた選択アニーリングを行った場合には計4096種類に、アダプタ内側の4塩基に対して合成プライマを用いた選択アニーリングを行った場合には計65536種類に、それぞれ分類可能である。ここで、「アダプタ」とは、PCR反応の際に用いるプライマを結合させるために用いるものであって、使用する制限酵素及びプライマに応じて設計されるものである。



HiCEP法の概要を、図4を用いて説明する。タグ物質12(ビオチン)で標識したプライマを用いて、遺伝子の転写産物であるmRNA11からcDNA14を合成する(工程(a)~(b))。合成したcDNAを制限酵素Xで切断する(工程(c))。次いで、タグ物質に高親和性を有する物質15(アビジン)を用いて、タグ物質12が付加された断片を回収する(工程(d))。回収された断片へXアダプタ16を結合する(工程(e))。Xアダプタ16が付加された断片を制限酵素Yで切断する(工程(f))。タグ物質に高親和性を有する物質15を用いて、ビオチン12が付加された断片を除去する(工程(g))。残りの断片へYアダプタ17を結合する(工程(h))。このようにして得られた両側にアダプタを有する数万種類のDNA断片18を、蛍光物質20で標識したプライマ19とプライマ21とからなるプライマセット(256種類)を用いた選択PCR法によりサブグループ化(256種類)する(工程(i))。最終的に、得られたPCR産物をキャピラリ電気泳動に付して、対応する遺伝子の発現頻度を蛍光強度として検出する(工程(j))。



このようにして、例えば、各アダプタの内側の2塩基に対して選択PCR法を適用した場合には、1回のHiCEP法の測定により、典型的には256種類のプロファイル波形が作成されることとなる。従って、HiCEP法における遺伝子発現は、発現している遺伝子の転写産物の種類を、mRNA配列の断片を特徴付ける選択PCR条件(アダプタの内側の2塩基)とピークサイズ(位置)で、またその発現量をピークの高さ(または面積)で示す波形プロファイルのセットとして測定される。以下、特に断りのない限り、DNAシーケンサなどで測定された、この波形プロファイルを「遺伝子発現プロファイル」または単に「プロファイル」と称する。また、遺伝子発現プロファイルの構成要素である、転写産物種(典型的にはアダプタの内側の2塩基と、ピークサイズ)と測定毎の発現量(ピークの高さ、または面積)をリストしたものを「発現マトリクス」と記述する。



ここで、波形データから得られたピークについて上記の通り分類された情報のイメージを図示すると、図5のようになる。ここでは、ピークサイズが電気泳動の距離として表示され、総計33136のピークサイズにおける各ピークが256種類のプロファイルに分類されている。従って各プロファイルは平均で約100~150のピークを有している。



また、選択PCR法を採用したHiCEP法に基づいて精度の高い遺伝子発現プロファイルを作成する方法等、並びに、この方法により得られたデータの作業結果の処理及びその保存システム等については、以下の文献がある(例えば、特許文献2、特許文献3を参照)。



【特許文献1】
国際公開第02/48352号パンフレット
【特許文献2】
特開2005‐006554号公報
【特許文献3】
特開2005‐250615号公報

産業上の利用分野


本発明は、一般的に、遺伝子発現変動解析方法及びシステム等に関し、より詳細には、生成された遺伝子発現プロファイルにおける遺伝子の発現変動を、コンピュータハードウェア及びソフトウェア処理によって正確かつ迅速に解析するための方法及びシステム等に関する。

特許請求の範囲 【請求項1】
発現している遺伝子の転写産物の発現量と該転写産物のピークサイズとの情報を入力した遺伝子発現プロファイルをコンピュータにおいて解析処理するための方法であって、
前記転写産物の所定範囲位置における前記情報を波形データとして入力した前記遺伝子発現プロファイルを少なくとも二つ作成し、
前記波形データに対し、近似による波形寄与分を元のデータから逐次減算して関数近似を繰り返す試行減算によりピークを特定する処理、及びピーク波形の裾野形状から飽和ピークを外挿することにより特定する処理を含むピーク情報補間抽出処理を行い、
前記ピーク情報補間抽出処理を行った複数の波形データ間でグローバル補正及びローカル補正に基づく波形補正を行って、
前記少なくとも二つの遺伝子発現プロファイル間で各波形データのピーク同士を対応付ける波形ピーク対応付け処理であって、前記波形補正処理を行った複数の波形データ全てに対して、波形ピーク位置を射影して所定の条件のもとに最長距離法に基づくクラスタリングを行う波形ピーク対応付け処理を行い、
前記対応付け処理を行った結果を、1つの発現マトリクスとしてリスト出力することを特徴とする方法。

【請求項2】
前記関数近似に基づくピーク情報の補間抽出処理はガウス関数に基づく近似であり、
前記波形データに対して、ピーク情報抽出処理及び飽和ピークの推定処理と、ノイズ若しくは歪みの除去処理、複合ピークの分離処理、偽ピークの除去処理、重複ピークの推定処理のうちの1又は複数の組み合わせとを行うことを特徴とする請求項1に記載の方法。

【請求項3】
前記飽和ピークの推定処理は、波形ピークにおけるピーク強度または面積の総和で表わされる発現総量が保存されるとの前提に基づいた波形規格化において波形強度誤差を生じる部分を推定することを特徴とする請求項2に記載の方法。

【請求項4】
前記波形補正処理は、前記測定された複数の波形データについて波形形状の類似性指標を用いた補正評価値の算出及び評価を行い、前記測定された複数の波形データ間の波形の高さを規格化する波形規格化のために、前記波形ピーク対応付け処理の前処理として実行されることを特徴とする請求項1~請求項3のいずれか1項に記載の方法。

【請求項5】
前記測定された複数の波形データの波形と、
前記関数近似に基づく補間抽出処理と、ノイズ若しくは歪みの除去処理、複合ピークの分離処理、偽ピークの除去処理、重複ピークの推定処理のうちの少なくとも1つ以上の組み合わせを行った波形と、
前記複数波形データ間での波形補正処理とピーク対応付け処理を行った波形と
を重ねて表示することをさらに含む、請求項1~請求項4のいずれか1項に記載の方法。

【請求項6】
請求項5に記載の方法において、
前記波形データは、任意の組み合わせで選択表示可能であることを特徴とする方法。

【請求項7】
請求子5に記載の方法において、
前記波形データは、サイズ及び/又は強度を拡大縮小表示可能であることを特徴とする方法。

【請求項8】
請求項5に記載の方法において、
前記波形データに対し、波形ピークデータの追加、削除、対応付け修正のうちの、1又は複数の組み合わせによる編集が可能であることを特徴とする方法。

【請求項9】
発現している遺伝子の転写産物の発現量と該転写産物のピークサイズとの情報を入力した遺伝子発現プロファイルをコンピュータにおいて解析処理するためのシステムであって、
前記転写産物の所定範囲位置における前記情報を波形データとして入力した前記遺伝子発現プロファイルを少なくとも二つ作成する手段と、
前記波形データに対し、近似による波形寄与分を元のデータから逐次減算して関数近似を繰り返す試行減算によりピークを特定する処理、及びピーク波形の裾野形状から飽和ピークを外挿することにより特定する処理を含むピーク情報補間抽出処理を行う手段と、
前記ピーク情報補間抽出処理を行った複数の波形データ間でグローバル補正及びローカル補正に基づく波形補正を行う手段と、
前記少なくとも二つの遺伝子発現プロファイル間で各波形データのピーク同士を対応付ける波形ピーク対応付け処理手段であって、 前記波形補正処理を行った複数の波形データ全てに対して、波形ピーク位置を射影して所定の条件のもとに最長距離法に基づくクラスタリングを行う波形ピーク対応付け処理手段と、
前記対応付け処理を行った結果を、1つの発現マトリクスとしてリスト出力する手段とを備えたことを特徴とするシステム。

【請求項10】
前記関数近似に基づくピーク情報の補間抽出手段は、ガウス関数に基づく関数近似を行い、
前記関数近似された波形データに対して、ピーク情報抽出手段と、
ノイズ若しくは歪みの除去手段とを有し、
複合ピークの分離処理、偽ピークの除去処理、重複ピークの推定処理のうちの1又は複数の組み合わせを行う波形ピーク検出手段
を更に備えたことを特徴とする請求項9に記載のシステム。

【請求項11】
前記飽和ピークの推定処理は、波形ピークにおけるピーク強度または面積の総和で表わされる発現総量が保存されるとの前提に基づいた波形規格化において波形強度誤差を生じる部分を推定することを特徴とする請求項10に記載のシステム

【請求項12】
前記波形補正処理手段は、前記測定された複数の波形データについて波形形状の類似性指標を用いた補正評価値の算出及び評価を行い、前記測定された複数の波形データ間の波形の高さを規格化する波形規格化のために、前記波形ピーク対応付け処理の前処理として実行されることを特徴とする請求項9~請求項11のいずれか1項に記載のシステム。

【請求項13】
発現している遺伝子の転写産物の発現量と該転写産物のピークサイズとの情報を入力した遺伝子発現プロファイルをコンピュータにおいて解析処理するためのコンピュータプログラムであって、
前記転写産物の所定範囲位置における前記情報を波形データとして入力した前記遺伝子発現プロファイルを少なくとも二つ作成するステップと、
前記波形データに対し、近似による波形寄与分を元のデータから逐次減算して関数近似を繰り返す試行減算によりピークを特定する処理、及びピーク波形の裾野形状から飽和ピークを外挿することにより特定する処理を含むピーク情報補間抽出処理を行うステップと、
前記ピーク情報補間抽出処理を行った複数の波形データ間でグローバル補正及びローカル補正に基づく波形補正を行うステップと、
前記少なくとも二つの遺伝子発現プロファイル間で各波形データのピーク同士を対応付ける波形ピーク対応付け処理を行うステップであって、前記波形補正処理を行った複数の波形データ全てに対して、波形ピーク位置を射影して所定の条件のもとに最長距離法に基づくクラスタリングを行う波形ピーク対応付け処理を行うステップと、
前記対応付け処理を行った結果を、1つの発現マトリクスとしてリスト出力するステップと
をコンピュータに実行させることを特徴とするコンピュータプログラム。
国際特許分類(IPC)
Fターム
  • 5L049DD00
  • 5L049DD06
画像

※ 画像をクリックすると拡大します。

JP2007066506thum.jpg
出願権利状態 登録
放医研が保有する特許に、ご関心のある企業等はお問合せ下さい。


PAGE TOP

close
close
close
close
close
close
close