TOP > 国内特許検索 > 発現プロファイル解析システム、発現プロファイル解析方法、発現プロファイル解析プログラム、およびそのプログラムを記録した記録媒体

発現プロファイル解析システム、発現プロファイル解析方法、発現プロファイル解析プログラム、およびそのプログラムを記録した記録媒体 コモンズ

国内特許コード P05P001853
整理番号 A181P92
掲載日 2005年4月15日
出願番号 特願2003-307587
公開番号 特開2005-073569
登録番号 特許第4302466号
出願日 平成15年8月29日(2003.8.29)
公開日 平成17年3月24日(2005.3.24)
登録日 平成21年5月1日(2009.5.1)
発明者
  • 矢野 健太郎
  • 佐藤 和広
  • 武田 和義
出願人
  • 独立行政法人科学技術振興機構
発明の名称 発現プロファイル解析システム、発現プロファイル解析方法、発現プロファイル解析プログラム、およびそのプログラムを記録した記録媒体 コモンズ
発明の概要

【課題】 膨大な数の遺伝子および/またはタンパク質の発現プロファイルデータを、迅速かつ網羅的に解析し、発現比の小さい遺伝子やタンパク質の中から、表現型に関与する遺伝子および/またはタンパク質を検出可能な発現プロファイル解析システムおよび解析方法を提供する。
【解決手段】 解析システム10aにおいて、変換部22で、マイクロアレイ51から得られた発現プロファイルデータを、arctan(1/ratio)変換し、その変換値に基づいて、解析部23で対応分析を行う。解析部23は、補足部32から付加される補足データも利用して、対応分析を行うこともできる。
【選択図】 図1

従来技術、競合技術の概要


ゲノム解析研究の進展により、機能未知の新規遺伝子が大量に同定されている。その機能未知遺伝子の機能を解明するためには、その機能を示唆する情報を得ることが必要となり、その情報を得るためには、遺伝子の発現パターンが重要な役割を果たす。



そこで、近年、DNAマイクロアレイやDNAチップ等によって、疾患患者・病態モデル動物の組織・培養細胞内などから取得した数万もの大量の遺伝子の発現が、網羅的に解析されている。マイクロアレイによる遺伝子解析では、発現パターンの特徴から、アレイ上の全遺伝子を網羅的に分類している。この解析には、遺伝子発現プロファイル解析が頻繁に用いられる。



一般に、n個の遺伝子から構成されたマイクロアレイを使用して、k回の独立した実験条件から得られたシグナル強度のデータは、各遺伝子について、k次の特徴ベクトルを与える。そして、遺伝子は、これらの特徴ベクトルによって、特徴空間上に座標を指定されたn個の点の集合であるとみなされる。「発現プロファイル解析」とは、特徴空間上にプロットされた点、すなわち、遺伝子(プロテインアレイの場合はタンパク質)を、判別空間上のいくつかのグループに分類することである。言い換えると、生体内における遺伝子発現の情報を統合し、その情報を比較検討するものである。



これにより、例えば、正常な状態(健常人)では発現している遺伝子が、ある疾患の患者では全く発現してない、または発現量が増加または減少しているなど、疾患患者に特異的な遺伝子発現を捉えることによって、疾患に関与する遺伝子を取得できる。



このように、遺伝子発現プロファイル解析は、機能未知遺伝子の機能予測のために特に重要なツールとなる。



遺伝子発現プロファイル解析において解析対象となるデータは、遺伝子発現比の指標を行列化したものである。例えば、各行に遺伝子群、各列にサンプル群(標的とする表現型)を並べたものであり、この行と列が遺伝子発現プロファイルである。なお、サンプルとは、より具体的には、異なる複数の調査個体や同一個体でのTime Course実験で計測した表現型などを示す。例えば、100種類の遺伝子の発現量を、50個体で計測したとき、行列Aの要素Aij(i行j列の値、1≦i≦100、1≦j≦50)はi番目の遺伝子についてのj番目の個体が示す発現量を示す。



遺伝子発現プロファイル解析における膨大な量のサンプルから得られた結果の解析には、その結果を効率よく解析し、目的とする遺伝子を迅速に発見するための情報処理技術が必要となる。従来、このような技術として、例えば、クラスタリング解析、主成分分析などの特別なクラスタリング解析、系統的解析が行われている(非特許文献1、2など)。



遺伝子発現プロファイル解析は、遺伝子発現量(発現比)を対数変換して行われる。具体的には、対数変換は、発現レベルの比(発現比、ratio)を対数変換した指標(例えば、log2(ratio)など)とするものであり、マイクロアレイ実験によって、ある遺伝子の発現レベルをサンプル間で比較する場合に、主に用いられる。この対数変換を行う理由としては、例えば、log2(ratio)変換であれば、1/4 倍、1/2 倍、1 倍(等発現)、2 倍、4 倍といった発現比を-2, -1, 0, 1, 2 と1 倍を中心として等尺度へ変換でき、研究者にとって理解しやすいこと、統計解析を行う上で妥当であることなどが挙げられる。しかし、研究機関や研究者によって、この対数の底に2, e, 10 などを用いるなど統一性がなく、Web 上などで公開されたデータの直接比較ができないという学際的な問題がある。



また、クラスタリング解析は、多次元の特徴ベクトルに基づいて類似の遺伝子発現プロファイルをもつ遺伝子群やサンプル群を同一のクラスターに分割することができる。そのため、クラスタリング解析では、全サンプルを通してほぼ均一な発現レベルを示すハウスキーピング遺伝子は、同一のクラスターを形成するため、発見が容易である。しかしながら、階層的クラスタリングは、遺伝子の数の増加に伴い計算量が多くなること、また、与えられたデータセットに依存して樹形図のトポロジーが変化しやすい、行列の大きさの増加とともに急激に解析時間が長くなり、計算機のCPUおよびメモリが必要であるなどの欠点も有している。



また、そのようにして得られた膨大な量(万のオーダー)のサンプルや遺伝子のクラスターを視覚的に把握することは困難であるという問題点も有している。そのため、現在、主に、ピアソンの相関係数から大規模クラスターからターゲットとなるクラスターのみを取り出す操作が行われている。しかしながら、得られたクラスターのViewer も必ずしも研究者にとって分かりやすいものではない(図7参照)。



図7に示したtwo-dimensional-display と呼ばれるViewer は、各遺伝子と各サンプルを縦横(もしくは、その逆)に並べたものである。そして、各セルの色やその色の濃淡が、対応するサンプルと遺伝子の発現の強弱を示すように、視覚化されている。



また、主成分分析は、遺伝子発現プロファイルの数値の大きさを直接的に比較する統計手法であり、より高速な解析を行うことが可能である。しかしながら、主成分分析では、高速な解析を行う結果、調査対象の表現型とは無関係なハウスキーピング遺伝子は、各主軸に対して異なるスコア(座標のようなもの)が出力されてしまうため、散布図にプロットした場合にも、検出が困難である。

【非特許文献1】わかる!使える!DNAマイクロアレイデータ解析入門、羊土社、Steen Knudsen (著), 塩島 聡 (翻訳), 辻本 豪三 (翻訳), 松本 治 (翻訳)

【非特許文献2】必ずデータが出るDNAマイクロアレイ実戦マニュアル―基本原理、チップ作製技術からバイオインフォマティクスまで、羊土社、 岡崎 康司 (編集), 林崎 良英

産業上の利用分野


本発明は、新規遺伝子発現解析システムおよび遺伝子発現解析方法に関するものである。

特許請求の範囲 【請求項1】
遺伝子および/またはタンパク質の発現プロファイルデータの対数変換値を解析する発現プロファイル解析システムにおいて、
上記発現プロファイルデータを対数変換する変換手段と、
上記変換手段によって得られた対数変換値を対応分析によって解析する解析手段とを備え、
上記変換手段は、対数変換の指標として、arctan(1/ratio)
(ここで、ratioは、任意の表現型での遺伝子またはタンパク質の発現量と、比較対照となる表現型での遺伝子またはタンパク質の発現量の比である。)
を用いることを特徴とする発現プロファイル解析システム。

【請求項2】
上記解析手段は、上記対数変換値に加えて、上記任意の表現型でのみ発現し、その対照となる表現型では発現しないデータである第1補足データと、当該第1補足データと反対の発現様式のデータである第2補足データと、いずれの表現型においても等発現するデータである第3補足データとを用いて対応分析を行うことを特徴とする請求項1に記載の発現プロファイル解析システム。

【請求項3】
上記解析手段は、上記第1補足データの対応分析結果と、上記第2補足データの対応分析結果とを通る直線を算出することを特徴とする請求項2に記載の発現プロファイル解析システム。

【請求項4】
上記解析手段は、上記直線から、所定の距離の範囲内にある第1有意領域を設定することを特徴とする請求項3に記載の発現プロファイル解析システム。

【請求項5】
上記解析手段は、上記第3補足データの対応分析結果から、所定の距離の範囲内にある第2有意領域を設定することを特徴とする請求項2,3,または4に記載の発現プロファイル解析システム。

【請求項6】
上記解析手段は、上記発現プロファイルデータにおける累積寄与率の算出結果に応じて、上記対応分析の次数を制御することを特徴とする請求項1~5のいずれか1項に記載の発現プロファイル解析システム。

【請求項7】
上記解析手段は、対応分析の解析結果を回転可能な画像データに変換することを特徴とする請求項1~6のいずれか1項に記載の遺伝子発現プロファイル解析システム。

【請求項8】
上記発現プロファイルデータは、マイクロアレイ、マクロアレイ、ディファレンシャルディスプレイの少なくともいずれかによって得られたものであることを特徴とする請求項1~5のいずれか1項に記載の発現プロファイル解析システム。

【請求項9】
遺伝子および/またはタンパク質の発現プロファイルデータの対数変換値を解析する発現プロファイル解析システムの発現プロファイル解析方法において、
上記発現プロファイル解析システムに備えられるコンピュータが、
上記発現プロファイルデータを、arctan(1/ratio)を用いて対数変換する変換ステップと、
(ここで、ratioは、任意の表現型での遺伝子またはタンパク質の発現量と、比較対照となる表現型での遺伝子またはタンパク質の発現量の比である。)
上記変換ステップによって得られた変換値を対応分析する解析ステップとを実行することを特徴とする発現プロファイル解析方法。

【請求項10】
上記解析ステップは、上記対数変換値に加えて、上記任意の表現型でのみ発現し、その対照となる表現型では発現しないデータである第1補足データと、当該第1補足データと反対の発現様式のデータである第2補足データと、いずれの表現型においても等発現するデータである第3補足データとを用いて対応分析を行うことを特徴とする請求項9に記載の発現プロファイル解析方法。

【請求項11】
上記解析ステップは、上記第1補足データの対応分析結果と、上記第2補足データの対応分析結果とを通る直線を算出することを特徴とする請求項10に記載の発現プロファイル解析方法。

【請求項12】
上記解析ステップは、上記直線から、所定の距離の範囲内にある第1有意領域を設定することを特徴とする請求項11に記載の発現プロファイル解析方法。

【請求項13】
上記解析ステップは、上記第3補足データの対応分析結果から、所定の距離の範囲内にある第2有意領域を設定することを特徴とする請求項10,11,または12に記載の発現プロファイル解析方法。

【請求項14】
上記解析ステップは、上記発現プロファイルデータにおける累積寄与率の算出結果に応じて、上記対応分析の次数を制御することを特徴とする請求項9~13のいずれか1項に記載の発現プロファイル解析方法。

【請求項15】
請求項1~8のいずれか1項に記載の発現プロファイル解析システムを動作させるための発現プロファイル解析プログラムであって、コンピュータを上記変換手段および/または解析手段として機能させるための発現プロファイル解析プログラム。

【請求項16】
請求項15に記載の発現プロファイル解析プログラムが記録されたコンピュータ読取り可能な記録媒体。
産業区分
  • 微生物工業
  • 計算機応用
国際特許分類(IPC)
画像

※ 画像をクリックすると拡大します。

JP2003307587thum.jpg
出願権利状態 権利存続中
参考情報 (研究プロジェクト等) CREST 植物の機能と制御 領域
ライセンスをご希望の方、特許の内容に興味を持たれた方は、問合せボタンを押してください。


PAGE TOP

close
close
close
close
close
close
close