Top > Search of Japanese Patents > METHOD, APPARATUS, AND PROGRAM FOR ANALYZING EXPRESSION OF GENE

METHOD, APPARATUS, AND PROGRAM FOR ANALYZING EXPRESSION OF GENE

Patent code P09A014922
File No. NIRS-306
Posted date Dec 11, 2009
Application number P2008-032466
Publication number P2009-193273A
Patent number P5344670
Date of filing Feb 13, 2008
Date of publication of application Aug 27, 2009
Date of registration Aug 23, 2013
Inventor
  • (In Japanese)笠間 康次
  • (In Japanese)安倍 真澄
Applicant
  • (In Japanese)国立研究開発法人量子科学技術研究開発機構
Title METHOD, APPARATUS, AND PROGRAM FOR ANALYZING EXPRESSION OF GENE
Abstract PROBLEM TO BE SOLVED: To provide a method for easily comparing reference profile data (reference PD) with created measurement profile data (measurement PD) and analyzing an expression state of a gene.
SOLUTION: The method includes a reference PD acquisition step S1 of showing, as a first waveform, a reference range of values equivalent to the number of bases based on positions and a detection amount of the values equivalent to the number of bases of DNA fragments, identifying and storing transcript seeds from which a predetermined peak in the first waveform comes, and acquiring the stored reference PD; a measurement PD creation step S2 of creating a measurement PD showing, as a second waveform, a measurement range of values equivalent to the number of bases obtained on the basis of positions and a detection amount of values equivalent to the number of bases of DNA fragments to be measured; a peak association step S3 applying correction processing and associating positions of peaks of a part of or all of at least either the first waveform or the second waveform; and a gene expression analyzing step S4 of reading information of the derivation of associated peak from transcript seed information, identifying the gene of the peak of the measurement PD, and thus, analyzing the expression state of the gene.
Outline of related art and contending technology (In Japanese)


ゲノム科学は「ヒトの遺伝子情報(ヒトゲノム)の解読完了」という象徴的な事件の後、遺伝子発現に関する制御メカニズムの解明、遺伝子産物の機能解明という、いわゆるポストシークエンス研究へと移行しつつある。ポストシークエンス研究を進めると、さまざまな生命現象を解明することができるので学術的に意義が高いだけでなく、医薬品の開発にも多大な貢献をもたらし、高度なオーダーメイド治療等を実現できる可能性がある。そのため、ポストシークエンス研究の進展に対する期待度も非常に大きい。



このようなポストシークエンス研究の一例として、遺伝子の発現状態を解析する遺伝子発現解析が挙げられる。同じ遺伝子でも、生体の状態等によって時々刻々とその発現量が変化しており、オルタナティブスプライシング等によって一つの遺伝子から異なるタンパク質に対応した複数のmRNAが生成されている。また、高等動物や植物では、タンパク質に翻訳されないノンコーディングRNAやマイクロRNAも生成されており、これらが遺伝子発現制御を行っていることや、様々な生物種で保存されていることなども明らかになりつつある。
これらのRNAの中でもタンパク質の発現に直接的に関係のあるmRNAの発現量を解析して遺伝子発現解析を行うことは、前記したように、より高度なオーダーメイド治療等を実現するためにも特に重要である。



遺伝子発現解析を行うための手法としては、遺伝子の発現状態を網羅的に解析することのできるディファレンシャルディスプレイ法やSAGE(Serial Analysis of Gene Expression)法、DNAマイクロアレイ法、DNAチップ法などが広く用いられている。



また、近年、遺伝子発現解析を行うための手法として、網羅的かつより高精度な遺伝子発現解析を可能にした高カバー率遺伝子発現解析法(High Coverage Expression Profiling法(以下、「HiCEP法」と称する。))が開発され、注目を浴びている(例えば、特許文献1参照)。
HiCEP法は、mRNAを逆転写して得られたcDNAを2種類の制限酵素により切断し、これに特殊な塩基配列を有するアダプターと称する20塩基ほどのDNAフラグメントをライゲーションさせ、さらに前記した特殊な塩基配列を有するアダプターと相補的な塩基配列を有する、蛍光標識された選択的PCR用プライマーを用いて選択的PCRを行い、キャピラリー電気泳動によって種々の長さに応じて分離し、これを解析するキャピラリーDNAシーケンサーを利用して、複数のピークを有する一つの波形として表された測定プロファイルデータを得るものである。このようにすると、前記した複数のピークは、一つの波形に、約200程度のピークを有することになる。これは、同じサンプルであれば条件の相違により強度が変わっても原則として同じ泳動位置(プロファイル上のピークの位置)に、同じ遺伝子の転写産物に由来するピークが検出される。



したがって、HiCEP法は、塩基配列が決定されていない未知遺伝子に対してもその発現状態を解析することができるという利点を有しており、発現している遺伝子の全転写産物(全mRNA)に対して解析される転写産物(mRNA)の割合をカバー率と定義するならば、前述した従来法のカバー率が10~30%であるのに対し、HiCEP法は70~80%のカバー率を達成している。さらに、±約20%の微小な変動量を確実に捉えることが可能である。このように、HiCEP法は、従来のDNAマイクロアレイ法等では実現し得なかった高精度・高感度を達成している。



【特許文献1】
国際公開第02/048352号パンフレット

Field of industrial application (In Japanese)


本発明は、発現している複数の遺伝子転写産物に由来する複数のピークを有する一つの波形として表したプロファイルデータを用いて遺伝子の発現状態を解析する遺伝子発現解析方法、遺伝子発現解析装置、および遺伝子発現解析プログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
発現している複数の遺伝子転写産物に由来する複数のピークを一つの波形として表したプロファイルデータを用いて遺伝子の発現状態を解析する遺伝子発現解析方法であって、
複数の遺伝子転写産物を逆転写したcDNAの一部を増幅して得られるDNAフラグメントの塩基数相当値の位置と、その位置における前記遺伝子転写産物の転写量相当の検出量と、に基づいて得られる塩基数相当値の参照範囲を第一の波形として表わし、かつ前記遺伝子転写産物の転写産物種情報として、前記第一の波形中の所定のピークと、そのピークが由来する転写産物種と、を同定して記憶した参照プロファイルデータを予め取得しておく参照プロファイルデータ取得工程と、
複数の遺伝子転写産物を逆転写したcDNAの一部を増幅して得られる測定対象物となるDNAフラグメントの塩基数相当値の位置と、その位置における前記測定対象物の転写量相当の検出量と、に基づいて得られる塩基数相当値の測定範囲を第二の波形として表した測定プロファイルデータを作成する測定プロファイルデータ作成工程と、
前記第一の波形および前記第二の波形のうちの少なくとも一方の一部または全部の領域を補正しピークの位置を調整する補正処理を行い、前記第二の波形中の着目する領域を含む複数のピークと、前記第一の波形における複数のピークと、を対応付けることで、前記着目する領域を含む複数のピークと、当該複数のピークに相当する第一の波形中の複数のピークと、を対応付けるピーク対応付け工程と、
対応付けされた前記測定プロファイルデータのピークの由来する遺伝子転写産物の情報を前記転写産物種情報から読み取り、対応付けされた前記測定プロファイルデータのピークの由来する遺伝子を特定することで遺伝子の発現状態を解析する遺伝子発現解析工程と、
を含み、
前記ピーク対応付け工程は、
前記参照プロファイルデータ取得工程で取得された前記参照プロファイルデータのピークの位置と、前記測定プロファイルデータ作成工程で作成された前記測定プロファイルデータのピークの位置と、が一致する場合は、一致する前記参照プロファイルデータのピークと、前記測定プロファイルデータのピークと、を対応付け、
前記参照プロファイルデータ取得工程で取得された前記参照プロファイルデータのピークの位置と、前記測定プロファイルデータ作成工程で作成された前記測定プロファイルデータのピークの位置と、が一部または全部ずれている場合は、これらのうちの少なくとも一方の波形について、これらの波形の類似度が最も高くなるように一部または全部の領域を補正しピークの位置を調整する補正処理を行った上で、前記参照プロファイルデータのピークと、前記測定プロファイルデータのピークと、を対応付ける
ことを特徴とする遺伝子発現解析方法。

【請求項2】
 
前記参照プロファイルデータ取得工程は、
前記参照プロファイルデータを、
既知のプロファイルデータを保存しているデータベースから取得するか、
前記転写産物種情報から人工的に作成して取得するか、
既知のプロファイルデータ若しくは前記測定プロファイルデータに1つ以上のピークを追加或いは削除することによって取得するか、
前記参照プロファイルデータを複数用いて合成することによって取得するか、または、
前記測定プロファイルデータを複数用いて合成することによって取得する
ことを特徴とする請求項1に記載の遺伝子発現解析方法。

【請求項3】
 
前記ピーク対応付け工程における補正処理が、ガウス関数に基づく関数近似によって行われることを特徴とする請求項1または請求項2に記載の遺伝子発現解析方法。

【請求項4】
 
前記ピーク対応付け工程における補正処理が、
前記参照プロファイルデータのピークの位置を基準として前記測定プロファイルデータのピークの位置を移動させるか、
前記測定プロファイルデータのピークの位置を基準として前記参照プロファイルデータのピークの位置を移動させるか、または、
前記参照プロファイルデータのピークの位置と前記測定プロファイルデータのピークの位置の双方を移動させて、
前記測定プロファイルデータのピークと前記参照プロファイルデータのピークを対応付ける
ことを特徴とする請求項1から請求項3のいずれか1項に記載の遺伝子発現解析方法。

【請求項5】
 
前記遺伝子発現解析工程は、
前記参照プロファイルデータのピークと前記測定プロファイルデータのピークの対応付けができたピークと、対応付けができなかったピークと、が区別できるように表示するとともに、前記参照プロファイルデータのピークに、当該ピークの由来となる遺伝子に関する遺伝子情報が付加されている場合は、当該遺伝子情報を引用することにより前記測定プロファイルデータにおいて対応付けされたピークの遺伝子を特定し、遺伝子の発現状態を解析する
ことを特徴とする請求項1から請求項4のいずれか1項に記載の遺伝子発現解析方法。

【請求項6】
 
前記遺伝子発現解析工程には、
前記ピーク対応付け工程で対応付けができなかったピークについて、当該ピークに関する関連情報を付加する工程が含まれている
ことを特徴とする請求項1から請求項5のいずれか1項に記載の遺伝子発現解析方法。

【請求項7】
 
前記関連情報が、前記波形の類似度に関する相関係数を基にした評価値、ピーク位置、プライマーセット、発現強度、ピーク形状の特徴、およびサンプルの細胞情報や実験情報のうち少なくとも1つを含んでいる
ことを特徴とする請求項6に記載の遺伝子発現解析方法。

【請求項8】
 
発現している複数の遺伝子転写産物に由来する複数のピークを一つの波形として表したプロファイルデータを用いて遺伝子の発現状態を解析する遺伝子発現解析装置であって、
複数の遺伝子転写産物を逆転写したcDNAの一部を増幅して得られるDNAフラグメントの塩基数相当値の位置と、その位置における前記遺伝子転写産物の転写量相当の検出量と、に基づいて得られる塩基数相当値の参照範囲を第一の波形として表わし、かつ前記遺伝子転写産物の転写産物種情報として、前記第一の波形中の所定のピークと、そのピークが由来する転写産物種と、を同定して記憶した参照プロファイルデータを予め取得しておく参照プロファイルデータ取得手段と、
複数の遺伝子転写産物を逆転写したcDNAの一部を増幅して得られる測定対象物となるDNAフラグメントの塩基数相当値の位置と、その位置における前記測定対象物の転写量相当の検出量と、に基づいて得られる塩基数相当値の測定範囲を第二の波形として表した測定プロファイルデータを作成する測定プロファイルデータ作成手段と、
前記第一の波形および前記第二の波形のうちの少なくとも一方の一部または全部の領域を補正しピークの位置を調整する補正処理を行い、前記第二の波形中の着目する領域を含む複数のピークと、前記第一の波形における複数のピークと、を対応付けることで、前記着目する領域を含む複数のピークと、当該複数のピークに相当する第一の波形中の複数のピークと、を対応付けるピーク対応付け手段と、
対応付けされた前記測定プロファイルデータのピークの由来する遺伝子転写産物の情報を前記転写産物種情報から読み取り、対応付けされた前記測定プロファイルデータのピークの由来する遺伝子を特定することで遺伝子の発現状態を解析する遺伝子発現解析手段と、
を有し、
前記ピーク対応付け手段は、
前記参照プロファイルデータ取得手段で取得された前記参照プロファイルデータのピークの位置と、前記測定プロファイルデータ作成手段で作成された前記測定プロファイルデータのピークの位置と、が一致する場合は、一致する前記参照プロファイルデータのピークと、前記測定プロファイルデータのピークと、を対応付け、
前記参照プロファイルデータ取得手段で取得された前記参照プロファイルデータのピークの位置と、前記測定プロファイルデータ作成手段で作成された前記測定プロファイルデータのピークの位置と、が一部または全部ずれている場合は、これらのうちの少なくとも一方の波形について、これらの波形の類似度が最も高くなるように一部または全部の領域を補正しピークの位置を調整する補正処理を行った上で、前記参照プロファイルデータのピークと、前記測定プロファイルデータのピークと、を対応付ける
ことを特徴とする遺伝子発現解析装置。

【請求項9】
 
前記参照プロファイルデータ取得手段は、
前記参照プロファイルデータを、
既知のプロファイルデータを保存しているデータベースから取得するか、
前記転写産物種情報から人工的に作成して取得するか、
既知のプロファイルデータ若しくは前記測定プロファイルデータに1つ以上のピークを追加或いは削除することによって取得するか、
前記参照プロファイルデータを複数用いて合成することによって取得するか、または、
前記測定プロファイルデータを複数用いて合成することによって取得する
ことを特徴とする請求項8に記載の遺伝子発現解析装置。

【請求項10】
 
前記ピーク対応付け手段における補正処理が、ガウス関数に基づく関数近似によって行われることを特徴とする請求項8または請求項9に記載の遺伝子発現解析装置。

【請求項11】
 
前記ピーク対応付け手段における補正処理が、
前記参照プロファイルデータのピークの位置を基準として前記測定プロファイルデータのピークの位置を移動させるか、
前記測定プロファイルデータのピークの位置を基準として前記参照プロファイルデータのピークの位置を移動させるか、または、
前記参照プロファイルデータのピークの位置と前記測定プロファイルデータのピークの位置の双方を移動させて、
前記測定プロファイルデータのピークと前記参照プロファイルデータのピークを対応付ける
ことを特徴とする請求項8から請求項10のいずれか1項に記載の遺伝子発現解析装置。

【請求項12】
 
前記遺伝子発現解析手段は、
前記参照プロファイルデータのピークと前記測定プロファイルデータのピークの対応付けができたピークと、対応付けができなかったピークと、が区別できるように表示するとともに、前記参照プロファイルデータのピークに、当該ピークの由来となる遺伝子に関する遺伝子情報が付加されている場合は、当該遺伝子情報を引用することにより前記測定プロファイルデータにおいて対応付けされたピークの遺伝子を特定し、遺伝子の発現状態を解析する
ことを特徴とする請求項8から請求項11のいずれか1項に記載の遺伝子発現解析装置。

【請求項13】
 
前記遺伝子発現解析手段には、
前記ピーク対応付け手段で対応付けができなかったピークについて、当該ピークに関する関連情報を付加する手段が含まれている
ことを特徴とする請求項8から請求項12のいずれか1項に記載の遺伝子発現解析装置。

【請求項14】
 
前記関連情報が、前記波形の類似度に関する相関係数を基にした評価値、ピーク位置、プライマーセット、発現強度、ピーク形状の特徴、およびサンプルの細胞情報や実験情報のうち少なくとも1つを含んでいる
ことを特徴とする請求項13に記載の遺伝子発現解析装置。

【請求項15】
 
請求項1から請求項7に記載の遺伝子発現解析方法をコンピュータに実行させる
ことを特徴とする遺伝子発現解析プログラム。
IPC(International Patent Classification)
F-term
  • 5L049DD06
Drawing

※Click image to enlarge.

JP2008032466thum.jpg
State of application right Registered
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close