TOP > 国内特許検索 > 塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法

塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法

国内特許コード P110002068
掲載日 2011年3月31日
出願番号 特願2009-539130
登録番号 特許第5288355号
出願日 平成20年10月31日(2008.10.31)
登録日 平成25年6月14日(2013.6.14)
国際出願番号 JP2008069897
国際公開番号 WO2009057757
国際出願日 平成20年10月31日(2008.10.31)
国際公開日 平成21年5月7日(2009.5.7)
優先権データ
  • 特願2007-283480 (2007.10.31) JP
発明者
  • 宮尾 安▲藝▼雄
出願人
  • 国立研究開発法人農業・食品産業技術総合研究機構
発明の名称 塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法
発明の概要 数十塩基程度の短い大量の塩基配列から既存の塩基配列を参照することなく全ゲノム塩基配列を構築することができる塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法を提供することを課題とする。本発明は、遺伝的変異を持つ2つの親系統とその分離後世代の複数の個体の塩基配列をそれぞれ解析し、塩基配列の繋ぎ合わせの指標として変異部分の分離を参照し、その分離の正当性を確認しながら塩基配列の断片を繋ぎ合わせる。
従来技術、競合技術の概要


近年、ヒトを含む多くの生物の全ゲノム塩基配列が決定されている。これらの塩基配列の決定には、塩基配列決定装置(シーケンサー)が用いられている。現在、塩基配列決定装置は、サンプルを解析して、1つのサンプルあたり500~1500bp程度の塩基配列を得ることができる。全ゲノム塩基配列は、非常に多くのサンプルを解析して個々の塩基配列データの同じ部分(相同部分)をオーバーラップさせて繋ぎ合わせることにより、完成する。塩基配列決定装置から得られた500~1500bp程度の塩基配列に基づくオーバーラップさせる部分の検出とその繋ぎ合わせには、Phred/Phrap(非特許文献1)、Cap3(非特許文献2)、Arachne(非特許文献3)等のプログラムを用いるのが一般的である。また、BLATという、BLASTのようなアライメントツールが存在する(非特許文献4)。BLATでは、ゲノムをオーバーラップしないK-merに分解し、RAM上にインデックスを置くことで、処理を高速化している。



Phred/Phrapは、事実上標準となっているプログラムであり、塩基配列の重なり合いをSmith-Watermanアルゴリズムで計算し、それぞれの塩基の品質データを勘案しながら連結した塩基配列を出力する。Cap3は、個々の塩基配列の末端領域に存在する不確かな部分を排除しながら塩基配列を連結することにより、より確度の高い塩基配列を出力する。しかし、Phred/PhrapおよびCap3は、まったく同一の繰り返し配列が存在するとそれを見分けることが出来ない。一方、Arachneは、各サンプルの塩基配列を両端から解析し、その解析情報を加えて塩基配列を連結する。そのため、Arachneは、繰り返し配列が存在していても、比較的正確に塩基配列を連結することができる。



【非特許文献1】
Ewing B, Green P., 「Base-calling of automated sequencer traces using phred. II. Error probabilities.」, Genome Res., 8(3), 186-194, 1998.
【非特許文献2】
Huang X, Madan A.,「CAP3: A DNA sequence assembly program.」, Genome Res., 9(9), 868-877, 1999.
【非特許文献3】
Batzoglou S et al., 「ARACHNE: a whole-genome shotgun assembler.」, Genome Res., 12(1), 177-189, 2002.
【非特許文献4】
W. James Kent, 「BLAT - The BLAST-Like Alignment Tool」, Genome Res., 12, 656-664, 2002

産業上の利用分野


本発明は、ゲノム全体の塩基配列を決定する塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法に関するものである。

特許請求の範囲 【請求項1】
制御手段と記憶手段とを備えた情報処理装置に実行させる塩基配列決定プログラムであって、
前記記憶手段は、遺伝的多型を持つ複数の親個体および複数のその後世代個体のそれぞれに由来する複数の塩基配列を格納したデータベースを記憶し、
前記制御手段に、
対象とする前記親個体の前記塩基配列である対象塩基配列に基づいて、前記記憶手段に記憶した前記データベースから、当該対象塩基配列に繋ぎ合せる前記塩基配列を検索する検索ステップと、
前記検索ステップで検索した前記塩基配列に基づいて、前記親個体間における前記遺伝的多型を検出する検出ステップと、
前記検索ステップで検索した前記塩基配列に同一の前記親個体から検索したものが複数存在するか否かを確認する確認ステップと、
前記検出ステップで前記遺伝的多型が検出され且つ前記確認ステップで複数存在すると確認されなかった場合、前記検索ステップで検索した前記後世代個体の前記塩基配列に基づいて、前記遺伝的多型が検出された部位での前記後世代個体の遺伝子型を調査する調査ステップと、
前記調査ステップで調査した前記後世代個体の前記遺伝子型と既に調査済みの前記後世代個体の前記遺伝子型とが一致するか否かを判定する判定ステップと、
前記判定ステップで一致すると判定された場合、前記検索ステップで検索した前記親個体の前記塩基配列に基づいて前記対象塩基配列を伸長する、および、前記確認ステップで複数存在すると確認された場合、前記検索ステップで検索した同一の前記親個体の前記塩基配列ごとに前記対象塩基配列を別々に伸長する伸長ステップと、
を実行させること
を特徴とする塩基配列決定プログラム。

【請求項2】
前記データベースは、前記個体の前記塩基配列と前記個体を一意に識別するための個体識別情報とを相互に関連付けてなるリレーショナルデータベースであり、
前記検索ステップは、データベース言語であるSQLで前記塩基配列を検索すること
を特徴とする請求項に記載の塩基配列決定プログラム。

【請求項3】
前記記憶手段は、前記データベースに記憶した前記塩基配列に対して作成された、前方一致検索が可能なインデックスをさらに記憶し、
前記検索ステップは、前記インデックスを参照して前記塩基配列を前方一致検索すること
を特徴とする請求項に記載の塩基配列決定プログラム。

【請求項4】
制御手段と記憶手段とを備えた塩基配列決定装置であって、
前記記憶手段は、遺伝的多型を持つ複数の親個体および複数のその後世代個体のそれぞれに由来する複数の塩基配列を格納したデータベースを記憶し、
前記制御手段は、
対象とする前記親個体の前記塩基配列である対象塩基配列に基づいて、前記記憶手段に記憶した前記データベースから、当該対象塩基配列に繋ぎ合せる前記塩基配列を検索する検索手段と、
前記検索手段で検索した前記塩基配列に基づいて、前記親個体間における前記遺伝的多型を検出する検出手段と、
前記検索手段で検索した前記塩基配列に同一の前記親個体から検索したものが複数存在するか否かを確認する確認手段と、
前記検出手段で前記遺伝的多型が検出され且つ前記確認手段で複数存在すると確認されなかった場合、前記検索手段で検索した前記後世代個体の前記塩基配列に基づいて、前記遺伝的多型が検出された部位での前記後世代個体の遺伝子型を調査する調査手段と、
前記調査手段で調査した前記後世代個体の前記遺伝子型と既に調査済みの前記後世代個体の前記遺伝子型とが一致するか否かを判定する判定手段と、
前記判定手段で一致すると判定された場合、前記検索手段で検索した前記親個体の前記塩基配列に基づいて前記対象塩基配列を伸長する、および、前記確認手段で複数存在すると確認された場合、前記検索手段で検索した同一の前記親個体の前記塩基配列ごとに前記対象塩基配列を別々に伸長する伸長手段と、
を備えたこと
を特徴とする塩基配列決定装置。

【請求項5】
前記データベースは、前記個体の前記塩基配列と前記個体を一意に識別するための個体識別情報とを相互に関連付けてなるリレーショナルデータベースであり、
前記検索手段は、データベース言語であるSQLで前記塩基配列を検索すること
を特徴とする請求項に記載の塩基配列決定装置。

【請求項6】
前記記憶手段は、前記データベースに記憶した前記塩基配列に対して作成された、前方一致検索が可能なインデックスをさらに記憶し、
前記検索手段は、前記インデックスを参照して前記塩基配列を前方一致検索すること
を特徴とする請求項に記載の塩基配列決定装置。

【請求項7】
制御手段と記憶手段とを備えた情報処理装置で実行する塩基配列決定方法であって、
前記記憶手段は、遺伝的多型を持つ複数の親個体および複数のその後世代個体のそれぞれに由来する複数の塩基配列を格納したデータベースを記憶し、
前記制御手段で、
対象とする前記親個体の前記塩基配列である対象塩基配列に基づいて、前記記憶手段に記憶した前記データベースから、当該対象塩基配列に繋ぎ合せる前記塩基配列を検索する検索ステップと、
前記検索ステップで検索した前記塩基配列に基づいて、前記親個体間における前記遺伝的多型を検出する検出ステップと、
前記検索ステップで検索した前記塩基配列に同一の前記親個体から検索したものが複数存在するか否かを確認する確認ステップと、
前記検出ステップで前記遺伝的多型が検出され且つ前記確認ステップで複数存在すると確認されなかった場合、前記検索ステップで検索した前記後世代個体の前記塩基配列に基づいて、前記遺伝的多型が検出された部位での前記後世代個体の遺伝子型を調査する調査ステップと、
前記調査ステップで調査した前記後世代個体の前記遺伝子型と既に調査済みの前記後世代個体の前記遺伝子型とが一致するか否かを判定する判定ステップと、
前記判定ステップで一致すると判定された場合、前記検索ステップで検索した前記親個体の前記塩基配列に基づいて前記対象塩基配列を伸長する、および、前記確認ステップで複数存在すると確認された場合、前記検索ステップで検索した同一の前記親個体の前記塩基配列ごとに前記対象塩基配列を別々に伸長する伸長ステップと、
を実行すること
を特徴とする塩基配列決定方法。

【請求項8】
前記データベースは、前記個体の前記塩基配列と前記個体を一意に識別するための個体識別情報とを相互に関連付けてなるリレーショナルデータベースであり、
前記検索ステップは、データベース言語であるSQLで前記塩基配列を検索すること
を特徴とする請求項に記載の塩基配列決定方法。

【請求項9】
前記記憶手段は、前記データベースに記憶した前記塩基配列に対して作成された、前方一致検索が可能なインデックスをさらに記憶し、
前記検索ステップは、前記インデックスを参照して前記塩基配列を前方一致検索すること
を特徴とする請求項に記載の塩基配列決定方法。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2009539130thum.jpg
出願権利状態 登録


PAGE TOP

close
close
close
close
close
close
close