Top > Search of Japanese Patents > RETRIEVAL SYSTEM, RETRIEVAL METHOD AND RETRIEVAL PROGRAM

RETRIEVAL SYSTEM, RETRIEVAL METHOD AND RETRIEVAL PROGRAM UPDATE_EN

Patent code P190015955
File No. S2018-0966-N0
Posted date Apr 2, 2019
Application number P2018-159778
Publication number P2020-035115A
Date of filing Aug 28, 2018
Date of publication of application Mar 5, 2020
Inventor
  • (In Japanese)藤芳 明生
Applicant
  • (In Japanese)国立大学法人茨城大学
Title RETRIEVAL SYSTEM, RETRIEVAL METHOD AND RETRIEVAL PROGRAM UPDATE_EN
Abstract PROBLEM TO BE SOLVED: To provide a configuration and a scheme that can retrieve a chemical substance simply and flexibly.
SOLUTION: A retrieval system includes: an input part acquiring a regular expression extended character string of an expression form obtained by application of a regular expression to a molecular description language representing a chemical constitution to extend; a retrieval processing part extracting a corresponding chemical substance from a database on the basis of the regular expression extended character string; and an output part outputting the retrieval result by the retrieval processing part.
Outline of related art and contending technology (In Japanese)

分子の化学構造を文字列で表現する方法として、SMILES(Simplified Molecular Input Line Entry System)、SMARTS(SMILES Arbitrary Target Specification)などの表現法が用いられている。SMILESは、分子の化学構造をASCIIコートの英数字と記号で文字列化した表記法であり、構造検索やデータ入力などに広く用いられている。

SMARTSは、SMILESを検索クエリに拡張した表記法である。SMARTSでは、結合の種類(二重結合または三重結合)や基の種類(芳香族または脂肪族)など、簡単な構造検索の条件を表記することができる(たとえば非特許文献1参照)。SMILESやSMARTSの外にも、InChI(Information Chemical Identifier)など、いくつかの表記法がある。

一方、文書の検索において、正規表現が利用されている。文書の検索・照合において、文字列の正規表現から有限状態オートマトンを構築し、有限状態オートマトンを用いて文字列のマッチングを行う手法が提案されている(たとえば、特許文献1参照)。

Field of industrial application (In Japanese)

本発明は、化学構造の検索システム、検索方法、及び検索プログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
化学構造を表わす分子記述言語に正規表現を適用して拡張した表現形式の正規表現拡張文字列を取得する入力部と、
前記正規表現拡張文字列をもとに、データベースから該当する化学物質を抽出する検索処理部と、
前記検索処理部による検索結果を出力する出力部と、
を有することを特徴とする検索システム。

【請求項2】
 
前記検索処理部の入力に接続されて、前記正規表現拡張文字列をグラフオートマトンに変換する変換部、
をさらに有し、
前記検索処理部は、前記グラフオートマトンにしたがって、前記グラフオートマトンで定義される状態遷移を満たす化学物質を前記データベースから抽出することを特徴とする請求項1に記載の検索システム。

【請求項3】
 
前記検索処理部は、前記正規表現拡張文字列を先頭から順に読み込み、前記正規表現拡張文字列を、前記化学構造の状態遷移を規定する前記グラフオートマトンに変換することを特徴とする請求項2に記載の検索システム。

【請求項4】
 
前記グラフオートマトンを保存する記憶部、
をさらに有することを特徴とする請求項2または3に記載の検索システム。

【請求項5】
 
前記入力部は、前記正規表現拡張文字列を入力として受け取り、前記正規表現拡張文字列を前記検索処理部へ渡すことを特徴とする請求項1に記載の検索システム。

【請求項6】
 
前記入力部は、既存の分子記述文字列または化学構造式を入力として受け取り、前記既存の分子記述文字列または前記化学構造式を前記正規表現拡張文字列に変換して、前記検索処理部に渡すことを特徴とする請求項1に記載の検索システム。

【請求項7】
 
前記検索システムは、ネットワークを介して接続される1以上の端末装置を含み、
前記端末装置は、前記入力部の機能の少なくとも一部と、前記出力部の機能の少なくとも一部を有することを特徴とする請求項1~6のいずれか1項に記載の検索システム。

【請求項8】
 
情報処理装置において、化学構造を表わす分子記述言語に正規表現を適用して拡張した表現形式の正規表現拡張文字列を取得し、
前記正規表現拡張文字列をもとに、データベースから該当する化学物質を抽出し、
抽出された結果を出力する
工程を含むことを特徴とする検索方法。

【請求項9】
 
取得された前記正規表現拡張文字列をグラフオートマトンに変換するステップ、
をさらに有し、
前記化学物質の抽出は、前記グラフオートマトンにしたがって、前記グラフオートマトンで定義される状態遷移を満たす化学物質を前記データベースから抽出することを特徴とする請求項8に記載の検索方法。

【請求項10】
 
コンピュータに、
化学構造を表わす分子記述言語に正規表現を適用して拡張した表現形式の正規表現拡張文字列を取得する手順と、
前記正規表現拡張文字列をもとに、データベースから該当する化学物質を抽出する手順と、
抽出された結果を出力する手順と、
を実行させる検索プログラム。

【請求項11】
 
取得された前記正規表現拡張文字列をグラフオートマトンに変換する手順、
をさらに有し、
前記化学物質を抽出する手順は、前記グラフオートマトンにしたがって、前記グラフオートマトンで定義される状態遷移を満たす化学物質を前記データベースから抽出することを特徴とする請求項10に記載の検索プログラム。
IPC(International Patent Classification)
  • G06F  16/00    
Drawing

※Click image to enlarge.

JP2018159778thum.jpg
State of application right Published
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close