TOP > 国内特許検索 > 検索システム、検索方法、及び検索プログラム

検索システム、検索方法、及び検索プログラム

国内特許コード P190015955
整理番号 S2018-0966-N0
掲載日 2019年4月2日
出願番号 特願2018-159778
公開番号 特開2020-035115
出願日 平成30年8月28日(2018.8.28)
公開日 令和2年3月5日(2020.3.5)
発明者
  • 藤芳 明生
出願人
  • 国立大学法人茨城大学
発明の名称 検索システム、検索方法、及び検索プログラム
発明の概要 【課題】簡単かつ柔軟に化学物質を検索することのできる構成と手法を提供する。
【解決手段】検索システムは、化学構造を表わす分子記述言語に正規表現を適用して拡張した表現形式の正規表現拡張文字列を取得する入力部と、前記正規表現拡張文字列をもとに、データベースから該当する化学物質を抽出する検索処理部と、前記検索処理部による検索結果を出力する出力部と、を有する。
【選択図】図1
従来技術、競合技術の概要

分子の化学構造を文字列で表現する方法として、SMILES(Simplified Molecular Input Line Entry System)、SMARTS(SMILES Arbitrary Target Specification)などの表現法が用いられている。SMILESは、分子の化学構造をASCIIコートの英数字と記号で文字列化した表記法であり、構造検索やデータ入力などに広く用いられている。

SMARTSは、SMILESを検索クエリに拡張した表記法である。SMARTSでは、結合の種類(二重結合または三重結合)や基の種類(芳香族または脂肪族)など、簡単な構造検索の条件を表記することができる(たとえば非特許文献1参照)。SMILESやSMARTSの外にも、InChI(Information Chemical Identifier)など、いくつかの表記法がある。

一方、文書の検索において、正規表現が利用されている。文書の検索・照合において、文字列の正規表現から有限状態オートマトンを構築し、有限状態オートマトンを用いて文字列のマッチングを行う手法が提案されている(たとえば、特許文献1参照)。

産業上の利用分野

本発明は、化学構造の検索システム、検索方法、及び検索プログラムに関する。

特許請求の範囲 【請求項1】
化学構造を表わす分子記述言語に正規表現を適用して拡張した表現形式の正規表現拡張文字列を取得する入力部と、
前記正規表現拡張文字列をもとに、データベースから該当する化学物質を抽出する検索処理部と、
前記検索処理部による検索結果を出力する出力部と、
を有することを特徴とする検索システム。

【請求項2】
前記検索処理部の入力に接続されて、前記正規表現拡張文字列をグラフオートマトンに変換する変換部、
をさらに有し、
前記検索処理部は、前記グラフオートマトンにしたがって、前記グラフオートマトンで定義される状態遷移を満たす化学物質を前記データベースから抽出することを特徴とする請求項1に記載の検索システム。

【請求項3】
前記検索処理部は、前記正規表現拡張文字列を先頭から順に読み込み、前記正規表現拡張文字列を、前記化学構造の状態遷移を規定する前記グラフオートマトンに変換することを特徴とする請求項2に記載の検索システム。

【請求項4】
前記グラフオートマトンを保存する記憶部、
をさらに有することを特徴とする請求項2または3に記載の検索システム。

【請求項5】
前記入力部は、前記正規表現拡張文字列を入力として受け取り、前記正規表現拡張文字列を前記検索処理部へ渡すことを特徴とする請求項1に記載の検索システム。

【請求項6】
前記入力部は、既存の分子記述文字列または化学構造式を入力として受け取り、前記既存の分子記述文字列または前記化学構造式を前記正規表現拡張文字列に変換して、前記検索処理部に渡すことを特徴とする請求項1に記載の検索システム。

【請求項7】
前記検索システムは、ネットワークを介して接続される1以上の端末装置を含み、
前記端末装置は、前記入力部の機能の少なくとも一部と、前記出力部の機能の少なくとも一部を有することを特徴とする請求項1~6のいずれか1項に記載の検索システム。

【請求項8】
情報処理装置において、化学構造を表わす分子記述言語に正規表現を適用して拡張した表現形式の正規表現拡張文字列を取得し、
前記正規表現拡張文字列をもとに、データベースから該当する化学物質を抽出し、
抽出された結果を出力する
工程を含むことを特徴とする検索方法。

【請求項9】
取得された前記正規表現拡張文字列をグラフオートマトンに変換するステップ、
をさらに有し、
前記化学物質の抽出は、前記グラフオートマトンにしたがって、前記グラフオートマトンで定義される状態遷移を満たす化学物質を前記データベースから抽出することを特徴とする請求項8に記載の検索方法。

【請求項10】
コンピュータに、
化学構造を表わす分子記述言語に正規表現を適用して拡張した表現形式の正規表現拡張文字列を取得する手順と、
前記正規表現拡張文字列をもとに、データベースから該当する化学物質を抽出する手順と、
抽出された結果を出力する手順と、
を実行させる検索プログラム。

【請求項11】
取得された前記正規表現拡張文字列をグラフオートマトンに変換する手順、
をさらに有し、
前記化学物質を抽出する手順は、前記グラフオートマトンにしたがって、前記グラフオートマトンで定義される状態遷移を満たす化学物質を前記データベースから抽出することを特徴とする請求項10に記載の検索プログラム。
国際特許分類(IPC)
  • G06F  16/00    
画像

※ 画像をクリックすると拡大します。

JP2018159778thum.jpg
出願権利状態 公開
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください


PAGE TOP

close
close
close
close
close
close
close