TOP > 国内特許検索 > 毒性予測方法及びその利用 > 明細書

明細書 :毒性予測方法及びその利用

発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2019-020791 (P2019-020791A)
公開日 平成31年2月7日(2019.2.7)
発明の名称または考案の名称 毒性予測方法及びその利用
国際特許分類 G06Q  10/04        (2012.01)
FI G06Q 10/04
請求項の数または発明の数 18
出願形態 OL
全頁数 22
出願番号 特願2017-135877 (P2017-135877)
出願日 平成29年7月12日(2017.7.12)
発明者または考案者 【氏名】澤田 敏彦
【氏名】和佐田 裕昭
【氏名】橋本 智裕
出願人 【識別番号】304019399
【氏名又は名称】国立大学法人岐阜大学
個別代理人の代理人 【識別番号】100114362、【弁理士】、【氏名又は名称】萩野 幹治
審査請求 未請求
テーマコード 5L049
Fターム 5L049DD01
要約 【課題】精度及び信頼性が高く、且つその評価が容易な予測結果が得られる化合物毒性予測手段を提供することを課題とする。
【解決手段】(1)使用者が入力した供試化合物の構造情報を受信するステップと、(2)受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成するステップと、(3)前記3次元分子構造を用い、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される分子記述子を少なくとも一つ含む、1個以上の分子記述子の値を算出するステップと、(4)前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出するステップであって、毒性有りの確率と毒性無しの確率を足し合わせると100%であるステップと、及び(5)算出した前記確率を出力するステップと、を実行し、化合物の毒性を予測する。
【選択図】図1
特許請求の範囲 【請求項1】
(1)使用者が入力した供試化合物の構造情報を受信するステップと、
(2)受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成するステップと、
(3)前記3次元分子構造を用い、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される分子記述子を少なくとも一つ含む、1個以上の分子記述子の値を生成するステップと、
(4)前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出するステップであって、毒性有りの確率と毒性無しの確率を足し合わせると100%であるステップと、及び
(5)算出した前記確率を出力するステップと、
を含む、化合物の毒性を予測する方法。
【請求項2】
ステップ(4)が、以下のステップからなる、請求項1に記載の予測方法。
(4-1)前記分子記述子の値を正規化するステップ、及び
(4-2)正規化済みの値を用いて前記供試化合物の毒性の有無の確率を算出するステップ。
【請求項3】
前記3次元分子構造が、半経験的分子軌道法によって構造が最適化された3次元分子構造、非経験的分子軌道法によって構造が最適化された3次元分子構造、密度汎関数法によって構造が最適化された3次元分子構造、及び分子力学法、半経験的分子軌道法、非経験的分子軌道法又は密度汎関数法によって立体配座探索された3次元分子構造、分子力学法、半経験的分子軌道法、非経験的分子軌道法及び密度汎関数法の任意の組合せによって構造が最適された3次元分子構造、からなる群より選択される1個以上の3次元分子構造である、請求項1又は2に記載の予測方法。
【請求項4】
前記3次元分子構造が、半経験的分子軌道法によって構造が最適化された2個以上の3次元分子構造である、請求項1又は2に記載の予測方法。
【請求項5】
前記1個以上の分子記述子が、1個以上の3次元分子記述子と1個以上の量子化学分子記述子を含む、請求項1~4のいずれか一項に記載の予測方法。
【請求項6】
前記1個以上の分子記述子が、1個以上の3次元分子記述子、1個以上の量子化学分子記述子、1個以上の2次元分子記述子、1個以上の1次元分子記述子、1個以上の0次元分子記述子、を含む、請求項1~4のいずれか一項に記載の予測方法。
【請求項7】
前記毒性予測モデルが、毒性の有無が既知の複数の化合物の正規化済み分子記述子の値を用いた機械学習で構築した毒性予測モデルである、請求項1~6のいずれか一項に記載の予測方法。
【請求項8】
前記機械学習が、サポートベクターマシン、ベイジアンネットワーク、ニューラルネットワーク、アダブースト、ランダムフォレスト及びアクティブラーニングからなる群より選択される一つ以上の機械学習である、請求項7に記載の予測方法。
【請求項9】
前記供試化合物の化学式を生成するステップを更に含み、
ステップ(5)では、生成した化学式と前記確率を関連づけて出力する、請求項1~8のいずれか一項に記載の予測方法。
【請求項10】
前記供試化合物が2個以上であり、
ステップ(5)では、供試化合物毎に前記確率を出力する、請求項1~9のいずれか一項に記載の予測方法。
【請求項11】
ステップ(5)において、前記確率とともに、前記供試化合物の毒性の有無の判定結果を出力する、請求項1~10のいずれか一項に記載の予測方法。
【請求項12】
ステップ(5)の出力が、表形式での表示である、請求項1~11のいずれか一項に記載の予測方法。
【請求項13】
前記毒性が、細菌を用いた復帰突然変異試験で判定される変異原性である、請求項1~12のいずれか一項に記載の予測方法。
【請求項14】
供試化合物の構造情報を入力するための入力手段と、
使用者が入力した供試化合物の構造情報を受信するための受信手段と、
受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成するための第1生成手段と、
前記3次元分子構造を用い、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される分子記述子を少なくとも一つ含む、1個以上の分子記述子の値を算出するための第1算出手段と、
前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出するための算出手段であって、毒性有りの確率と毒性無しの確率を足し合わせると100%である第2算出手段と、及び
算出した前記確率を出力するための出力手段と、
を含む、化合物の毒性を予測するシステム。
【請求項15】
前記入力手段として機能する入力装置と、
前記第1生成手段、前記第1算出手段及び前記第2算出手段として機能する演算装置と、
前記出力手段として機能する出力装置と、
主記憶装置と、及び
システムの制御を行う制御装置と、
を含む、請求項14に記載のシステム。
【請求項16】
プログラムが格納される補助記憶装置を更に備える、請求項15に記載のシステム。
【請求項17】
使用者が入力した供試化合物の構造情報を受信する処理と、
受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成する処理と、
前記3次元分子構造を用い、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される分子記述子を少なくとも一つ含む、1個以上の分子記述子の値を算出する処理と、
前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出する処理であって、毒性有りの確率と毒性無しの確率を足し合わせると100%である処理と、及び
算出した前記確率を出力する処理と、
をコンピュータに実行させるためのプログラム。
【請求項18】
請求項17に記載のプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
発明の詳細な説明 【技術分野】
【0001】
本発明は化合物の毒性予測に関する。詳しくは、化合物の毒性を予測する方法、システム及びプログラムに関する。
【背景技術】
【0002】
化合物の毒性は、in vitroやin vivoの試験によって、各種毒性指標(例えばhERG阻害、生分解性、変異原性)に基づき評価される。各毒性指標には固有の判定基準が設定され、当該判定基準に従い、毒性の有無が判定される。毒性評価のための試験には多くの時間と費用がかかるため、事前に毒性を予測し、試験に供する化合物(候補化合物)を事前に選定(絞りこむ)することが望まれる。即ち、実際の試験を行うことなく化合物の毒性を予測するニーズが存在する。予め毒性を予測できれば、候補化合物の数の低減に伴い、試験に要する時間及び費用を削減できる。その上、仮想の化合物に代表される、実際の試験が行えない又は困難な化合物の毒性も把握できることになる。この利点は、特に新規化合物の開発において重要であり、新規化合物の設計効率を高め、成功率向上と開発費削減に寄与する。化合物開発における動物実験抑制の世界的動向(REACH規則)を受けて、化合物の毒性予測に対する需要は一層高まっている。
【0003】
これまでに開発された毒性予測システム/プログラム等では、一般に、供試化合物に毒性が有る又は無い、との判定結果を予測精度とともに出力する(例えば特許文献1~3、非特許文献1~5を参照)。予測精度として、交差検証又は外部検証における一致率が用いられることが多い。一致率の値が高いほど予測精度が高いと判断される。一致率は、(化合物の毒性予測結果と化合物の毒性試験結果が一致した数)/(毒性予測した化合物の全数)と定義される。交差検証では、データをトレーニングセットとテストセットに分け、トレーニングセットを用いて予測方法を構築し、構築した予測方法の予測精度を、テストデータを用いて検証する。外部検証では、交差検証に用いたデータから独立したデータを用い、構築した予測方法の予測精度を検証する。交差検証や外部検証を利用したとしても、定性的な判定(即ち、毒性が有又は無)にかわりはなく、化合物間の比較(優劣の判定)は難しい。また、化合物の構造との関係で判定するものではないことから、判定結果の信頼性は高いとはいえない。
【先行技術文献】
【0004】

【特許文献1】国際公開第2009/025045号パンフレット
【特許文献2】国際公開第2009/078096号パンフレット
【特許文献3】国際公開第2010/016109号パンフレット
【0005】

【非特許文献1】Wang S., ET AL, "Recent developments in computational prediction of HERG blockage", Current Topics in Medicinal Chemistry, (The United Arab Emirates), Bentham Science Publishers, 2013, vol. 13, iss. 11, p. 1317-1326, DOI: 10.2174/15680266113139990036
【非特許文献2】Blay V., ET AL, "Biodegradability Prediction of Fragrant Molecules by Molecular Topology", ACS Sustainable Chemistry and Engineering, (The United States of America), The American Chemical Society Publications, June 2016, vol. 4, iss. 8, p. 4224-4231, DOI: 10.1021/acssuschemeng.6b00717
【非特許文献3】Jolly R., ET AL, "An evaluation of in-house and off-the-shelf in silico models: Implications on guidance for mutagenicity assessment", Regulatory Toxicology and Pharmacology, (The Netherlands), Elsevier B.V., April 2015, vol. 71, iss. 3, p. 388-397, DOI: 10.1016/j.yrtph.2015.01.010
【非特許文献4】Greene N., ET AL, "A practical application of two in silico systems for identification of potentially mutagenic impurities", Regulatory Toxicology and Pharmacology, (The Netherlands), Elsevier B.V., May 2015, vol. 72, iss. 2, p. 335-349, DOI: 10.1016/j.yrtph.2015.05.008
【非特許文献5】Ferrari T., ET AL, "An open source multistep model to predict mutagenicity from statistical analysis and relevant structural alerts", Chemistry Central Journal, (The United Kingdom), Springer Open, July 2010, vol. 4, Suppl. 1, S2, DOI: 10.1186/1752-153X-4-S1-S2
【非特許文献6】Lazar、in silico toxicology gmbh社、ウェブサイトhttps://lazar.in-silico.ch/predict
【非特許文献7】PASS、Vladimir Poroikov ET AL. ウェブサイトhttp://www.pharmaexpert.ru/passonline/
【非特許文献8】HazardExpert Pro、CompuDrug International, Inc.社、ウェブサイトhttp://www.compudrug.com/hazardexpertpro
【非特許文献9】CompuDrug International, Inc.社、ウェブサイトhttp://www.compudrug.com/faq
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、構造情報を利用しつつ化合物の毒性を判定する方法/システムも開発されている。その一つである化合物毒性予測ソフトウェアLazar(非特許文献6)の特徴は、ユーザーが入力した化合物の構造情報に対して毒性有りの確率と毒性無しの確率をそれぞれ算出し、表示することである。しかしながら、毒性有りの確率と毒性無しの確率を足し合わせても確率100%にならず、予測結果の評価が難しい。特に、化合物間の比較が困難である。別の化合物毒性予測ソフトウェアPASS(非特許文献7)も、Laserと同様の問題を抱える。予測結果における、毒性有りの確率と毒性無しの確率を足したものが100%になるソフトウェア(HazardExpert Pro)(非特許文献8)も開発されている。このソフトウェアでは、ユーザーが入力した化合物の構造情報を利用し、毒性フラグメント構造に注目して毒性有りの確率を算出し、表示する。しかしながら、HazardExpert Proを開発したCompuDrug International, Inc.自らが「毒性有りの確率は正確な値ではない」と認めるように(非特許文献9)、その精度、信頼性は高くない。
【0007】
そこで本発明は、精度及び信頼性が高く、且つその評価が容易な予測結果が得られる化合物毒性予測手段を提供することを課題とする。
【課題を解決するための手段】
【0008】
上記課題を解決するため、以下の発明が提供される。
[1](1)使用者が入力した供試化合物の構造情報を受信するステップと、
(2)受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成するステップと、
(3)前記3次元分子構造を用い、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される分子記述子を少なくとも一つ含む、1個以上の分子記述子の値を生成するステップと、
(4)前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出するステップであって、毒性有りの確率と毒性無しの確率を足し合わせると100%であるステップと、及び
(5)算出した前記確率を出力するステップと、
を含む、化合物の毒性を予測する方法。
[2]ステップ(4)が、以下のステップからなる、[1]に記載の予測方法。
(4-1)前記分子記述子の値を正規化するステップ、及び
(4-2)正規化済みの値を用いて前記供試化合物の毒性の有無の確率を算出するステップ。
[3]前記3次元分子構造が、半経験的分子軌道法によって構造が最適化された3次元分子構造、非経験的分子軌道法によって構造が最適化された3次元分子構造、密度汎関数法によって構造が最適化された3次元分子構造、及び分子力学法、半経験的分子軌道法、非経験的分子軌道法又は密度汎関数法によって立体配座探索された3次元分子構造、分子力学法、半経験的分子軌道法、非経験的分子軌道法及び密度汎関数法の任意の組合せによって構造が最適された3次元分子構造、からなる群より選択される1個以上の3次元分子構造である、[1]又は[2]に記載の予測方法。
[4]前記3次元分子構造が、半経験的分子軌道法によって構造が最適化された2個以上の3次元分子構造である、[1]又は[2]に記載の予測方法。
[5]前記1個以上の分子記述子が、1個以上の3次元分子記述子と1個以上の量子化学分子記述子を含む、[1]~[4]のいずれか一項に記載の予測方法。
[6]前記1個以上の分子記述子が、1個以上の3次元分子記述子、1個以上の量子化学分子記述子、1個以上の2次元分子記述子、1個以上の1次元分子記述子、1個以上の0次元分子記述子、を含む、[1]~[4]のいずれか一項に記載の予測方法。
[7]前記毒性予測モデルが、毒性の有無が既知の複数の化合物の正規化済み分子記述子の値を用いた機械学習で構築した毒性予測モデルである、[1]~[6]のいずれか一項に記載の予測方法。
[8]前記機械学習が、サポートベクターマシン、ベイジアンネットワーク、ニューラルネットワーク、アダブースト、ランダムフォレスト及びアクティブラーニングからなる群より選択される一つ以上の機械学習である、[7]に記載の予測方法。
[9]前記供試化合物の化学式を生成するステップを更に含み、
ステップ(5)では、生成した化学式と前記確率を関連づけて出力する、[1]~[8]のいずれか一項に記載の予測方法。
[10]前記供試化合物が2個以上であり、
ステップ(5)では、供試化合物毎に前記確率を出力する、[1]~[9]のいずれか一項に記載の予測方法。
[11]ステップ(5)において、前記確率とともに、前記供試化合物の毒性の有無の判定結果を出力する、[1]~[10]のいずれか一項に記載の予測方法。
[12]ステップ(5)の出力が、表形式での表示である、[1]~[11]のいずれか一項に記載の予測方法。
[13]前記毒性が、細菌を用いた復帰突然変異試験で判定される変異原性である、[1]~[12]のいずれか一項に記載の予測方法。
[14]供試化合物の構造情報を入力するための入力手段と、
使用者が入力した供試化合物の構造情報を受信するための受信手段と、
受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成するための第1生成手段と、
前記3次元分子構造を用い、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される分子記述子を少なくとも一つ含む、1個以上の分子記述子の値を算出するための第1算出手段と、
前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出するための算出手段であって、毒性有りの確率と毒性無しの確率を足し合わせると100%である第2算出手段と、及び
算出した前記確率を出力するための出力手段と、
を含む、化合物の毒性を予測するシステム。
[15]前記入力手段として機能する入力装置と、
前記第1生成手段、前記第1算出手段及び前記第2算出手段として機能する演算装置と、
前記出力手段として機能する出力装置と、
主記憶装置と、及び
システムの制御を行う制御装置と、
を含む、[14]に記載のシステム。
[16]プログラムが格納される補助記憶装置を更に備える、[15]に記載のシステム。
[17]使用者が入力した供試化合物の構造情報を受信する処理と、
受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成する処理と、
前記3次元分子構造を用い、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される分子記述子を少なくとも一つ含む、1個以上の分子記述子の値を算出する処理と、
前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出する処理であって、毒性有りの確率と毒性無しの確率を足し合わせると100%である処理と、及び
算出した前記確率を出力する処理と、
をコンピュータに実行させるためのプログラム。
[18][17]に記載のプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
【発明の効果】
【0009】
本発明によれば、使用者(ユーザー)が入力した化合物の構造情報を特有の処理に供することにより、高い精度及び信頼性の予測結果が出力される。予測結果では、毒性有りの確率と毒性無しの確率を足し合わせると確率100%となる。従って、予測結果の評価がし易く、即ち、供試化合物間の比較が容易である。例えば、毒性無しの化合物を欲している場合に本発明を実施し、毒性無しの確率54%(言い換えれば、毒性有りの確率46%)の化合物と、毒性無しの確率63%(言い換えれば、毒性有りの確率37%)の化合物が見出されれば、単純に数値の比較によって、後者の化合物を有力な候補として選出することが可能となる。
【図面の簡単な説明】
【0010】
【図1】本発明の毒性予測方法のフローチャート。
【図2】毒性予測システムの構成例。
【図3】実施例1のAmes変異原性予測結果の出力例。
【図4】実施例2のAmes変異原性予測結果。
【図5】実施例3でAmes変異原性を予測した農薬3種(anthraquinone、diquat及びchlormequat)のSMILES形式の構造情報。
【図6】anthraquinoneの3次元分子構造。内部座標を用いて表示した。
【図7】diquatの3次元分子構造。内部座標を用いて表示した。
【図8】chlormequatの3次元分子構造。内部座標を用いて表示した。
【図9】実施例3で用いた分子記述子(一部)の値。
【図10】農薬3種(anthraquinone、diquat及びchlormequat)のAmes変異原性予測結果。
【図11】比較例1、2のAmes変異原性予測結果。
【発明を実施するための形態】
【0011】
1.化合物の毒性を予測する方法
本発明の第1の局面は化合物の毒性を予測する方法(以下、「本発明の予測方法」とも呼ぶ)に関する。本発明の予測方法は、細胞や動物を用いることなく、供試化合物(その毒性が評価される化合物)の毒性を評価することができる。細胞や動物を用いた毒性評価と本発明を併用すれば、極めて効率的な毒性評価が可能となる。

【0012】
一般に「化合物の毒性」は、急性毒性(経口)、急性毒性(経皮)、急性毒性(吸入)、皮膚腐食性、皮膚刺激性、眼に対する損傷性/刺激性、遺伝毒性、発がん性、生殖毒性、神経毒性、呼吸器感作性、皮膚感作性、生殖細胞変異原性、生態毒性、生物濃縮性、生分解性等の指標によって評価される。本発明の予測方法における「化合物の毒性」を規定する評価指標は特に限定されない。好ましい一態様では、細菌を用いた復帰突然変異試験(bacterial reverse mutation test (Ames試験))で判定される変異原性を指標とした毒性の予測に本発明の予測方法が適用される。尚、Ames試験の方法と判定のルールはOECD TG 471に規定されている。

【0013】
本発明では以下ステップ(1)~(5)を行う。
(1)使用者が入力した供試化合物の構造情報を受信するステップ
(2)受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成するステップ
(3)前記3次元分子構造を用い、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される分子記述子を少なくとも一つ含む、1個以上の分子記述子の値を算出するステップ
(4)前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出するステップであって、毒性有りの確率と毒性無しの確率を足し合わせると100%であるステップ
(5)算出した前記確率を出力するステップ

【0014】
以下、図1に示すフローチャートを参照しながら、本発明の予測方法の詳細を説明する。尚、本発明の予測方法は、後述の毒性予測システム等によって実行することができる

【0015】
まず、使用者(ユーザー)が入力した供試化合物の構造情報が受信される(ステップ(1))。使用者は、供試化合物の構造情報を用意しておく。構造情報の書式は、例えば、SMILES(smi形式と略称されることがある)(参考文献1及び参考文献2)、MDL MOL(参考文献3)、SDF(参考文献3)、CDX(binary file created by PerkinElmer, Inc.'s software ChemDraw(登録商標)、ChemBioDraw(登録商標))等である。供試化合物の数は1個又は2個以上であり、後者の場合には、供試化合物毎に構造情報が入力される。

【0016】
供試化合物には、タンパク質、抗体、長鎖のDNAやRNA、ポリスチレン、ポリアクリレートなどの高分子化合物ではなく、分子量800以下の有機化合物が適する。また、重金属以外の化合物を供試化合物にするとよい。

【0017】
次に、受信した構造情報に基づき、構造が最適化された3次元分子構造が生成される(ステップ(2))。構造の最適化には、例えば、半経験的分子軌道法、非経験的分子軌道法、密度汎関数法を利用できる。また、分子力学法、半経験的分子軌道法、非経験的分子軌道法又は密度汎関数法によって立体配座探索することによって構造の最適化を行ってもよい。このステップでは、以上のような最適化手法の単独又は2種類以上の併用によって、構造が最適化された1個以上の3次元構造が生成されることになる。分子力学法、半経験的分子軌道法、非経験的分子軌道法及び密度汎関数法を併用して構造を最適化する場合の例を以下に示す。尚、2種類以上の構造最適化手法を併用するか否かの判断においては、処理時間の長さや各装置(演算装置、制御装置、主記憶装置等)に掛かる負荷等を考慮するとよい。
<併用の例1>
最初に半経験的分子軌道法で構造を最適化し、得られた3次元分子構造を非経験的分子軌道法又は密度汎関数法で更に構造を最適化する。
<併用の例2>
最初にハートリー-フォック法で構造を最適化し、得られた3次元分子構造を密度汎関数法、Moller-Plesset摂動法、配置間相互作用法又はクラスター展開法で更に構造を最適化する。
<併用の例3>
最初に、半経験的分子軌道法で構造を最適化し、得られた3次元分子構造をハートリー-フォック法で更に構造を最適化し、得られた3次元分子構造を密度汎関数法、Moller-Plesset摂動法、配置間相互作用法、又はクラスター展開法で更に構造を最適化する。
<併用の例4>
Quantum Mechanics/Molecular Mechanics法又はour own N-layered integrated molecular orbital and molecular mechanics法で構造を最適化する。

【0018】
一般に、化合物の多くは条件によって複数の安定した3次元構造を取る。構造が最適化された3次元構造を複数(即ち2個以上)生成することは、この点を反映させたものとなり、より有用な予測結果をもたらす。尚、好ましい一態様では、半経験的分子軌道法によって構造が最適化された2個以上の3次元分子構造を生成し、次のステップへ進む。

【0019】
「構造の最適化」とは、分子を構成する原子の位置を変化させることによって、分子のエネルギーを極小化することである(参考文献4)。「半経験的分子軌道法」は、経験的パラメータを使用したハートリー-フォック方程式の近似式に基づいて分子の電子状態のエネルギーを算出する方法である(参考文献5)。「非経験的分子軌道法」は、ハートリー-フォック法又はMoller-Plesset摂動法、配置間相互作用法、クラスター展開法等によって分子の電子状態のエネルギーを算出する方法である(参考文献6)。「密度汎関数法」は、電子密度の汎関数によって分子の電子状態のエネルギーを算出する方法である(参考文献7)。「分子力学法」は、古典力学的原子核間ポテンシャルエネルギー関数に基づいて分子ポテンシャルエネルギーを算出する方法である(参考文献8)。「立体配座探索」は、分子の立体配座を系統的に多数発生させた後、立体配座それぞれの構造を最適化することである(参考文献9)。Quantum Mechanics/Molecular Mechanics法及びour own N-layered integrated molecular orbital and molecular mechanics法は、分子のエネルギーを算出する前記手法の複数を混合(ハイブリッド)して、分子のエネルギーを算出する方法である。

【0020】
構造が最適化された3次元分子構造の生成には、例えば、CORINA Classic(参考文献10)、SYBYL(登録商標)-X Suite(参考文献11)、Open Babel(参考文献12)、The Chemistry Development Kit(参考文献13)、RDKit(参考文献14)、Chem3DTM(参考文献15)、ChemBio3D(登録商標)(参考文献16)、MarvinSketch(参考文献17)、Balloon(参考文献18)、TINKER(参考文献19)、Amber(参考文献20)、AmberTools(参考文献21)、CHARMM(参考文献22)、NAMD(参考文献23)、BOSS(参考文献24)、VEGA ZZ/VEGA Command line(参考文献25)、GROMOSTM(参考文献26)、GROMACS(参考文献27)、MOPAC(登録商標)(参考文献28)、GAMESS(参考文献29)、Firefly(参考文献30)、Gaussian(登録商標)(参考文献31)、Spartan(参考文献32)、Q-Chem(参考文献33)、HyperChem(参考文献34)、Molecular Operating Environment(参考文献35)、BIOVIA(登録商標) Discovery Studio(参考文献36)、BIOVIA(登録商標) Material Studio(参考文献37)、ConfGen(参考文献38)、LigPrep(参考文献39)、Desmond Molecular Dynamics System(参考文献40)、Jaguar(参考文献41)、MacroModel(参考文献42)、MOLGEN(参考文献43)、CONFLEX(登録商標)(参考文献44)、OMEGA(参考文献45)、VConf(参考文献46)、Key3D(参考文献47)、Molpro(参考文献48)、Molcas(参考文献49)、ADF(参考文献50)、TURBOMOLE(参考文献51)、PQS(参考文献52)、MPQC(参考文献53)、Dalton(参考文献54)、LSDalton(参考文献55)、COLUMBUS(参考文献56)、NWChem(参考文献57)、PSI4(参考文献58)、CFOUR(参考文献59)、ACES(参考文献60)、ORCA(参考文献61)、SMASH(参考文献62)、ABINIT-MP(参考文献63)、NTChem(参考文献64)、PAICS(参考文献65)等のコンピュータソフトウェアを利用することができる。以上のようなソフトウェアに対して外部から命令することにより、構造が最適化された3次元分子構造を生成してもよい。

【0021】
続いて、構造が最適化された3次元分子構造を用い、1個以上の分子記述子の値が算出される(ステップ(3))。用いられる分子記述子の少なくとも一つは3次元分子記述子、4次元分子記述子又は量子化学分子記述子である。構造が最適化された3次元分子構造に基づくことから、正確性ないし信頼性の高い、分子記述子(3次元分子記述子、4次元分子記述子、量子化学分子記述子等)の値が算出され、精度の高い予測結果の出力が可能となる。

【0022】
好ましくは、3次元分子記述子、4次元分子記述子及び量子化学分子記述子からなる群より選択される二つ以上の分子記述子(例えば、3次元分子記述子と4次元分子記述子の併用や、3次元分子記述子と量子分子記述子の併用、3次元分子記述子、4次元分子記述子及び量子化学分子記述子併用等)の値が算出される。例えば、3次元分子記述子が単独で又は他の分子記述子(即ち、4次元分子記述子及び/又は量子化学分子記述子)との組合せで用いられる場合には、好ましくは20種類以上、更に好ましくは30種類以上、より一層好ましくは50種類以上の3次元分子記述子の値が算出されるようにするとよい。その値が算出される3次元分子記述子の種類(数)の上限は特に限定されない。但し、処理時間の長さや各装置(演算装置、制御装置、主記憶装置等)に掛かる負荷等を考慮し、例えば3,084種類を上限にすることができる。4次元分子記述子についても同様であり、好ましくは200種類以上、更に好ましくは30種類以上、より一層好ましくは50種類以上の値が算出されるようにするとよい(上限は例えば6,480種類)。量子化学分子記述子の場合も同様であり、好ましくは3種類以上、更に好ましくは5種類以上、より一層好ましくは10種類以上の値が算出されるようにするとよい(上限は例えば171種類)。

【0023】
3次元分子記述子、4次元分子記述子及び/又は量子化学分子記述子の他、2次元分子記述子、1次元分子記述子、0次元分子記述子等の値も算出されるようにしてもよい。この場合においても、その値が算出される分子記述子の組合せは特に限定されない。その値が算出される分子記述子の組合せの例は以下の通りである。
例1)1個以上の3次元分子記述子、1個以上の4次元分子記述子、1個以上の量子化学分子記述子、1個以上の2次元分子記述子、1個以上の1次元分子記述子、1個以上の0次元分子記述子の組合せ
例2)1個以上の3次元分子記述子、1個以上の量子化学分子記述子、1個以上の2次元分子記述子、1個以上の1次元分子記述子、1個以上の0次元分子記述子の組合せ
例3)1個以上の3次元分子記述子、1個以上の2次元分子記述子、1個以上の1次元分子記述子、1個以上の0次元分子記述子の組合せ

【0024】
その値が算出される分子記述子の総数は特に限定されないが、好ましくは、800個以上、更に好ましくは1,000個以上、より一層好ましくは1,500個以上の分子記述子の値が算出される。原則、分子記述子の数を多くすれば、より信頼性の高い予測結果が得られる。その一方で、分子記述子の数が多すぎると、過度の処理時間を要すること、各装置(演算装置、制御装置、主記憶装置等)に過度な負荷がかかる等の弊害があるため、分子記述子の総数を1,000個~10,000個の範囲内にするとよい。

【0025】
「3次元分子記述子」とは、Radial Distribution Function descriptor、Weighted Holistic Invariant Molecular descriptor、Charged partial surface area等(参考文献66)である。「4次元分子記述子」とは、Comparative Molecular Fields Analysis、GRID、conformational descriptor、4次元分子フィンガープリント等(参考文献66及び参考文献67)である。「量子化学分子記述子」とは、最高被占軌道エネルギー、最低空軌道エネルギー、イオン化ポテンシャル、電子親和力、双極子モーメント等(参考文献66及び参考文献68)である。「2次元分子記述子」とは、グラフ保存量である、Walk Count Descriptor、Path Count Descriptor等、トポロジー記述子である、Topological Distance Matrix Descriptor、Zagreb Index descriptor等(参考文献66)である。「1次元分子記述子」とは、官能基の数、フラグメント構造の数、分子フィンガープリント等(参考文献66)である。「0次元分子記述子」とは、分子量、炭素原子の数、自由回転が可能な単結合の数等である(参考文献66)。

【0026】
分子記述子の値の算出には、例えば、DRAGON(参考文献69)、CODESSA PRO(参考文献70)、ADAPT(参考文献71)、ADMET Predictor(参考文献72)、CORINA Symphony(参考文献73)、Pentacle(参考文献74)、VolSurf+(参考文献75)、ISIDA Fragmentor(参考文献76)、JOELib(参考文献77)、Molconn-Z(参考文献78)、PowerMV(参考文献79)、PreADMET(参考文献80)、PaDEL-Descriptor(参考文献81)、cinfony(参考文献82)、Chemopy(参考文献83)、The Chemistry Development Kit(参考文献13)、RDKit(参考文献14)、Open Babel(参考文献12)、ToMoCoMD-CARDD(参考文献84)、QuaSAR-Descriptor(参考文献85)、Molecular Operating Environment(参考文献35)、SYBYL(登録商標)-X Suite(参考文献11)、BIOVIA(登録商標) Discovery Studio(参考文献36)、BIOVIA(登録商標) Material Studio(参考文献37)、QikProp(参考文献86)、Jaguar(参考文献41)、MacroModel(参考文献42)、VCharge(参考文献87)、MarvinSketch(参考文献17)、Spartan(参考文献32)、MOPAC(登録商標)(参考文献28)、GAMESS(参考文献29)、Gaussian(登録商標)(参考文献31)、HyperChem(参考文献34)、Q-Chem(参考文献33)、BOSS(参考文献24)、Firefly(参考文献30)、Molpro(参考文献48)、Molcas(参考文献49)、ADF(参考文献50)、TURBOMOLE(参考文献51)、PQS(参考文献52)、MPQC(参考文献53)、Dalton(参考文献54)、LSDalton(参考文献55)、COLUMBUS(参考文献56)、NWChem(参考文献57)、PSI4(参考文献58)、CFOUR(参考文献59)、ACES(参考文献60)、ORCA(参考文献61)、SMASH(参考文献62)、ABINIT-MP(参考文献63)、NTChem(参考文献64)、PAICS(参考文献65)、Mold2(参考文献88)等のコンピュータソフトウェアを利用することができる。以上のようなソフトウェアに対して外部から命令することにより分子記述子の値を算出してもよい。

【0027】
ステップ(3)に続き、供試化合物の毒性の有無の確率が算出される(ステップ(4))。確率の算出には毒性予測モデルが用いられる。毒性予測モデルは、ステップ(3)で算出された分子記述子の値を用いて供試化合物の毒性の有無の確率を算出する。本発明の最大の特徴の1つは、毒性有りの確率と毒性無しの確率を足し合わせると100%となるように毒性の有無の確率を算出することである。尚、供試化合物が2個以上の場合には、供試化合物毎に毒性の有無の確率が算出されることになる。

【0028】
毒性予測モデルには、毒性の有無が既知の複数の化合物の正規化済み分子記述子の値を用いた機械学習で構築した毒性予測モデルを用いるとよい。機械学習の例は、サポートベクターマシン、ベイジアンネットワーク、ニューラルネットワーク、アダブースト、ランダムフォレスト、アクティブラーニングである。これらの中の2つ以上を併用することにしてもよい。機械学習には、例えば、LibSVM(参考文献89)、TensorFlowTM(参考文献90)、Chainer(登録商標)(参考文献91)、Jubatus(登録商標)(参考文献92)、Caffe(参考文献93)、Theano(参考文献94)、Torch(参考文献95)、neonTM(参考文献96)、MXNet(参考文献97)、The Microsoft Cognitive Toolkit(参考文献98)、R(C)(参考文献99)、MATLAB(登録商標)(参考文献100)、Mathematica(登録商標)(参考文献101)、SAS(登録商標)(参考文献102)、RapidMiner(登録商標)(参考文献103)、KNIME(登録商標)(参考文献104)、WeKa(参考文献105)、shogun-toolbox/shogun(参考文献106)、Orange(参考文献107)、Apache MahoutTM(参考文献108)、scikit-learn(参考文献1095)、mlpy(参考文献110)、XGBoost(参考文献111)、Deeplearning4j(参考文献112)等のコンピュータソフトウェアを利用することができる。以上のようなソフトウェアに対して外部から命令し、機械学習を実行させてもよい。

【0029】
基本的には、毒性予測モデルの構築に使用する既知化合物の種類は多いほど、毒性予測モデルの信頼性が増す。好ましくは300種以上、更に好ましくは3,000種以上、より一層好ましくは7,500種以上の既知化合物を毒性予測モデルの構築に使用する。

【0030】
ステップ(4)として、好ましくは、以下の2つのステップを行う。
(4-1)分子記述子の値を正規化するステップ
(4-2)正規化済みの値を用いて供試化合物の毒性の有無の確率を算出するステップ

【0031】
ステップ(4-1)は、毒性の有無が既知の複数の化合物の対応する分子記述子と比較できるようにするステップである。例えば、毒性の有無が既知の複数の化合物についての分子記述子の値を正規化する際の計算(処理)を行うことになる。このステップによって得られる正規化済みの値を用い、ステップ(4-2)において、供試化合物の毒性の有無の確率が算出される。

【0032】
ステップ(4)で算出された確率は所定の形式で出力される(ステップ(5))。様々な形式で出力することが可能である。例えば、表形式やグラフ形式等によって表示される。好ましくは、Excel(登録商標)(参考文献117)、Libre Office(参考文献118)、Apache Open OfficeTM(参考文献119)等、汎用的なソフトウェアで読み取り/表示可能なように出力される。尚、供試化合物が2個以上の場合には、各供試化合物の毒性の有無の確率が出力されることになり、その典型的な表示態様は、全ての供試化合物の確率を一覧で表示するものであるが、これに限られるものではない。

【0033】
毒性の有無の確率とともに、供試化合物の毒性の有無の判定結果(典型的には「毒性あり」又は「毒性なし」、或いはこれらに準じたもの)を出力することにしてもよい。当該判定結果は、例えば、複数の供試化合物の中からより効率的に候補化合物(毒性が低い又は毒性がないと予想される有望な化合物)を選抜ないし選定することを可能にする。

【0034】
本発明の一態様では、供試化合物の化学式を生成するステップ(ステップ(6))も行い、ステップ(5)では、当該ステップで生成された化学式と、ステップ(4)で算出された確率が関連づけて(例えば表形式に統合して)出力される。このような出力は、化合物の構造と毒性との関連を示すことになり、より有益な予測結果となる。「化学式」として、化学構造式や分子式等を採用できるが、好ましくは、ユーザーが化合物の幾何学的構造を認識することができる点から化学構造式を採用する。化学式の生成には、例えば、The Chemistry Development Kit(参考文献13)、RDKit(参考文献14)、Open Babel(参考文献12)、MedChem DesignerTM(参考文献113)、ChemBioDraw(登録商標)(参考文献114)、ChemDraw(登録商標)(参考文献115)、MarvinSketch(参考文献17)、BIOVIA(登録商標) Draw(参考文献116)等のコンピュータソフトウェアを利用することができる。以上のようなソフトウェアに対して外部から命令することにより化学式を生成してもよい。

【0035】
本発明による予測結果は、典型的には、次の段階の毒性評価に利用される。具体的には、本発明の予測結果に基づき、細胞や動物を用いた毒性評価に供すべき化合物を選定ないし選抜する。このように本発明を利用することにより、極めて効率的な毒性評価が実現される。

【0036】
2.毒性予測システム
図2は本発明の毒性予測システムの構成例を概念的に示す図である。この例の毒性予測システム1は、入力装置2、演算装置3、出力装置4、主記憶装置5、制御装置6、補助記憶装置7を備えるコンピュータシステムである。図2中の実線矢印は、データの流れ方向を示す。図2中の破線矢印は制御信号の流れ方向を示す。尚、本発明の毒性予測システムは、任意の汎用コンピュータを利用して構築することもできる。

【0037】
入力装置2は、例えば、キーボード、マウス、タッチパネル等であり、ユーザーは入力装置を操作し、1個以上の供試化合物の構造情報を入力する。主記憶装置(メインメモリ)5はRAM及び/又はROMである。主記憶装置5には、補助記憶装置7に格納されたプログラム及びデータが取り込み格納される。補助記憶装置7はハードディスクドライブ、光ディスク装置、SSD等である。コンピュータが読み取り可能な記録媒体から、或いはネットワーク又はクラウド上の他のコンピュータ/サーバからプログラムがインストールされるように構成してもよい。

【0038】
制御装置6は、主記憶装置5に取り込み格納されたプログラムに従って、他の装置を制御する。補助記憶装置7には、コンピュータシステムの出力を格納することができる。出力装置4は例えばディスプレイである。ユーザーは、出力装置を介してコンピュータシステムの出力を視認することが可能である。演算装置3は、主記憶装置5に格納されたデータを取り込んで、制御装置6から送られた演算命令に基づいて演算を行い、演算結果を主記憶装置5に返す。

【0039】
3.プログラム、記憶媒体
本発明は毒性予測システムに用いるコンピュータプログラムも提供する。本発明のコンピュータプログラムは、コンピュータに以下の処理(i)~(v)を実行させる。尚、本発明のコンピュータプログラムは、例えば、CD(Compact Disc)-ROM、CD-R、CD-RW、DVD(Digital Versatile Disc)、DVD-RAM、BD(Blu-ray(登録商標) Disc)、MO(Magneto Optical disc)、SSD、磁気テープ、或いは各種メモリーカード(USBフラッシュメモリー、SDメモリーカード等)等のコンピュータ読み取り可能な記憶媒体に格納した状態、或いはクラウドコンピュータ等からダウンロードする形態で提供される。また、ネットワークを介して接続されたコンピュータの補助記憶装置に本発明のコンピュータプログラムを格納することや、ネットワークを通じて他のコンピュータに本発明のコンピュータプログラムを転送することなども可能である。
(i)使用者が入力した供試化合物の構造情報を受信する処理
(ii)受信した前記構造情報に基づき、構造が最適化された3次元分子構造を生成する処理
(iii)前記3次元分子構造から1個以上の分子記述子の値を算出する処理
(iv)前記分子記述子の値を用いて前記供試化合物の毒性の有無の確率を毒性予測モデルが算出する処理であって、毒性有りの確率と毒性無しの確率を足し合わせると100%である処理
(v)算出した前記確率を出力する処理
【実施例】
【0040】
<実施例1:農薬2種の毒性予測>
概要、図2に示した汎用的コンピュータシステムを利用し、本発明の毒性予測方法(図1)を実行した。化合物の構造の最適化には、半経験的分子軌道法の一つであるpm3法が実行可能なソフトウェアGAMESSを使用した。また、構造最適化された3次元分子構造から、3次元分子記述子35種、量子化学分子記述子4種、0次元分子記述子121種、1次元分子記述子907種、2次元分子記述子160種の値を算出することにした。一部の分子記述子(参考文献68及び参考文献120を参照して算出した)を除き、ソフトウェアPaDEL-descriptor(参考文献81及び参考文献121)を使用して分子記述子の値が算出された。一方、Ames変異原性が既知の化合物約8,000種の正規化済み分子記述子の値を用い、サポートベクターマシンによる機械学習で毒性予測モデルを構築した。
【実施例】
【0041】
農薬2種(ジクロベニル(dichlobenil)、テフルベンズロン(teflubenzuron)の構造情報をSMILES形式(Clc1cccc(Cl)c1C#N、Fc1cccc(F)c1C(=O)NC(=O)Nc1cc(Cl)c(F)c(Cl)c1F)で入力し、化合物の化学構造式と予測結果を統合し、表形式で出力させた。尚、SMILES形式構造情報は化合物の一次構造であって、書式が確立している(参考文献1及び参考文献2)。SMILES形式構造ファイルは、既存ソフトウェア(例えばMarvinSketch(参考文献17)、ChemDraw(登録商標)(参考文献115)、BIOVIA(登録商標) Draw(参考文献116)等)で簡便に作成できる。
【実施例】
【0042】
図3は、農薬2種について、細菌を用いた復帰突然変異試験で判定される変異原性を予測した結果である。細菌を用いた復帰突然変異試験はAmes試験と呼称される。供試化合物として用いた農薬2種は、Ames変異原性が無いことが知られている。図3に示す通り、当該農薬2種のAmes変異原性の確率が適切且つ高い精度で算出された。また、Ames変異原性有りの確率と無しの確率を足し合わせると100%になることから、化合物間の比較が容易である。
【実施例】
【0043】
<実施例2:農薬724種の毒性予測(予測精度の検証)>
本発明のシステムの予測精度を検証するため、Ames変異原性の有無が既知の農薬724種のAmes変異原性を予測した。その結果、本発明のシステムによる予測結果とAmes試験の結果の一致率は、657/724×100=90.7(%)であり、本発明のシステムの予測精度が高いことが裏づけられた(図4)。また、本発明の予測システムは724種の全てについて予測結果を出力可能であった。即ち、実用性に極めて優れたものであることが示された。
【実施例】
【0044】
<実施例3:農薬3種を用いた予測精度の比較>
農薬3種(anthraquinone、diquat及びchlormequat)のAmes変異原性を本発明の方法で予測した。尚、構造の最適化の方法等、特に言及しない点については、上記の実施例と同様である。
【実施例】
【0045】
この実施例でAmes変異原性を評価した農薬3種のSMILES形式の構造情報を図5に示す。図6~8には、構造情報に基づいて生成された、農薬3種の3次元分子構造を、内部座標を用いて表示した。内部座標は、2原子の位置で定義される結合長、3原子の位置で定義される結合角、4原子の位置で定義されるねじれ角から構成される。結合長の単位はオングストロームである。結合角とねじれ角の単位は、°(度)である。
【実施例】
【0046】
3次元分子構造に基づいて、3次元分子記述子35種、量子化学分子記述子4種、0次元分子記述子119種、1次元分子記述子795種、及び2次元分子記述子149種の値を算出した。算出された値の一部を図9に示す。毒性予測モデルの構築には、Ames変異原性が既知の化合物9,719種の正規化済み分子記述子の値を用いた。
【実施例】
【0047】
農薬3種の予測結果の出力を図10に示す。農薬毎にAmes変異原性の有りの確率と無しの確率(二つの確率を足すと100%になる)が計算され出力される。供試化合物として用いた農薬3種は、Ames試験によってAmes変異原性が無いことが判明している。
【実施例】
【0048】
比較例として、生成される分子記述子を変えた場合の予測結果を求めた。
<比較例1>
0次元分子記述子119種、1次元分子記述子795種、2次元分子記述子149種の値が算出されることにし(3次元分子記述子35種と量子化学分子記述子4種を除いた)、上記と同様の処理によってAmes変異原性を予測した。上記システム(実施例3)との違いは、3次元分子記述子35種と量子化学分子記述子4種を含まない点である。
<比較例2>
構造最適化されていない3次元分子構造に基づいて、3次元分子記述子29種、0次元分子記述子119種、1次元分子記述子795種、2次元分子記述子149種の値が算出されることにし、上記と同様の処理によってAmes変異原性を予測した。上記システム(実施例3)との違いは、3次元分子記述子の値が、構造最適化されていない3次元構造に基づいて算出されている点と、量子化学分子記述子4種を含まない点である。
【実施例】
【0049】
比較例1、2の予測結果を図11に示す。実施例3の出力結果(図10)と比較すると、比較例1、2のいずれも、農薬3種の全てについて、Ames変異原性有りの確率が高く、予測精度及び正確性に劣ることがわかる。注目すべきことに、比較例1、2では、diquatについてAmes変異原性なしの確率よりもAmes変異原性有りの確率の方が高く、Ames試験の結果に反する予測結果を示した。
【産業上の利用可能性】
【0050】
本発明によれば、既知化合物はもとより、今後開発される化合物(仮想化合物を含む)の毒性予測が可能である。また、実際の試験が行えない又は困難な化合物の毒性の予測も可能となる。毒性の無い又は毒性の低い化合物の開発が要求される、化成品、医薬品、農薬、動物薬品(家畜やペット)、香粧品、洗剤、染料、インク、添加剤、その他の素材の毒性評価に本発明を適用可能である。
【0051】
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。本明細書の中で明示した論文、公開特許公報、及び特許公報などの内容は、その全ての内容を援用によって引用することとする。
【0052】
<参考文献>
1. Weininger D., "SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules", Journal of Chemical Information and Modeling, (The United States of America), The American Chemical Society Publications, February 1988, vol. 28, iss.1, p. 31-36, DOI: 10.1021/ci00057a005
2. Weininger D., ET AL, "SMILES. 2. Algorithm for generation of unique SMILES notation", Journal of Chemical Information and Modeling, (The United States of America), The American Chemical Society Publications, May 1989, vol. 29, iss. 2, p. 97-101, DOI: 10.1021/ci00062a008
3. Dalby A., ET AL, "Description of several chemical structure file formats used by computer programs developed at Molecular Design Limited", Journal of Chemical Information and Computer Sciences, (The United States of America), The American Chemical Society Publications, vol. 32, iss. 3, May 1992, p. 244-255. DOI: 10.1021/ci00007a012
4. Schlegel H. B., "Geometry optimization", Wiley Interdisciplinary Reviews: Computational Molecular Science, (The United States of America), John Wiley & Sons, Ltd., May 2011, vol. 1, iss. 5, p.790-809, DOI: 10.1002/wcms.34
5. Zerner M. C., ET AL(Eds),"Semiempirical Molecular Orbital Methods", Reviews in Computational Chemistry, (Germany), Wiley-VCH, Inc., 1991, vol. 2, p. 313-365, DOI: 10.1002/9780470125793.ch8
6. Friesner R. A., "Ab initio quantum chemistry: Methodology and applications", Proceedings of the National Academy of Sciences of the United States of America, (The United States of America), The United States National Academy of Sciences, May 2005, vol. 102, no. 19, p. 6648-6653, DOI: 10.1073/pnas.0408036102
7. Parr R. G., "Density Functional Theory", Annual Review of Physical Chemistry, (The United States of America), Annual Reviews, Inc., 1983, vol. 34, p. 631-656, https://doi.org/10.1146/annurev.pc.34.100183.003215
8. Bowen J. P. ET AL, Lipkowitz K. B. ET AL (Eds), "Molecular Mechanics: The Art and Science of Parameterization", Reviews in Computational Chemistry, (Germany), WILEY-VCH, Inc., 1991, vol. 2, p. 81-97, DOI: 10.1002/9780470125793
9. Mazzanti A., ET AL, "Recent trends in conformational analysis", Wiley Interdisciplinary Reviews: Computational Molecular Science, (The United States of America), John Wiley & Sons, Inc., November 2011, vol. 2, iss. 4, p. 613-641, DOI: 10.1002/wcms.96
10. CORINA Classic、Molecular Networks GmbH社およびAltamira, LLC.社、ウェブサイト https://www.mn-am.com/products/corina
11. SYBYL(登録商標)-X Suite、Certara USA, Inc.社、ウェブサイトhttps://www.certara.com/software/molecular-modeling-and-simulation/sybyl-x-suite/
12. O'Boyle N. M., ET AL, "Open Babel: An open chemical toolbox", Journal of Cheminformatics, (The United States of America), Springer Publishing, 3:33, Oct 2011, DOI: 10.1186/1758-2946-3-33
13. Steinbeck C., ET AL, "The Chemistry Development Kit (CDK): An Open-Source Java Library for Chemo- and Bioinformatics", Journal of Chemical Information and Computer Sciences, (The United States of America), The American Chemical Society Publications, vol. 43, iss. 2, February 2003, p. 493-500, DOI: 10.1021/ci025584y
14. RDKit, Landrum G., "RDKit Documentation Release 2017.03.1", Online Documentation, ウェブサイトhttp://www.rdkit.org/docs/Overview.html
15. Chem3DTM、PerkinElmer, Inc.社、ウェブサイトhttp://www.cambridgesoft.com/Ensemble_for_Chemistry/ChemOffice/ChemOfficeProfessional/
16. ChemBio3D(登録商標)、PerkinElmer, Inc.社、ウェブサイトhttps://www.cambridgesoft.com/Ensemble_for_Chemistry/details/Default.aspx?fid=17&pid=660
17. MarvinSketch、ChemAxon社、ウェブサイトhttps://www.chemaxon.com/products/calculator-plugins/molecular-modelling/
18. Balloon、Vainio M., ウェブサイトhttp://users.abo.fi/mivainio/balloon/
19. TINKER、Ponder J., ET AL, ウェブサイトhttps://dasher.wustl.edu/tinker/
20. Amber、Case D. A., ET AL, ウェブサイトhttp://ambermd.org/
21. AmberTools、ウェブサイトhttp://ambermd.org/#AmberTools
22. CHARMM、Karplus M., ET AL, ウェブサイトhttps://www.charmm.org/charmm/
23. NAMD、Theoretical and Computational Biophysics Group, Beckman Institute, University of Illinois, ウェブサイト http://www.ks.uiuc.edu/Research/namd/
24. BOSS、 Jorgensen W. L., ET AL, ウェブサイトhttp://zarbi.chem.yale.edu/software.html
25. VEGA ZZ/VEGA Command line、Pedretti A., ET AL: ウェブサイトhttp://www.vegazz.net/
26. GROMOSTM、van Gunsteren W. F., ET AL, ウェブサイトhttp://www.igc.ethz.ch/gromos.html
27. GROMACS、van der Spoel D., ET AL, ウェブサイトhttp://www.gromacs.org/
ウェブサイトhttp://openmopac.net/
29. GAMESS、Schmidt M. W., ET AL, ウェブサイトhttp://www.msg.ameslab.gov/gamess/
30. Firefly、Granovsky A. A., ET AL, ウェブサイトhttp://classic.chem.msu.su/gran/gamess/index.html
31. Gaussian(登録商標)、Gaussian, Inc.社、ウェブサイトhttp://gaussian.com/citation/
32. Spartan、Wavefunction, Inc.社、ウェブサイトhttps://www.wavefun.com/products/spartan.html
33. Q-Chem、Q-Chem, Inc.社、ウェブサイト http://www.q-chem.com/
34. HyperChem、Hypercube, Inc.、ウェブサイトhttp://www.hyper.com/
35. Molecular Operating Environment、Chemical Computing Group ULC、ウェブサイトhttps://www.chemcomp.com/MOE-Molecular_Operating_Environment.htm
36. BIOVIA(登録商標) Discovery Studio、Dassault Systemes社、ウェブサイトhttp://accelrys.com/products/collaborative-science/biovia-discovery-studio/
37. BIOVIA(登録商標) Material Studio、Dassault Systemes社、ウェブサイトhttp://accelrys.com/products/collaborative-science/biovia-materials-studio/
38. ConfGen、Schrodinger(登録商標), LLC社、Schrodinger Release 2017-1: New York, NY, 2017ウェブサイトhttps://www.schrodinger.com/confgen
39. LigPrep、Schrodinger(登録商標), LLC社、Schrodinger Release 2017-1: New York, NY, 2017,ウェブサイトhttps://www.schrodinger.com/ligprep
40. Desmond Molecular Dynamics System、D. E. Shaw Research、New York, NY, 2017. ウェブサイトhttps://www.schrodinger.com/desmond
41. Jaguar、Schrodinger(登録商標), LLC社、Schrodinger Release 2017-1: New York, NY, 2017, ウェブサイトhttps://www.schrodinger.com/jaguar
42. MacroModel、Schrodinger(登録商標), LLC社、Schrodinger Release 2017-1: New York, NY, 2017, ウェブサイトhttps://www.schrodinger.com/macromodel
43. MOLGEN、Wassermann A., ET AL, ウェブサイト http://www.molgen.de/
44. CONFLEX(登録商標)、CONFLEX Corporation社、ウェブサイトhttp://www.conflex.net/
45. OMEGA、OpenEye Scientific Software、ウェブサイトhttps://www.eyesopen.com/omega
46. VConf、VeraChem, LLC、ウェブサイトhttp://www.verachem.com/products/vconf/
47. Key3D、IMMD, Inc.、ウェブサイト http://www.immd.co.jp/en/product_2.html
48. Molpro、TTI GmbH, ウェブサイトhttps://www.molpro.net/
49. Molcas、Veryazov. V. ET AL, ウェブサイト http://www.molcas.org/
50. ADF(登録商標)、Scientific Computing & Modelling NV, ウェブサイトhttps://www.scm.com/product/adf/
51. TURBOMOLE、TURBOMOLE GmbH, ウェブサイトhttp://www.turbomole.com/
52. PQS、Parallel Quantum Solutions, ウェブサイトhttp://www.pqs-chem.com/
53. MPQC、Valeev E. ET AL, ウェブサイト http://www.mpqc.org/
54. Dalton、Dalton/LSDalton developers, ウェブサイトhttp://daltonprogram.org
55. LSDalton、Dalton/LSDalton developersウェブサイトhttp://daltonprogram.org
56. COLUMBUS、Lischka H. ET AL, ウェブサイト https://www.univie.ac.at/columbus/
57. NWChem、Valiev M., ET AL, ウェブサイトhttp://www.nwchem-sw.org/index.php/Main_Page
58. PSI4、Sherrill C. D., ET AL, ウェブサイトhttp://www.psicode.org/
59. CFOUR、Stanton J. F., ET AL, ウェブサイトhttp://www.cfour.de/
60. ACES、Bartlett R. J., ET AL, ウェブサイト http://www.qtp.ufl.edu/ACES/
61. ORCA、Neese, F., ET AL, ウェブサイト https://orcaforum.cec.mpg.de/
62. SMASH、Ishimura K., ウェブサイト http://smash-qc.sourceforge.net/
63. ABINIT-MP(登録商標)、Mochizuki Y., ET AL, ウェブサイトhttp://www.cenav.org/abinitmpopen1/
64. NTChem、Nakajima, T., ET AL, ウェブサイトhttp://labs.aics.riken.jp/nakajimat_top/ntchem_e.html
65. PAICS、Ishikawa T., ウェブサイトhttp://www.paics.net/index_e.html
66. Johann Gasteiger J., ET AL(Editor), "Chemoinformatics: A Textbook"、WILEY-VCH Verlag GmbH & Co. KgaA、Weinheim, 2003, ISBN 3-527-30681-1
67. Wicker J. G. P., ET AL, "Beyond Rotatable Bond Counts: Capturing 3D Conformational Flexibility in a Single Descriptor", Journal of Chemical Information and Modeling, (The United States of America), The American Chemical Society Publications, vol. 56, iss. 12, November 2016, p. 2347-2352, DOI: 10.1021/acs.jcim.6b00565
68. Karelson M., ET AL, "Quantum-Chemical Descriptors in QSAR/QSPR Studies", Chemical Reviews, (The United States of America), The American Chemical Society Publications, vol. 96, iss. 3, May 1996, p. 1027-1044, DOI: 10.1021/cr950202r
69. DRAGON、Kode s.r.l.社、ウェブサイト https://chm.kode-solutions.net/products_dragon.php
70. CODESSA PRO、CompuDrug International, Inc.社、ウェブサイトhttp://www.compudrug.com/codessa_pro
71. ADAPT、Jurs P. C., ET AL、ウェブサイトhttp://research.chem.psu.edu/pcjgroup/adapt.html
72. ADMET Predictor、Simulations Plus, Inc.社、ウェブサイトhttp://www.simulations-plus.com/software/admet-property-prediction-qsar/
73. CORINA Symphony、Molecular Networks GmbH社およびAltamira, LLC.社、ウェブサイト https://www.mn-am.com/products/corinasymphony
74. Pentacle、Molecular Discovery Ltd社、ウェブサイト http://www.moldiscovery.com/software/pentacle/
75. VolSurf+、Molecular Discovery Ltd、ウェブサイトhttp://www.moldiscovery.com/software/vsplus/
76. ISIDA Fragmentor、Varnek A., ET AL、ウェブサイトhttp://infochim.u-strasbg.fr/spip.php?rubrique41
77. JOELib, Zell A., ET AL、ウェブサイトhttp://www.ra.cs.uni-tuebingen.de/software/joelib/index.html
78. Molconn-Z、eduSoft, LC社、ウェブサイトhttp://www.edusoft-lc.com/molconn/
79. PowerMV、Liu J., ET AL、ウェブサイトhttps://www.niss.org/research/software/powermv
80. PreADMET、Bioinformatics & Molecular Design Research Center (BMDRC)、ウェブサイト https://preadmet.bmdrc.kr/preadmet-pc-version-2-0/
81. PaDEL-Descriptor、Yap C. W., ウェブサイトhttp://www.yapcwsoft.com/dd/padeldescriptor/
82. Cinfony、 O'Boyle N. M., ET AL、ウェブサイト http://cinfony.github.io/
83. Cao D.-S., ET AL, "ChemoPy: freely available python package for computational biology and chemoinformatics", Bioinformatics, (The United Kingdom), Oxford University Press, vol. 29, iss. 8, March 2013, p. 1092-1094, DOI: https://doi.org/10.1093/bioinformatics/btt105
84. ToMoCoMD-CARDD、Ponce Y. M., ウェブサイト http://tomocomd.com/
85. QuaSAR-Descriptor、Chemical Computing Group ULC社、ウェブサイトhttps://www.chemcomp.com/journal/descr.htm
86. QikProp、Schrodinger(登録商標), LLC社、Schrodinger Release 2017-1: New York, NY, 2017, ウェブサイト https://www.schrodinger.com/qikprop
87. VCharge、VeraChem, LLC、ウェブサイトhttp://www.verachem.com/products/vcharge/
88. Mold2、Hong, H., ET AL, ウェブサイトhttps://www.fda.gov/ScienceResearch/BioinformaticsTools/Mold2/ucm144528.htm
89. LibSVM、Chang C.-C., ET AL、ウェブサイトhttps://www.csie.ntu.edu.tw/~cjlin/libsvm/
90. TensorFlowTM、Google Inc.、ウェブサイトhttps://www.tensorflow.org/
91. Chainer(登録商標)、Preferred Networks, Inc.、ウェブサイト http://chainer.org/
92. Jubatus(登録商標)、Preferred Networks, Inc.および日本電信電話株式会社、ウェブサイト https://jubat.us/en/
93. Caffe、Jia Y., ET AL、ウェブサイトhttp://caffe.berkeleyvision.org/
94. Theano、Theano Development Team、ウェブサイトhttp://deeplearning.net/software/theano/
95. Torch、Ronan Collobert ET AL、ウェブサイトhttp://torch.ch/
96. neonTM、Nervana Systems、ウェブサイト https://www.nervanasys.com/technology/neon/
97. MXNet、ウェブサイト http://mxnet.io/
98. The Microsoft Cognitive Toolkit、Microsoft Corporation、ウェブサイトhttps://www.microsoft.com/en-us/cognitive-toolkit/
99. R(c)、The R Foundation、ウェブサイトhttps://www.r-project.org/
100. MATLAB(登録商標)、The MathWorks, Inc.、ウェブサイトhttps://www.mathworks.com/products/matlab.html?s_tid=hp_products_matlab
101. Mathematica(登録商標)、Wolfram Research、ウェブサイト http://www.wolfram.com/mathematica/
102. SAS(登録商標)、SAS Institute Inc.、ウェブサイトhttps://www.sas.com/en_us/home.html
103. RapidMiner(登録商標)、RapidMiner, Inc.、ウェブサイトhttps://rapidminer.com/
104. KNIME(登録商標)、KNIME.com AG、ウェブサイトhttps://www.knime.org/
105. Witten I. H., ET AL, The WEKA Workbench. Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques", (The United States of America), Morgan Kaufmann, Fourth Edition, 2016, ISBN13: 978-0128042915. ウェブサイト http://www.cs.waikato.ac.nz/ml/weka/
106. shogun-toolbox/shogun、ウェブサイト http://www.shogun-toolbox.org/, Sonnenburg S., ET AL, "shogun-toolbox/shogun: Shogun 6.0.0 - Baba Nobuharu", April 2017, DOI: 10.5281/zenodo.556748
107. Orange、Demsar J., ET AL, "Orange: Data Mining Toolbox in Python", Journal of Machine Learning Research, (The United States of America), JMLR, Inc. and Microtome Publishing, vol. 14, Aug 2013, p. 2349-2353. ウェブサイトhttps://orange.biolab.si/
108. Apache MahoutTM、The Apache Software Foundation、ウェブサイトhttp://mahout.apache.org/
109. scikit-learn、ウェブサイトhttp://scikit-learn.org/stable/. Pedregosa F., ET AL, "Scikit-learn: Machine Learning in Python", Journal of Machine Learning Research, (The United States of America), JMLR, Inc. and Microtome Publishing, vol. 12, Oct 2011, p. 2825-2830
110. mlpy, Albanese D., ET AL、ウェブサイトhttp://mlpy.sourceforge.net/
111. Chen T., ET AL, "XGBoost: A Scalable Tree Boosting System", Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Aug 2016, DOI: 10.1145/2939672.2939785
112. Deeplearning4j、Skymind社、Deeplearning4j Development Team, "Deeplearning4j: Open-source distributed deep learning for the JVM", Apache Software Foundation License 2.0. ウェブサイトhttps://deeplearning4j.org/
113. MedChem DesignerTM、Simulations Plus, Inc.社、 ウェブサイトhttp://www.simulations-plus.com/software/medchem-designer/
114. ChemBioDraw(登録商標)、PerkinElmer, Inc.社、ウェブサイトhttps://www.cambridgesoft.com/Ensemble_for_Chemistry/details/Default.aspx?fid=17&pid=660
115. ChemDraw(登録商標)、PerkinElmer, Inc.社、ウェブサイトhttp://www.cambridgesoft.com/software/overview.aspx
116. BIOVIA(登録商標) Draw、Dassault Systemes社、ウェブサイトhttp://accelrys.com/products/collaborative-science/biovia-draw/
117. Excel(登録商標)、Microsoft Corporation、ウェブサイト https://products.office.com/en-us/excel
118. Libre Office、The Document Foundation、ウェブサイトhttps://www.libreoffice.org/
119. Apache Open OfficeTM、The Apache Software Foundation、ウェブサイトhttps://www.openoffice.org/
120. Sakuratani Y, ET AL, "Molecular size as a limiting characteristic for bioconcentration in fish", Journal of Environmental Biology, January 2008, vol. 29, iss. 1, p. 89-92.、ウェブサイトhttp://www.jeb.co.in/journal_issues/200801_jan08/paper_15.pdf
121. Yap C. W., "PaDEL-descriptor: An open source software to calculate molecular descriptors and fingerprints", Journal of Computational Chemistry, Volume 32, Issue 7, p. 1466-1474, May 2011. DOI: 10.1002/jcc.21707. Supporting Information: JCCT_21707_sm_suppinformation.xls、ウェブサイトhttp://onlinelibrary.wiley.com/doi/10.1002/jcc.21707/suppinfo
【符号の説明】
【0053】
1 毒性予測システム
2 入力装置
3 演算装置
4 出力装置
5 主記憶装置
6 制御装置
7 補助記憶装置
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9
【図11】
10