TOP > 国内特許検索 > 自己組織化マップを用いる装置、その方法及びプログラム

自己組織化マップを用いる装置、その方法及びプログラム

国内特許コード P08P005363
整理番号 5029
掲載日 2008年12月12日
出願番号 特願2005-363602
公開番号 特開2007-164704
登録番号 特許第4734639号
出願日 平成17年12月16日(2005.12.16)
公開日 平成19年6月28日(2007.6.28)
登録日 平成23年5月13日(2011.5.13)
発明者
  • 古川 徹生
出願人
  • 国立大学法人九州工業大学
発明の名称 自己組織化マップを用いる装置、その方法及びプログラム
発明の概要

【課題】数少ないトレーニングケースから汎化性の高い制御を実現することができる装置を提供する。
【解決手段】装置内に複数存するニューラルネットワークのモジュールからなるユニットのうち、最も次時刻の制御対象の予測状態を正しく予測した予測器を含むユニットに係る制御器の制御信号を採用して制御対象を制御するので、即時性の高い制御を実現することができると共に、自己組織化マップを形成することができる。
【選択図】図1

従来技術、競合技術の概要


本発明の背景技術として、特開2000-35956号公報に開示されるエージェント学習装置がある。



この背景技術のエージェント学習装置は、環境に対して働きかけ、その結果得られる報酬を最大化するための行動出力を決定する強化学習システムと、環境の変化を予測する環境予測システムとの組によりなる学習モジュールが複数備えられ、各学習モジュールの環境予測システムの予測誤差が少ないものほど大きな値を取る責任信号が求められ、この責任信号に比例して強化学習システムによる行動出力が重み付けされて、環境に対する行動が与えられる構成である。



この背景技術のエージェント学習装置によれば、非線形性/非定常性を持つ制御対象やシステムなどの環境で、具体的な教師信号は与えられず、様々な環境の状態や動作モードに最適な行動の切り替えや組み合わせを行い、また先見知識を用いることなく柔軟に行動
学習を行なうことができる。

【特許文献1】特開2000-35956号公報

【非特許文献1】Wolpert, D.M., Kawato, M.: Multiple paired forward and inverse models for motor control. Neural Networks 11, 1317-1329, 1998

産業上の利用分野


本発明は自己組織化マップを用いる装置であり、特に、即時性を要する制御に最適な装置に関する。

特許請求の範囲 【請求項1】
ニューラルネットワークを含む複数機能モジュール間の競合的学習実現される自己組織化マップを構築する装置であって、
前記各機能モジュールは、制御対象を制御するニューラルネットワークからなる制御器と制御対象の次時刻状態を予測するニューラルネットワークからなる予測器を含み、
前記制御器が、前記制御対象の理想状態と前記制御対象の現在状態を入力されることで、前記制御対象を制御する制御信号を出力し、
前記予測器が、前記制御対象の現時刻の制御信号と前記制御対象の現在状態を入力されることで次時刻の前記制御対象の予測状態を出力し、
前記制御対象の現在状態を最も近予測た予測器を具備する前記機能モジュールを最適合機能モジュールとして特定し、
前記最適合機能モジュールに係る制御器から出力された制御信号で前記制御対象を実際に制御し、
前記制御信号を採用された機能モジュールを最適合機能モジュールとして前記自己組織化マップを更新する装置。

【請求項2】
前記制御対象の現在状態最も近予測た予測器を具備する機能モジュールを候補機能モジュール当該候補機能モジュールと前回の最適合機能モジュールとなった機能モジュールとが異なる場合に、
前記候補機能モジュールの現在状態の予測が前回の最適合機能モジュールとなった機能モジュールの現在状態の予測よりも所定以上制御対象の現在状態に近くないときには、前回の最適合機能モジュールとなった機能モジュールを最適合機能モジュールとして維持する
前記請求項1に記載の装置。

【請求項3】
前記制御器毎に用意され、前記制御対象の現在状態と理想状態との偏差を入力されることで前記制御信号を前記制御対象に出力すると共に、前記制御信号を前記制御器にも出力して前記制御器のフィードバック学習を行う線形フィードバック制御器を新たに含む
前記請求項1又は2に記載の装置。

【請求項4】
前記予測器毎に用意され、前記予測器が出力した前記制御対象の予測状態を少なくとも予測した時刻が到来するまで保持する遅延器を新たに含む
前記請求項1ないし3のいずれかに記載の装置。

【請求項5】
制御対象の現在状態が入力された場合に、当該現在状態に対応する自己組織化マップ上の前記機能モジュールの位置を特定する手段を新たに含み、
自己組織化マップ上の位置に対応する機能モジュールを用いて現時刻の制御対象を制御する
前記請求項1ないし4のいずれかに記載の装置。

【請求項6】
ニューラルネットワークを含む複数の機能モジュール間の競合的学習で実現される自己組織化マップを構築する装置を用いる方法であって、
前記各機能モジュールに含まれ、制御対象を制御するニューラルネットワークからなる制御器が、前記制御対象の理想状態と前記制御対象の現在状態とを入力されることで、前記制御対象を制御する制御信号を出力するステップと、
前記各機能モジュールに含まれ、前記制御対象の次時刻状態を予測するニューラルネットワークからなる予測器が、前記制御対象の現時刻の制御信号と前記制御対象の現在状態とを入力されることで次時刻の前記制御対象の予測状態を出力するステップと、
前記制御対象の現在状態を最も近く予測した予測器を具備する前記機能モジュールを最適合機能モジュールとして特定するステップと、
前記最適合機能モジュールに係る制御器から出力された制御信号で前記制御対象を実際に制御するステップと、
前記制御信号を採用された機能モジュールを最適合機能モジュールとして前記自己組織化マップを更新するステップを含む方法。

【請求項7】
ニューラルネットワークを含む複数機能モジュール間の競合的学習実現される自己組織化マップを構築するようにコンピュータを機能させるためのプログラムであって、
前記各機能モジュールに含まれ、前記制御対象の理想状態と前記制御対象の現在状態とを入力されることで、前記制御対象を制御する制御信号を出力するニューラルネットワークからなる制御器と、
前記各機能モジュールに含まれ、前記制御対象の現時刻の制御信号と前記制御対象の現在状態とを入力されることで、次時刻の前記制御対象の予測状態を出力するニューラルネットワークからなる予測器と、
前記制御対象の現在状態を最も近く予測した予測器を具備する前記機能モジュールを最適合機能モジュールとして特定する手段と、
前記最適合機能モジュールに係る制御器から出力された制御信号で前記制御対象を実際に制御する手段と、
前記制御信号を採用された機能モジュールを最適合機能モジュールとして前記自己組織化マップを更新する手段としてコンピュータを機能させるためのプログラム。
産業区分
  • 制御調整
  • 演算制御装置
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2005363602thum.jpg
出願権利状態 権利存続中
詳細は、下記「問合せ先」まで直接お問い合わせください。


PAGE TOP

close
close
close
close
close
close
close