TOP > 国内特許検索 > 動作学習装置

動作学習装置 コモンズ

国内特許コード P140010608
整理番号 07-166
掲載日 2014年6月4日
出願番号 特願2008-125720
公開番号 特開2009-276886
登録番号 特許第5252393号
出願日 平成20年5月13日(2008.5.13)
公開日 平成21年11月26日(2009.11.26)
登録日 平成25年4月26日(2013.4.26)
発明者
  • 谷口 忠大
  • 岩橋 直人
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 動作学習装置 コモンズ
発明の概要 【課題】人間の行動の分節化に時系列ダイナミクスの局所的な情報しか用いないために、必ずしも人間が考えるような意味を持った単位としての行動の分節化ができなく、連続動作を確実に分節化して学習できる動作学習装置を提供する。
【解決手段】ロボットシステムでは、ロボットが、ユーザが提示した連続動作を示す3次元モーションキャプチャデータのような時系列データからSARMを用いて離散的な文字列を含む文書を生成し、辞書を用いないキーワード抽出方法によって、意味のある分節をキーワードとして抽出して、保存する。キーワードを評価するとき、キーワードからSARMのARモデルをキーワードに沿い順次起動することによって、ロボットが獲得した動作を再現してユーザに提示する。ユーザのリアクション動作に主動作が含まれるかどうか判断、その結果に応じて信頼度を増減する。
【選択図】図6
従来技術、競合技術の概要


人間社会において共生的に活動可能な自律ロボットを生み出すためには、彼らが私たちと共に生活する中で自然に様々な概念や振舞いを獲得することが望まれる。しかしながら、まだ、そのような能力をロボットに与えることのできる方法はほとんど存在しない。私たちが、もし日常生活の中で必要なすべての振舞いを全て直接的にロボットに教え込まないといけないとするならば、それは手間がかかり過ぎる。したがって、人間の子供が行うように親の動作をみて「勝手に」見まねを通じて学習するような枠組み(模倣学習)を持ったロボットまたはその学習方法が求められる。



従来のロボットの模倣学習では、たとえば非特許文献1に示すように、その多くの先行技術において、学習する対象となる時系列情報が予め分節化され与えられ、ロボットはそれら各々の分節化された時系列情報を学習することによって動作学習を行なう。しかし、実際に家庭にロボットが現われる状況を考えると、我々がロボットとインタラクションする中でロボットに新たな行動パターンを学習させようとするときには、覚えさせようとする行動パターン毎にスイッチを押すなり、事前に準備された行動の開始と終了の合図を指定する(主には静止状態にするものが多い)などして行動パターンの分節を明示的に提示しなければならない。前者の場合ではスイッチを押すモーションが行動パターンの前後にノイズとして加わるし、後者の場合では静止状態から静止状態へ移る行動パターンしか学習対象とできないなどの問題点がある。また、そのような不自然な動作を挿入することが、人間とロボットとの自然なインタラクションを妨げる要因ともなると考えられる。



一方、たとえば非特許文献2および非特許文献3などにおいて、複数の行動パターンを複数の学習器の切り替え(DBSOMなど)や学習パラメータに冗長性を持たせることによって、複数の行動パターンを分節化されていない行動系列から学習する方法(RNNPB:recurrent neural network with parametric biasなど)が提案されている。
【非特許文献1】
稲邑哲也、中村仁彦、戸嶋巌樹、江崎英明「ミメシス理論に基づく見まね学習とシンボル創発の統合モデル」日本ロボット学会誌Vil.22 No. 2, pp.256-263, 2004
【非特許文献2】
中村大介、岡田昌史、中村仁彦「力学的情報処理における自己組織的シンボル獲得と運動生成」第18回日本人口知能学会全国大会講演、2004
【非特許文献3】
M. Ito, K. Noda, Y. Hoshino, and J. Tani. “Dynamic and interactive generation of object handling behaviors by a small humanoid robot using a dynamic neural network model”. Neural Networks, 19(3):323.337, 2006.

産業上の利用分野



この発明は、動作学習装置に関し、特に分節化されていない連続動作または連続行動を分節化して学習する、動作学習装置などに関する。

特許請求の範囲 【請求項1】
各々が連続する動作を示す複数の時系列データからモデルを獲得することによって、モデルが示す離散的な文字列を含む文書を生成する文書列生成手段、および
前記文書に含まれる文字列から意味のある分節を抽出して保存する分節抽出手段を備え
前記文書列生成手段は、前記時系列データをモデル化することによって各時系列の隠れ状態を示す文字列およびスコアを含む文書を生成し、そのスコアの和が最大になるように文字列を分節化する、動作学習装置。

【請求項2】
前記意味のある分節と前記モデルを利用して動作を生成する動作生成手段をさらに備える、請求項記載の動作学習装置。

【請求項3】
ユーザのリアクションに基づいて前記動作生成手段が生成した動作を評価する評価手段をさらに備える、請求項記載の動作学習装置。

【請求項4】
前記評価手段による評価が低いとき、前記保存した分節を破棄する破棄手段をさらに備える、請求項記載の動作学習装置。

【請求項5】
前記文書生成手段はSARMを用いる、請求項1ないしのいずれかに記載の動作学習装置。

【請求項6】
請求項1ないしのいずれかに記載の動作学習装置を備える、ロボット。

【請求項7】
ユーザが提示する、各々が連続する動作を示す複数の時系列データからモデルを獲得することによって、モデルが示す離散的な文字列を含む文書を生成する文書列生成手段、
前記文書に含まれる文字列から意味のある分節を抽出して保存する分節抽出手段、
前記意味のある分節と前記モデルを利用して動作を生成しユーザに提示する動作生成手段、および
前記動作生成手段が提示した動作に対するユーザのリアクションを認識することによって応答戦略を獲得する獲得手段を備え
前記文書列生成手段は、前記時系列データをモデル化することによって各時系列の隠れ状態を示す文字列およびスコアを含む文書を生成し、そのスコアの和が最大になるように文字列を分節化する、ロボット。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2008125720thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close