TOP > 国内特許検索 > 操作方法生成システム > 明細書

明細書 :操作方法生成システム

発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2019-049904 (P2019-049904A)
公開日 平成31年3月28日(2019.3.28)
発明の名称または考案の名称 操作方法生成システム
国際特許分類 G06N   3/04        (2006.01)
G06N   3/08        (2006.01)
FI G06N 3/04
G06N 3/08 160
G06N 3/08 140
請求項の数または発明の数 6
出願形態 OL
全頁数 11
出願番号 特願2017-174241 (P2017-174241)
出願日 平成29年9月11日(2017.9.11)
発明者または考案者 【氏名】山崎 公俊
【氏名】ソービ アーノード
出願人 【識別番号】504180239
【氏名又は名称】国立大学法人信州大学
審査請求 未請求
要約 【課題】演算の負荷が少なく、かつ高速に結果出力が可能な、物体操作方法生成システムを提供する。
【解決手段】変形可能な対象について、操作手順を計画するシステムを提案する。アプローチとして、対象の挙動が学習された三次元畳み込み自己符号化器と、全結合再帰処理部のハイブリッドなニューラルネットワークのアーキテクチャを採用し、システムに開始状態と目標状態が与えられると、ネットワークは、全結合再帰処理部における入力操作に関する誤差後方伝搬を用いて、操作手順が生成される。
【選択図】図2
特許請求の範囲 【請求項1】
畳み込みニューラルネットワークを用いた操作方法生成システムであって、
対象の開始状態をシステムに入力する手段と、
対象の目標状態をシステムに入力する手段と、
前記畳み込みニューラルネットワークの畳み込み層により、対象の開始状態を符号化する手段と、
前記畳み込みニューラルネットワークの全結合ネットワークに、対象に対する操作パラメータを付加する手段と、
前記畳み込みニューラルネットワークの復号化層により、前記全結合ネットワークにより前記操作パラメータが付加された対象を復号化し、操作後状態を出力する手段と、
を備えることを特徴とする、操作方法生成システム。
【請求項2】
前記目標状態と、前記操作後状態との損失を計算し、該損失を所望の大きさにするよう最適化する手段と、前記操作パラメータを付加する手段に前記最適化する手段により算出された値をフィードバックする手段と、をさらに備えることを特徴とする、請求項1記載の操作方法生成システム。
【請求項3】
前記全結合ネットワークが、2以上直列に接続され、互いにデータを伝搬することを特徴とする、請求項1または2記載の操作方法生成システム。
【請求項4】
前記最適化する手段と、前記フィードバックする手段と、前記操作パラメータを付加する手段とを、2回以上反復することを特徴とする、請求項1~3のいずれか1項記載の操作方法生成システム。
【請求項5】
前記最適化する手段が、遺伝的アルゴリズムにより値を算出するものであることを特徴とする、請求項1~4のいずれか1項記載の操作方法生成システム。
【請求項6】
前記対象が、ボクセルデータで表されたデータであることを特徴とする、請求項1~5のいずれか1項記載の操作方法生成システム。


発明の詳細な説明 【技術分野】
【0001】
本発明は、操作方法生成システムに関し、特に、変形可能な物体に対する1または複数の操作手順を自動的に生成する操作方法生成システムに関する。
【背景技術】
【0002】
物体に対する操作の計画立案は、以前から困難な課題であった。操作をグラフや状態遷移図で表現すると、最短経路アルゴリズムは、入力された開始状態から目標状態へ至るための操作の経路を導き出すことが可能である。しかし、多くの操作では連続する変数が関与しており、それらをグラフ構造で表現するのは容易でない。または、十分に細かい精度で表現しようとすると、非現実的な大きさのグラフになってしまう。特に困難なのが、変形可能な対象に対する操作の計画であって、これは、単一操作の結果を予測すること自体が困難である。
【0003】
これをシミュレーション処理で正確に予測しようとすると、膨大な演算処理が必要となる。また、そうした処理は算出までに多くの時間がかかり、現実的でない。これまで、操作手順を手動で設計する手法が報告され、既定の操作手順において、一定の効果を上げている(非特許文献1)また、操作方法を予めデータベースに登録しておき、適宜に組み合わせる方法も報告されている(非特許文献2)。
【先行技術文献】
【0004】

【非特許文献1】Hiroyuki Yuba, Solvi Arnold and Kimitoshi Yamazaki: “Unfolding of a rectangular cloth from unarranged starting shapes by a Dual-Armed robot with a mechanism for managing recognition error and uncertainty,” Advanced Robotics, Vol. 31(10): 544-556, Feb. 2017.
【非特許文献2】Alex X. Lee, Abhishek Gupta, Henry Lu, Sergey Levine and Pieter Abbeel: “Learning from Multiple Demonstrations using Trajectory-Aware Non-Rigid Registration with Applications to Deformable Object Manipulation,” Proceedings of the 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp. 5265-5272, 2015.
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上記に挙げた方法は、いずれも、操作手順に関する種類が限定的であり、現実のように様々な操作が考えられる場合には適用が困難となるという課題があった。また、これらの方法では、計算の負荷が大きいという課題があった。本発明は、上記課題に対応してなされたものであり、演算の負荷が少なく、かつ高速に結果出力が可能な、物体操作方法生成システムを提供することを目的とする。
【課題を解決するための手段】
【0006】
即ち、本発明に係る物体の操作方法生成システムは、畳み込みニューラルネットワークを用いた操作方法生成システムであって、対象の開始状態をシステムに入力する手段と、対象の目標状態をシステムに入力する手段と、前記畳み込みニューラルネットワークの畳み込み層により、対象の開始状態を符号化する手段と、前記畳み込みニューラルネットワークの全結合ネットワークに、対象に対する操作パラメータを付加する手段と、前記畳み込みニューラルネットワークの復号化層により、前記全結合ネットワークにより前記操作パラメータが付加された対象を復号化し、操作後状態を出力する手段と、を備えることを特徴とする。
【0007】
また、請求項2に記載の本発明は、前記目標状態と、前記操作後状態との損失を計算し、該損失を所望の大きさにするよう最適化する手段と、前記操作パラメータを付加する手段に前記最適化する手段により算出された値をフィードバックする手段と、をさらに備えることを特徴とする、請求項1記載の操作方法生成システムである。
【0008】
また、請求項3記載の本発明は、前記全結合ネットワークが、2以上直列に接続され、互いにデータを伝搬することを特徴とする、請求項1または2記載の操作方法生成システムである。
【0009】
また、請求項4記載の本発明は、前記最適化する手段と、前記フィードバックする手段と、前記操作パラメータを付加する手段とを、2回以上反復することを特徴とする、請求項1~3のいずれか1項記載の操作方法生成システムである。
【0010】
また、請求項5記載の本発明は、前記最適化する手段が、遺伝的アルゴリズムにより値を算出するものであることを特徴とする、請求項1~4のいずれか1項記載の操作方法生成システムである。
【0011】
また、請求項6記載の本発明は、前記対象が、ボクセルデータで表されたデータであることを特徴とする、請求項1~5のいずれか1項記載の操作方法生成システムである。
【図面の簡単な説明】
【0012】
【図1】操作対象の布が操作されている状態のスナップショットである。
【図2】本発明に係る基本的なアーキテクチャの図である。
【図3】誤差逆伝搬によって操作方法を生成するアーキテクチャの図である。
【図4】遺伝的アルゴリズムによって操作方法を生成するアーキテクチャの図である。
【図5】実施例に係る処理を行うシステムアーキテクチャの図である。
【図6】操作手順として操作が複数回行われるイメージである。
【図7】実施例に係る処理を実際に行ったシミュレーションの結果である。
【発明を実施するための形態】
【0013】
以下、本発明に係る操作方法生成システムの実施の形態について説明する。

【0014】
本実施形態では、変形可能な対象について、操作手順を計画するシステムを提案する。アプローチとして、三次元畳み込み自己符号化器と、対象の挙動が学習された全結合再帰処理部のハイブリッドなニューラルネットワークのアーキテクチャを採用する。本実施形態におけるシステムにおいて、開始状態と目標状態が与えられると、ネットワークは、全結合再帰処理部における入力操作に関する誤差後方伝搬を用いて、操作手順が探索される。全結合再帰処理部の反復回数を設定することで、ユーザは、様々な長さの操作手順を探索することが可能になる。

【0015】
本実施形態における操作生成の課題は以下のように公式化できる。すなわち、対象が取り得る状態の集合をSとし、ユーザが取り得る操作の集合をMとする。また、状態aから状態bへ遷移させるための操作をmab<m,m...m>とし、開始状態sに操作mabを適用した場合の状態をsとする。

【0016】
本実施形態における操作方法生成システムにおいては、操作の対象として、四角形状を有する布が採用可能である。この場合、集合Sと集合Mについては、以下のとおり定義する。対象の布が操作されている状態のイメージを図1に示す。

【0017】
(集合S)
対象となる布が取り得る安定した状態を表したものである。安定した状態とは、外部からの操作がないときに、持続する状態のことをいう。例えば、対象の布が宙に浮いた状態は、安定した状態とは言えない。一方、重力に従って布が落ちた後の状態は、安定した状態である。

【0018】
(集合M)
平面上の座標[-1,1]からのベクトル3つの組み合わせで、対象に対する操作を表現する。3つのベクトルのうち、2つは対象となる布をつかむ位置であり、残る1つのベクトルは前記つかんだ布の移動を表している。ここで、つかむ位置は2つのベクトルで表現されているが、これらは3つ目のベクトルに従って、同じ方向に同じ距離だけ移動する。本実施では、1または複数の操作を組み合わせて、対象を目標状態へ遷移させる。

【0019】
(アーキテクチャ)
本実施形態における操作方法生成システムの一形態について、構成(アーキテクチャ)を図2に示す。このシステムは、三次元畳み込み自己符号化器と、再帰的全結合ネットワークとの組み合わせから構成される。全結合ネットワークでは、あらかじめ対象に対する操作がトレーニングされている。

【0020】
(畳み込み層)
畳み込み層として使用される自己符号化器は、エンコーダ(符号化部)とデコーダ(復号化部)の2つの構成部分に分割される。エンコーダとデコーダとの間に、反復した全結合ネットワークのインスタンスの可変数を挟む。

【0021】
本発明に係る操作方法生成システムでは、対象の例として変形可能な物体を例示しており、それらは、ボクセルデータとして表現されている。これらデータの活用のために、本発明に係る操作方法生成システムにおける畳み込み層としては、3D畳み込み層を使用する。3D畳み込み層は基本的なアイデアは2Dの畳み込み層のものと同様であるが、次元が増えたことにより演算量が増加することが想定される。この場合、開始状態として入力されるボクセルデータのデータ量を、処理が可能な範囲に制限することも有効である。

【0022】
(周期的境界畳み込み)
対象物である布が平らな面に置かれている。本発明において、ネットワークへの入力はボクセル空間形式で表される。計算上の制約のために、ボクセル空間を大量の物理空間にまで拡張することは困難である。布対象物をいかなる可能な形状に合わせるためにボクセル空間が拡張しうる最小限の物理空間を計算することは可能であるが、実用上は、ボクセル空間内で(前記面と平行な座標軸上で)周期的境界条件を導入することで対応することが望ましい。この場合、自己符号化器における畳み込み演算に、周期性が導入されている必要がある。畳み込みニューラルネットワークにおいては一般に、各畳み込み層においてピクセルの縁が失われるのを避けるためにマップはしばしばゼロで埋められる(zero-padding)。本実施形態では、ゼロではなくマップの反対側の(XとYの両方の次元)の値を使う。これにより、結果的に周期的な空間で畳み込みを行うのと同じ状態を実現する。

【0023】
(全結合ネットワーク)
全結合ネットワークでは、畳み込み層でエンコードされた対象に対し、操作後の状態を計算し、出力する。この構造は複雑で、ResNetと似た構造により実現される。全結合ネットワークを含むシステムの構成例を図3に示す。

【0024】
図3は、全結合層の組み合わせからなる全結合ネットワークの構成である。全結合ネットワークを構成する全結合層の数は特に制限されないが、図3では、4層の例を示している。図3において全結合ネットワークの各層は、それぞれ3つのセクションを有している。各セクションは、一般的なニューラルネットワークの挙動に加えて、それぞれ次の特徴を有する。第1セクション(図中10)は、渡された対象の状態をはじめに受け取る層である。当該層の後に接続された層では、前の層の活性化ベクターを受け取る。第1セクションは、対象物である布の状態を保持する。第2セクション(図中20)は、一般的なニューラルネットワークと同様の挙動をとる。第3セクション(図中30)では、操作内容が入力される。第3セクションでは、第2セクションに対して、ネットワークの外部から入力された操作に関する情報(操作パラメータ)を受け渡す。

【0025】
その後、操作パラメータ入力は、全結合ネットワークの各層に(同一に)提供される。これは、操作がすべての層で変更されていない形態で利用できることを保証するためである。この際の操作パラメータ入力は、全結合ネットワークを含むネットワーク全体のサイズと比較して十分に小さい。

【0026】
本発明の一形態において、全結合ネットワークとなるニューラルネットワークは、複数のインスタンスが存在するように構成することが可能である。この際、前記全結合ネットワークでは、必ずしも複数設ける必要はなく、一つの全結合ネットワークを反復して処理することで、見かけ上複数存在するよう構成することで実現可能である。

【0027】
あらかじめ訓練(トレーニング)されたネットワークでは、順方向伝搬(フォワードプロパゲーション)により、以下のステップで処理される。
1.開始状態(s)が入力される。ここでは対象の例を布として、データはボクセルデータとして入力される。
2.エンコーダにより、開始状態sがエンコードされる。
3.エンコードされた状態s’が、全結合ネットワークに渡される。
4.ステップ3.において、併せて全結合ネットワークに単一操作mが入力される。
5.全結合ネットワークがs’とmに基づいて、エンコードされた処理後状態s’を算出する。
6.デコードにより、エンコードされた操作後状態sb’から、操作後状態のボクセル表現sbを算出する。
以上がネットワークの動作に基づき状態を演算および出力する手順となる。前記演算が複数回行われ、一連の演算手順となる場合には、ステップ3.から5.の処理が繰り返される。この際には、2回目以降の処理に係る全結合ネットワークは、前回処理時の出力内容を状態s’として入力され、新たな処理m..の入力とで演算処理をすることとなる。

【0028】
以上まとめると、全結合ネットワークが順方向伝搬を用いて処理を行う場合には、次式に示されるように、開始状態sと操作手順mの入力により操作後状態sが出力されることとなる。
f(s,m)=s (1)
本発明のように、操作方法について求める場合には、上記とは異なり、開始状態と目標状態を入力し、操作を演算、出力する必要がある。
f(s,s)=m (2)
こうして操作方法を求める場合には、上記のような順方向伝搬処理より、誤差逆伝搬処理や、もしくは遺伝的アルゴリズムが好適に適用可能である。

【0029】
(誤差逆伝搬法による計画)
全結合ネットワークを介したフォワードプロパゲーション(順方向伝搬)により、対象の任意の状態において、任意の操作mを適用したときの状態の予測が可能である。操作方法生成のためには、開始状態sと目標状態sを与え操作手順mabを得る必要がある。これはバックプロパゲーション(誤差逆伝搬)によって実現することができる。誤差逆伝搬によって、操作手順生成を行う概念を図4に示す。この誤差逆伝搬のプロセスは、ネットワークをトレーニングするための誤差逆伝搬プロセスとは異なる。誤差逆伝搬による操作手順生成のプロセスは、次に示すとおりである。
1.mabのランダム操作手順を生成する([-1,1]の間隔のすべての値)。
2.状態sおよび操作手順mabをネットワークに送り、順方向伝播を実行して予測結果状態sを得る。
3.sを参照しながらsの損失を計算する。
4.誤差逆伝搬を実行して、前記損失を参照しながら操作入力値の変化傾向を取得する。この損失を減らすようにmabを調整する。
5.ステップ2~4を繰り返して、繰り返し回数を実行する。

【0030】
前記ステップは、異なる初期ランダム操作手順(パラレル検索の数を10に設定)と並行して行われる。なお、ステップ4.における操作入力を調査するためにレシリエントバックプロパゲーション(Rprop)の一種であるiRprop—更新ルールが用いられる。

【0031】
iRprop—更新ルールを使用すると、非常に高い降下率から開始することができ、速く解が求まるため、好適に適用可能である。前述のとおり、この誤差逆伝搬法の適用は、ネットワークに対するトレーニングではないため、ネットワークの重みは変更されず、操作入力ノード上の入力値のみが変更される。

【0032】
並列探索のそれぞれは、解の候補を生成する。それらのうち最終的な損失スコアが最も低いものを選択し操作手順として出力すればよい。

【0033】
(遺伝的アルゴリズムによる計画)
ネットワークから操作手順を得る別の方法は、遺伝的アルゴリズム(GA)によるものである。ここでも、入力値の集合を探査する。GAによる操作生成の概念を図5に示す。ここでも10回の探査を並行して実行するが、今回は誤差逆伝搬プロセスの代わりに遺伝的アルゴリズム(GA)処理を用いる。各GA処理は複数個のnpop解の集合(population)を有する。これらの解は操作入力ベクトル(すなわち、mab)の候補である。個々の解の適応度スコアは、その解(操作)のネットワーク計算の予測の損失スコア(sを参照)によって与えられる。したがって、適応度スコアを最小限に抑える必要がある。

【0034】
本実施の形態では、基本的なGAを実装しており、単純に切り捨て選択を使用し、解を適応度スコアでランク付けし、繰り返しごとに所定の基準以下のスコアとなった候補を破棄する。突然変異は、[-1、+ 1]の範囲から無作為に選ばれたrとともに、ある入力値にrintensityを追加する。強度(intensity)パラメータは、小さな突然変異と大きな突然変異との間のバランスを制御する(本実施の形態では5に設定した)。第2のタイプの突然変異オペレータは、操作列内において、2つの操作の順番を入れ替える。

【0035】
(最適な操作手順の長さの決定)
本発明に係る操作生成システムが、操作を生成する際には、あらかじめ操作手順の長さを設定する必要がある。与えられた(s、s)ペアに対する操作の最適な長さをあらかじめ計算するのは、一般的には困難であるが、本発明では、この問題に対する2つの簡単なアプローチを採用することでこれを解決する。なお、これら2つのうちいずれかのアプローチを適用した操作方法生成システムを、新たな発明として見出すことも可能である。
(逐次検索法)
操作手順の長さを求める1つ目のアプローチは、逐次検索法による方法である。具体的には、次のアルゴリズムを使用して、予めn(ループ回数)を決定せずに最適解を見つけることができる。
1.n = 1に設定する
2.nステップにおける解mabを見つける。
3.解mab の損失が事前設定された品質しきい値を超える場合は、n=n+1に設定してステップ2に戻る。そうでなければ、検索を終了する。

【0036】
(「ルーズフィット」法)
本発明の目的を達成する2つ目のアプローチとして、nに最初から大きい値を設定する方法が挙げられる。nが必要以上に大きい場合、操作手順にnull操作が含まれることがある。これは、布の外側にある掴み点を定義することによって、布の状態に影響を与えない操作となる。本発明に係る操作方法生成システムでは、null操作を検出し無視することによって、最適な長さに短縮することができる。
【実施例】
【0037】
(タスク設計)
本実施例では、自由形式の布操作タスクを取り入れる。ここでの目的は単一の予め設定された出力状態を達成することではなく、与えられた操作のレパートリーが状態空間を通していかに対象物を動かすかを学習するところにある(つまり、1つのアクションがどのように対象物の形と位置を変えるかを学習する)。そこで本実施例では任意の目標状態を実現する操作手順を学習するよう訓練されたネットワークを使う。
【実施例】
【0038】
操作方法生成における問題は以下のように定式化できる:まず、取り得る状態の集合Sよりなる状態領域、取り得る操作の集合Mよりなる操作(動作)領域M、および状態Sと状態S∈Sが与えられ、状態Sから開始する適用した操作手順mabが状態Sを生成するように操作手順mab=<m1,・・・・m>(ここでm∈M)を見出す。
【実施例】
【0039】
本実施例では、四角形状を有する布を1つの形状から他の形状に移行させる操作の課題を確立したタスクとして考える。状態はその布が取り得る安定な形状にあることを示す。操作は実際の値である二次元ベクトルの3集合体として定義される。このうち最初の2つのベクトルは、布がつかみ上げられた(以下に示すつかみ点)位置の座標を表し、3番目のベクトル(以下に示す変位ベクトル)はこれらの点がどの程度動かされたか(両方の点は一方を満たすように同じ方向に同じ距離動かされる)を示す。操作のシーケンスは、本実施例で操作手順、操作計画と呼ぶことがある。つかみ点が持ち上げられる高さはシステムパラメータである。2つのつかみ点のうちの1つは布から脱落してもよい。この場合単一の掴み点での操作になる。
【実施例】
【0040】
Blender 3D editor(登録商標)の布シミュレーション機能を用いて状態を生成した。まず正方形の布を平らな面(例えばテーブル)に置き、全部で7500の操作例のトレーニングデータとして長さ3の2500のランダムな操作シーケンスを生成した。
【実施例】
【0041】
(ネットワーク構成)
本実施例における基本的なシステムの構成(アーキテクチャ)を図5に示す。このアーキテクチャは三次元畳み込み自己符号化器よりなり、エンコーダ(符号化)部とデコーダ(復号化)部に挟まれた全結合型ネットワークを備える。本実施例では、この全結合型ネットワークを操作ネットワークとして利用した。このネットワークはテンソルフロー(オープンソースソフトウェア)により実装されている。ネットワークの設定を以下に示す。
【実施例】
【0042】
三次元畳み込みエンコーダ/逆畳み込みデコーダ:
・6層
・マップ数:32、32、64、128、256、512
(デコーダでは順序逆転する)
・カーネルサイズ:3×3×3(全層)
・ストライド(フィルタ適用の位置間隔):2×2×1(第一層)、2×2×2(その他全層)
・エンコーダとデコーダ間には結合重みが共有されない
【実施例】
【0043】
操作ネットワーク:
・10層
・入力層サイズ:512+6ニューロン
・隠れ層サイズ:512+512+6ニューロン
・出力層サイズ:512ニューロン
・状態エンコーディングニューロン間の残余結合
【実施例】
【0044】
布状態入力はBlender 3D editorから得られる布メッシュの二値ボクセルラスタライズ形式で与えられる。エンコーダはこの32×32×16ボクセル表示を512次元のベクトルに圧縮する。その後、操作ネットワークはこのベクトル表示と、入力としての操作を受け取り、この操作を布の状態に適用した結果生じる状態を表す512次元のベクトルを演算する。
【実施例】
【0045】
次に前記デコーダはこの表現を布状態の32×32×16ボクセル表現にデコード(復号)する。Blender 3D editorによって生成されたデータセット上でこのネットワークをトレーニング(訓練)する。なお、トレーニングはそれぞれの操作上で行われる(操作手順上では行われない)。
【実施例】
【0046】
前記ネットワークは20操作ごとに100万バッチのトレーニングを受ける。ランダムな回転、反転、掴み点の交換を適用することでデータが増強される。このときの損失関数はネットワーク出力(のボクセル表現)と実際の出力の二乗平均誤差と前記操作ネットワークの入力層と出力層との間の状態エンコードフォーマットの整合性を促進する項よりなる(この項の詳細はここでは割愛する)。重みづけはマンハッタン更新ルールを用いて更新される。上記トレーニングを受けることで、前記ネットワークは与えられた操作を与えられた布状態に適用した結果を正確に予測することが可能になる。
【実施例】
【0047】
(操作方法生成)
次に、このネットワークを使ってマルチステップの操作手順を生成した。nステップの計画を生成するために、前記操作ネットワークをn回にわたって繰り返し適用した。図6にn=3のときの概要を示す。状態Sを状態Sに変換する計画mabの探査は以下のように示される:
1.mabに対しランダムな初期化を行う
2.sとmabをネットワークに供給し予想出力sを得るためフォワードプロパゲーション(順方向伝搬処理)を行う。
3.sに関して、sに対する損失を計算する。
4.この損失に関して、操作入力値の勾配を得るため誤差逆伝搬処理を行う。
5.損失スコアが落ち着く(25繰り返しても改善しない)か、所定の繰り返し数(ここでは100回)が済むまで、ステップ2から4を繰り返す。
【実施例】
【0048】
操作入力値は iRprop—更新スキームによって調整される。本実施例においては、η+に対し2.0、η-に対し0.33が当システムにおいて良好に動作した。この探査プロセスの10回のインスタンスはGPU(GeForceGTX1080)上で並列に実行され、それぞれ異なる初期値から出発した。前記探査プロセスは一般に2~9秒かかった。残余損失スコアが最小の操作手順を最終結果として受け入れた。
【実施例】
【0049】
図7は、本実施例おいて開始状態と目標状態とを与えて、操作手順を生成させた例の図を示す。同図は、それぞれ対象となる布の平面図と、正面図、側面図とで表されている。図の右側にplanningと記載された行は、本実施例に係るシステムを用いて、それぞれの状態から目標状態に至る操作手順を生成した結果である。矢印で示されるのは、操作手順の第一操作を実際に行った結果である。図の布上、〇や×で示されるのは、つかみ点として与えられる座標と、移動先の座標である。また数字で表されるのは、操作後の状態と、目標状態との損失スコアである。
【産業上の利用可能性】
【0050】
本発明に係る操作方法生成システムを使用することで、例えば、医療、介護の現場などで、布を折りたたむ等の任意の形態に変形させる必要が生じた際に、処理を自動化し、ロボット等に行わせる際の制御アルゴリズムとして、活用することが可能である。
【符号の説明】
【0051】
10 第1セクション
20 第2セクション
30 第3セクション




図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6