TOP > 国内特許検索 > 移動体等の制御装置及び方法 > 明細書

明細書 :移動体等の制御装置及び方法

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第4543179号 (P4543179)
公開番号 特開2008-046693 (P2008-046693A)
登録日 平成22年7月9日(2010.7.9)
発行日 平成22年9月15日(2010.9.15)
公開日 平成20年2月28日(2008.2.28)
発明の名称または考案の名称 移動体等の制御装置及び方法
国際特許分類 G05B  13/02        (2006.01)
B63H  25/04        (2006.01)
FI G05B 13/02 J
G05B 13/02 B
B63H 25/04 D
請求項の数または発明の数 4
全頁数 12
出願番号 特願2006-219025 (P2006-219025)
出願日 平成18年8月10日(2006.8.10)
審査請求日 平成21年4月6日(2009.4.6)
特許権者または実用新案権者 【識別番号】504174135
【氏名又は名称】国立大学法人九州工業大学
発明者または考案者 【氏名】山川 烈
【氏名】前野 仁
個別代理人の代理人 【識別番号】110000154、【氏名又は名称】特許業務法人はるか国際特許事務所
審査官 【審査官】柿崎 拓
参考文献・文献 特開平05-274149(JP,A)
特開平05-274293(JP,A)
特開2004-303086(JP,A)
特開2000-099128(JP,A)
調査した分野 G05B 11/00-13/04
B63H 25/04
特許請求の範囲 【請求項1】
制御対象に関する制御量を制御する制御装置であって、
制御量を順次取得する制御量取得手段と、
前記制御量取得手段により取得される制御量に基づいて、該制御量が所定条件を満たすタイミングを始期及び終期とする時間範囲を順次判断する時間範囲判断手段と、
基準制御パラメータを記憶する基準制御パラメータ記憶手段と、
前記時間範囲判断手段により判断される時間範囲毎に、前記基準制御パラメータ記憶手段から読み出される基準制御パラメータに所定の変更を加え、変更が加わった基準制御パラメータに従って前記制御対象に関する制御量を制御する制御手段と、
前記時間範囲判断手段により順次判断される時間範囲において前記制御量取得手段により取得される制御量に基づいて、該時間範囲における制御の特徴を示す特徴ベクトルを順次算出する現在特徴ベクトル算出手段と、
複数の特徴ベクトルを記憶する特徴ベクトル記憶手段と
記特徴ベクトル記憶手段記憶される複数の特徴ベクトルのうち、前記現在特徴ベクトル算出手段により順次算出される特徴ベクトルと最も類似する特徴ベクトルを、該算出される特徴ベクトルに近づけるように順次更新する特徴ベクトル更新手段と、
前記現在特徴ベクトル算出手段により算出される特徴ベクトルとの類似度に基づいて、前記特徴ベクトル記憶手段に記憶される特徴ベクトルのうち1以上を選出するとともに、該選出される特徴ベクトルに応じた特徴ベクトルを取得する過去特徴ベクトル取得手段と、
前記過去特徴ベクトル取得手段により取得される特徴ベクトルに基づいて、該特徴ベクトルにより特徴が示される制御の評価値を算出する過去制御評価値算出手段と、
前記現在特徴ベクトル算出手段により算出される特徴ベクトルに基づいて、該特徴ベクトルにより特徴が示される制御の評価値を算出する現在評価値算出手段と、
前記過去評価値算出手段及び現在評価値算出手段により算出される評価値の差に基づいて、評価値の改善量を算出する評価値改善量算出手段と、
前記評価値改善量算出手段により算出される改善量に応じて、前記基準制御パラメータ記憶手段に記憶される基準制御パラメータに対して前記所定の変更に応じた変更を加えることによって、該基準制御パラメータを更新する基準制御パラメータ更新手段と、を含み、
前記制御手段は、前記基準制御パラメータ記憶手段から読み出される基準制御パラメータに所定値を加える変更及び該所定値を減じる変更を加え、それら変更が加わった基準制御パラメータに従って前記制御対象に関する制御量を制御し、
前記基準制御パラメータ更新手段は、前記所定値を加える変更及び該所定値を減じる変更を加えた場合における前記評価値改善量算出手段により算出される改善量の差に応じて、前記基準制御パラメータ記憶手段に記憶される基準制御パラメータに対して、前記所定値に応じた値を加える変更又は該値を減じる変更を加えることにより、該基準制御パラメータを更新する、
ことを特徴とする制御装置。
【請求項2】
請求項1に記載の制御装置において、
前記時間範囲判断手段は、前記制御量取得手段により取得される制御量に基づいて、該制御量が極値をとるタイミング、変曲するタイミング、所定値に一致するタイミングのうちいずれかを始期及び終期とする時間範囲を順次判断する、
ことを特徴とする制御装置。
【請求項3】
請求項1又は2に記載の制御装置において、
前記制御対象は移動体であり、
前記制御量はその進行方向であり、
前記制御手段は前記移動体に備えられた操舵装置を制御する、
ことを特徴とする制御装置。
【請求項4】
制御対象に関する制御量を制御する制御方法であって、
制御量を順次取得する制御量取得ステップと、
前記制御量取得ステップで取得される制御量に基づいて、該制御量が所定条件を満たすタイミングを始期及び終期とする時間範囲を順次判断する時間範囲判断ステップと、
前記時間範囲判断手段により判断される時間範囲毎に、基準制御パラメータ記憶手段から読み出される基準制御パラメータに所定の変更を加え、変更が加わった基準制御パラメータに従って前記制御対象に関する制御量を制御する制御ステップと、
前記時間範囲判断ステップで順次判断される時間範囲において前記制御量取得ステップで取得される制御量に基づいて、該時間範囲における制御の特徴を示す特徴ベクトルを順次算出する現在特徴ベクトル算出ステップと
徴ベクトル記憶手段に記憶される複数の特徴ベクトルのうち、前記現在特徴ベクトル算出手段により順次算出される特徴ベクトルと最も類似する特徴ベクトルを、該算出される特徴ベクトルに近づけるように順次更新する更新ステップと、
前記現在特徴ベクトル算出ステップで算出される特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶される特徴ベクトルのうち1以上を選出するとともに、該選出される特徴ベクトルに応じて特徴ベクトルを取得する過去特徴ベクトル取得ステップと、
前記過去特徴ベクトル取得ステップで取得される特徴ベクトルに基づいて、該特徴ベクトルにより特徴が示される制御の評価値を算出する過去制御評価値算出ステップと、
前記現在特徴ベクトル算出ステップで算出される特徴ベクトルに基づいて、該特徴ベクトルにより特徴が示される制御の評価値を算出する現在評価値算出ステップと、
前記過去評価値算出ステップ及び現在評価値算出ステップで算出される評価値の差に基づいて、評価値の改善量を算出する評価値改善量算出ステップと、
前記評価値改善量算出ステップで算出される改善量に応じて、前記基準制御パラメータ記憶手段に記憶される基準制御パラメータに対して前記所定の変更に応じた変更を加えることによって、該基準制御パラメータを更新する基準制御パラメータ更新ステップと、を含み、
前記制御ステップでは、前記基準制御パラメータ記憶手段から読み出される基準制御パラメータに所定値を加える変更及び該所定値を減じる変更を加え、それら変更が加わった基準制御パラメータに従って前記制御対象に関する制御量を制御し、
前記基準制御パラメータ更新ステップでは、前記所定値を加える変更及び該所定値を減じる変更を加えた場合における前記評価値改善量算出ステップで算出される改善量の差に応じて、前記基準制御パラメータ記憶手段に記憶される基準制御パラメータに対して、前記所定値に応じた値を加える変更又は該値を減じる変更を加えることにより、該基準制御パラメータを更新する、
ことを特徴とする制御方法。
発明の詳細な説明 【技術分野】
【0001】
本発明は制御装置及び方法に関し、特に試行錯誤により制御パラメータを最適化する制御装置及び方法に関する。
【背景技術】
【0002】
下記特許文献1には、船舶のヨーイング(船首揺)の時間範囲を判定するとともに、時間範囲毎にPID制御の制御パラメータKP,KI,KDに一時的変更を加えて使用し、船舶を設定方位に進行させるよう舵機を制御する制御方法が開示されている。この方法では、時間範囲毎に制御の良し悪しを評価し、直前の時間範囲よりも制御が改善しているか否かによって、制御パラメータを更新している。すなわち、下記特許文献1では、試行錯誤により制御パラメータを最適化する方法が開示されている。

【特許文献1】特許第3683890号公報(図9及び図10参照)
【発明の開示】
【発明が解決しようとする課題】
【0003】
上記特許文献1に記載の方法では、前後する時間範囲における制御の良し悪しを比較して、それにより制御パラメータを更新している。しかしながら、前後する時間範囲における外乱状況が大きく異なると、制御の良し悪しを比較することが無意味となり、結果として適切な制御パラメータの更新ができなくなるという問題がある。
【0004】
本発明は上記背景のもとでなされたものであって、その目的は、外乱状況によらず制御内容の評価を適正に行い、以って適切に制御パラメータを最適化することができる移動体等の制御装置及び方法を提供することにある。
【課題を解決するための手段】
【0005】
上記課題を解決するために、本発明に係る制御装置は、制御対象に関する制御量を制御する制御装置であって、制御量を順次取得する制御量取得手段と、前記制御量取得手段により取得される制御量に基づいて、該制御量が所定条件を満たすタイミングを始期及び終期とする時間範囲を順次判断する時間範囲判断手段と、基準制御パラメータを記憶する基準制御パラメータ記憶手段と、前記時間範囲判断手段により判断される時間範囲毎に、前記基準制御パラメータ記憶手段から読み出される基準制御パラメータに所定の変更を加え、変更が加わった基準制御パラメータに従って前記制御対象に関する制御量を制御する制御手段と、前記時間範囲判断手段により順次判断される時間範囲において前記制御量取得手段により取得される制御量に基づいて、該時間範囲における制御の特徴を示す特徴ベクトルを算出する現在特徴ベクトル算出手段と、複数の特徴ベクトルを記憶する特徴ベクトル記憶手段と、前記現在特徴ベクトル算出手段により算出される特徴ベクトルに基づいて、前記特徴ベクトル記憶手段の記憶内容を更新する特徴ベクトル更新手段と、前記現在特徴ベクトル算出手段により算出される特徴ベクトルとの類似度に基づいて、前記特徴ベクトル記憶手段に記憶される特徴ベクトルのうち1以上を選出するとともに、該選出される特徴ベクトルに応じた特徴ベクトルを取得する過去特徴ベクトル取得手段と、前記過去特徴ベクトル取得手段により取得される特徴ベクトルに基づいて、該特徴ベクトルにより特徴が示される制御の評価値を算出する過去制御評価値算出手段と、前記現在特徴ベクトル算出手段により算出される特徴ベクトルに基づいて、該特徴ベクトルにより特徴が示される制御の評価値を算出する現在評価値算出手段と、前記過去評価値算出手段及び現在評価値算出手段により算出される評価値に基づいて、評価値の改善量を算出する評価値改善量算出手段と、前記評価値改善量算出手段により算出される改善量に応じて、前記基準制御パラメータ記憶手段に記憶される基準制御パラメータに対して前記所定の変更に応じた変更を加えることによって、該基準制御パラメータを更新する基準制御パラメータ更新手段と、を含むことを特徴とする。
【0006】
また、本発明に係る制御方法は、制御対象に関する制御量を制御する制御方法であって、制御量を順次取得する制御量取得ステップと、前記制御量取得ステップで取得される制御量に基づいて、該制御量が所定条件を満たすタイミングを始期及び終期とする時間範囲を順次判断する時間範囲判断ステップと、前記時間範囲判断手段により判断される時間範囲毎に、基準制御パラメータ記憶手段から読み出される基準制御パラメータに所定の変更を加え、変更が加わった基準制御パラメータに従って前記制御対象に関する制御量を制御する制御ステップと、前記時間範囲判断ステップで順次判断される時間範囲において前記制御量取得ステップで取得される制御量に基づいて、該時間範囲における制御の特徴を示す特徴ベクトルを算出する現在特徴ベクトル算出ステップと、前記現在特徴ベクトル算出手段により算出される特徴ベクトルに基づいて、複数の特徴ベクトルを記憶する特徴ベクトル記憶手段の記憶内容を更新する更新ステップと、前記現在特徴ベクトル算出ステップで算出される特徴ベクトルとの類似度に基づいて、前記特徴ベクトル記憶手段に記憶される特徴ベクトルのうち1以上を選出するとともに、該選出される特徴ベクトルに応じて特徴ベクトルを取得する過去特徴ベクトル取得ステップと、前記過去特徴ベクトル取得ステップで取得される特徴ベクトルに基づいて、該特徴ベクトルにより特徴が示される制御の評価値を算出する過去制御評価値算出ステップと、前記現在特徴ベクトル算出ステップで算出される特徴ベクトルに基づいて、該特徴ベクトルにより特徴が示される制御の評価値を算出する現在評価値算出ステップと、前記過去評価値算出ステップ及び現在評価値算出ステップで算出される評価値に基づいて、評価値の改善量を算出する評価値改善量算出ステップと、前記評価値改善量算出ステップで算出される改善量に応じて、前記基準制御パラメータ記憶手段に記憶される基準制御パラメータに対して前記所定の変更に応じた変更を加えることによって、該基準制御パラメータを更新する基準制御パラメータ更新ステップと、を含むことを特徴とする。
【0007】
本発明によると、基準制御パラメータに試行的に変更が加えられ、その変更が加わった基準制御パラメータにより制御が実行される。そして、その制御の評価に応じて、基準制御パラメータが更新される。すなわち、本発明によると、試行錯誤により基準制御パラメータが最適化される。このとき、特徴ベクトル記憶手段には過去に算出された特徴ベクトル自体、又はそこから算出された特徴ベクトルが記憶されており、新たに特徴ベクトルが算出されると、該特徴ベクトルとの類似度に基づいて特徴ベクトル記憶手段に記憶される特徴ベクトルから1以上が選出される。そして、選出される特徴ベクトルに応じた特徴ベクトル、すなわち選出される特徴ベクトル自体又はそこから算出される特徴ベクトルにより特徴が示される制御の評価値から見た、現在算出されている特徴ベクトルにより特徴が示される制御の評価値の改善量(例えば両評価値の差)が算出され、これに応じて基準制御パラメータが更新される。本発明によると、類似した特徴を有する制御から見た評価の改善量を指標とするので、外乱状況によらず制御内容の評価を適正に行うことができ、この結果、適切に制御パラメータを最適化することができる。
【0008】
また、本発明の一態様によれば、前記制御手段は、前記基準制御パラメータ記憶手段から読み出される基準制御パラメータに所定値を加える変更及び該所定値を減じる変更を加え、それら変更が加わった基準制御パラメータに従って前記制御対象に関する制御量を制御し、前記基準制御パラメータ更新手段は、前記所定値を加える変更及び該所定値を減じる変更を加えた場合における前記評価値改善量算出手段により算出される改善量の差に応じて、前記基準制御パラメータ記憶手段に記憶される基準制御パラメータに対して、前記所定値に応じた値を加える変更又は該値を減じる変更を加えることにより、該基準制御パラメータを更新する。こうすれば、基準制御パラメータを増加させるのが良いか、減少させるのが良いか、を判断して、適切に制御パラメータを最適化できる。
【0009】
また、本発明の一態様によれば、前記時間範囲判断手段は、前記制御量取得手段により取得される制御量に基づいて、該制御量が極値をとるタイミング、変曲するタイミング、所定値に一致するタイミングのうちいずれかを始期及び終期とする時間範囲を順次判断する。こうすれば、制御量の変化の区切りを簡易に判断できる。
【0010】
また、本発明の一態様によると、前記制御対象は移動体であり、前記制御量はその進行方向であり、前記制御手段は前記移動体に備えられた操舵装置を制御する。こうすれば、船舶等の制御を好適に行うことができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の実施形態について図面に基づき詳細に説明する。
【0012】
図1は、本発明の一実施形態に係る自動操舵制御装置の構成を示す図である。同図に示すように、この自動操舵制御装置10は、船舶(制御対象)に備えられるものであり、針路設定部12、方位センサ14、舵角センサ15、舵機16、加算器18,24、制御パラメータ決定部20、PID制御部22及びデッドバンド処理部26を含んで構成されており、舵機16を自動操作して、船舶の船首方位を制御するようになっている。
【0013】
針路設定部12は、本船舶の進むべき方位θ(目標値)を出力する。この方位θは、方位設定つまみにより手動設定されてもよいし、例えば衛星測位システムを含んで構成される公知の船舶機器により演算生成されてもよい。この方位θは、真北を基準とし、そこからのずれ角を右(東)回りに0°~360°の範囲で表したものである。針路設定部12の出力は負符号を与えられて加算器18に供給されている。
【0014】
方位センサ14は、本船舶の舳先が現在向いている方位θ(制御量)を所定時間毎に出力する。この船首方位θも、真北を基準とし、そこからのずれ角を右(東)回りに0°~360°の範囲で表したものであり、加算器18に供給されている。なお、船首方位θは、例えばローパスフィルタを施してから出力してもよい(加算器18の出力に対してローパスフィルタを施してもよい)。
【0015】
舵機16は、本船舶に備えられた舵を例えば油圧ポンプやシリンダ等により駆動する舵機駆動部と、実舵角を指令舵角に一致させる舵機制御部と、を含んで構成された公知の船舶機器である。舵機16には、舵角センサ15が接続されており、該舵角センサ15から現在の舵角、すなわち実舵角δrが出力されるようになっている。実舵角δrは加算器24及びデッドバンド処理部26に供給されている。また、舵機16は、デッドバンド処理部26から指令舵角δr+δDを入力することにより、実舵角をδrからδr+δDに変化させるようになっている。
【0016】
加算器18は、方位センサ14から出力される船首方位θと針路設定部12から出力される基準方位θとの偏差を生成し、それをPID制御部22に供給している。なお、加算器18から出力される偏差θ-θは、±180°の範囲に正規化される。
【0017】
PID制御部22はPID制御(比例制御+積分制御+微分制御)を行う公知の制御手段であって、加算器18及び制御パラメータ決定部20の出力が供給されており、制御パラメータ決定部20から供給される制御パラメータ(比例係数KP、積分係数KI及び微分係数KD)に基づいて、加算器18から供給される方位偏差θ-θ(±180°の範囲に正規化したもの)から操舵量δPIDを算出する。このPID制御部22はハードウェアのみによって構成されてもよいし、コンピュータと該コンピュータが実行するプログラムによって構成されてもよく、具体的には、図2に示すように、PID制御部22は、積分器30、微分器36、係数乗算器32,34,38、加算器40を含んで構成されている。そして、加算器18から出力される偏差θ-θに対して、積分器30により積分するとともに、積分結果に対して係数乗算器32により積分係数KIを乗算してδIを生成する。また、並行して係数乗算器34により比例係数KPを乗算してδPを生成する。さらに、並行して微分器36により微分するとともに、微分結果に対して係数乗算器38により微分係数KDを乗算してδDを生成する。加算器40には、それらの演算結果が入力されており、総和を操舵量δPID(=δP+δI+δD)として出力するようになっている。
【0018】
この操舵量δPIDは加算器24に供給されている。加算器24には舵角センサ15から出力される実舵角δrも負符号を与えられて供給されており、操舵量δPIDと実舵角δrとの差分が演算されるようになっている。演算結果はデッドバンド処理部26に供給されている。
【0019】
デッドバンド処理部26は、入力値である操舵量δPIDと実舵角δrとの差分の絶対値が所定値DB未満である場合には内部値δDを零とし、それ以上の場合には入力値をそのまま内部値δDとする処理を行う。デッドバンド処理部26には舵角センサ15から実舵角δrも入力されている。そして、デッドバンド処理部26は、この実舵角δrと内部値δDとの和を出力し、舵機16に供給している。こうして、PID制御部22の出力舵角に不感帯を設けている。このデッドバンド処理部26も、ハードウェアのみによって構成されてもよいし、コンピュータと該コンピュータが実行するプログラムによって構成されてもよい。デッドバンド処理部26における入力値と内部値との関係は、図3に示される通りである。
【0020】
制御パラメータ決定部20は、PID制御部22において操舵量δPIDを決定するために用いる制御パラメータ(比例係数KP、積分係数KI及び微分係数KD)を決定する処理を行うものであり、加算器18から出力される偏差θ-θ、PID制御部22の係数乗算器32からの出力値δI、係数乗算器34の出力値δP、係数乗算器38の出力値δDが入力されている。制御パラメータ決定部20は、これらのデータに基づいて制御パラメータKP,KI,KDを決定する。この制御パラメータ決定部20も、ハードウェアのみによって構成されてもよいし、コンピュータと該コンピュータが実行するプログラムによって構成されてもよい。
【0021】
具体的には、制御パラメータ決定部20は、図4に示されるように、挙動検出部50、特徴ベクトル算出部52、データベース更新部54、特徴ベクトル抽出部56、特徴ベクトルデータベース58、評価値算出部60、評価値改善量算出部62、一時記憶部64、差分算出部66、基準制御パラメータ更新部68、基準制御パラメータ記憶部70、制御パラメータ供給部72を含んで構成されている。挙動検出部50には、加算器18から出力される偏差θ-θが入力されており、船舶の所定挙動(偏差θ-θが極大値をとるタイミングから再び極大値をとるタイミングまでの挙動(水平方向の船首揺,ヨーイング))の時間範囲を順次判断する。
【0022】
例えば、挙動検出部50に順次入力される偏差θ-θに基づいて、最新の偏差θ-θから直前の偏差θ-θの差分を順次計算し、その値が正から負に変化するタイミングを制御量である船首方位θが極大値をとるタイミングであると判断する。そして、このタイミングを直前の挙動の終了タイミング、且つ次の挙動の開始タイミングと判断する。すなわち、図5に示されるように、加算器18から出力される偏差θ-θは一般には増減を繰り返しており、図中波線で示される、偏差θ-θが極大値をとるタイミング、すなわち船首方位θが極大値をとるタイミングを検知し、それをある挙動の開始タイミング、且つ次の挙動の終了タイミングとして特徴ベクトル算出部52に供給するようになっている。なお、挙動検出部50は、その他、船首方位θが極小値をとるタイミングや、船首方位θの二階微分が符号反転するタイミング(変曲タイミング)、選手方位θが所定値(例えばθ)に一致するタイミング、あるいはそれらに対応するタイミングを、挙動の時間範囲の開始タイミングや終了タイミングとしてもよい。
【0023】
特徴ベクトル算出部52には、挙動検出部50から各挙動の開始タイミング及び終了タイミングが順次供給されるとともに、加算器18から偏差θ-θが順次供給されている。また、PID制御部22からδP,δI,δDが供給されている。特徴ベクトル算出部52は記憶手段を備えており、少なくとも1挙動分の偏差θ-θ,δP,δI,δDが記憶されるようになっている。そして、各挙動の時間範囲において加算器18から供給された偏差θ-θに基づいて、該挙動の特徴ベクトルの一部要素を算出するようになっている。また、各挙動の時間範囲においてPID制御部22から供給されるδP,δI,δDに基づいて、該挙動に関する特徴ベクトルの残りの要素を算出するようになっている。なお、特徴ベクトル算出部52に記憶手段を設けることなく、逐次特徴ベクトルを算出するようにしてもよい。
【0024】
ここでは、特徴ベクトル算出部52は、各挙動の特徴ベクトルの一部要素として、1つの挙動中に取得される偏差θ-θの平均値θc、1つの挙動中に取得される偏差θ-θの一階微分値ωの平均値ωc、1つの挙動中に取得される偏差θ-θの最大値と最小値との差Δθ(偏差θ-θの振幅)、1つの挙動中に取得される偏差θ-θの一階微分ωの最大値と最小値との差Δω(ωの振幅)を算出するようにしている。図6は、ある挙動に対応する偏差θ-θを、横軸が偏差θ-θであり、縦軸がその一階微分であるωである位相面に表したものであり、特徴ベクトル算出部52は、同図に示されるθc、ωc、Δθ及びΔωを特徴量として算出するようにしている。
【0025】
また、特徴ベクトル算出部52は、各挙動の特徴ベクトルの残りの要素として、1つの挙動中に取得される偏差θ-θの二階微分値αの平均値αc、1つの挙動中に取得される偏差θ-θの二階微分値αの最大値と最小値との差Δα、1つの挙動中に取得されるδP,δI,δDのそれぞれの最大値と最小値との差ΔδP,ΔδI,ΔδD(δP,δI,δDの各振幅)を算出するようにしている。すなわち、n回目の挙動の特徴ベクトルPは、次式(1)に示すように9つの成分を有する。なお、特徴ベクトルPの成分は、上記の9つの成分のうち一部であってもよい。また、他の数量を成分としてもよい。
=(θc,ωc,Δθ,Δω,αc,Δα,ΔδP,ΔδI,ΔδD) …(1)
【0026】
こうして算出される特徴ベクトルPは、データベース更新部54、特徴ベクトル抽出部56及び評価値算出部60に供給されている。特徴ベクトルデータベース58は、過去の挙動に関連する複数の特徴ベクトルを記憶しており、データベース更新部54は、特徴ベクトル算出部52により算出される特徴ベクトルに基づいて、その記憶内容を更新する。また、特徴ベクトル抽出部56は、特徴ベクトル算出部52により算出される特徴ベクトルとの類似度に基づいて、特徴ベクトルデータベース58に記憶される特徴ベクトルのうち、特徴ベクトル算出部52により算出される特徴ベクトルと最も類似する1つ(Pwin)を選び、それを評価値算出部60に供給する。
【0027】
具体的には、データベース更新部54、特徴ベクトル抽出部56及び特徴ベクトルデータベース58は、自己組織化マップ(SOM;Self-Organizing Map)を構成しており、特徴ベクトルデータベース58は、ニューラルネットワークの競合層に配置された各ユニットの重みベクトルとして特徴ベクトルを記憶している。そして、データベース更新部54は、特徴ベクトル算出部52により特徴ベクトルPが算出されると、該特徴ベクトルPと各重みベクトル(特徴ベクトル)との類似度(例えばユークリッド距離等)を算出し、最も小さな値の類似度(最も類似する)に対応する重みベクトル、及び競合層においてその重みベクトルに係るユニットの周辺に配置されたユニットの重みベクトルを、特徴ベクトル算出部52により算出される特徴ベクトルPに近づける処理を実行する。また、特徴ベクトル抽出部56は、特徴ベクトル算出部52により特徴ベクトルPが算出されると、該特徴ベクトルPと各重みベクトル(特徴ベクトル)との類似度(例えばユークリッド距離等)を算出し、最も小さな値の類似度に対応する重みベクトルを選出し、それを特徴ベクトルPwinとして評価値算出部60に供給する。なお、特徴ベクトル抽出部56は、特徴ベクトルPとの類似度に基づいて複数の重みベクトルを選出して、それら重みベクトルから特徴ベクトルPwinを合成してもよい。なお、データベース更新部54は、特徴ベクトル算出部52により算出される特徴ベクトルPをそのまま一定時間だけ特徴ベクトルデータベース58に記憶させておくものであってもよい。
【0028】
評価値算出部60は、特徴ベクトル算出部52により算出される特徴ベクトルPを次式(2)に代入して、その評価値Eを算出するとともに、特徴ベクトル抽出部56により算出される特徴ベクトルPwinを同式(2)に代入して、その評価値Ewinを算出する。なお、評価値は、特徴ベクトルの各成分の絶対値についての増加関数であれば、次式(2)に示されるものに限らない。
n=c1×(θc)+c2×(ωc)+c3×Δθ+c4×Δω+c5×(αc)
+c6×Δα+c7×ΔδP+c8×ΔδI+c9×ΔδD …(2)
【0029】
評価値改善量算出部62は、特徴ベクトル算出部52により算出される特徴ベクトルPに関する評価値Eと、特徴ベクトル抽出部56により抽出される特徴ベクトルPwinに関する評価値Ewinと、に基づいて、特徴ベクトルPwinにより特徴が示される制御から見た特徴ベクトルPにより特徴が示される制御の改善量ΔEを算出する。具体的には、次式(3)により改善量ΔEを算出する。こうして算出される改善量ΔEは一時記憶部64及び差分演算部66に供給される。
ΔE=E-Ewin …(3)
【0030】
基準制御パラメータ記憶部70は、PID制御部22に供給する制御パラメータK=(KP,KI,KD)を生成する際の基準となる基準制御パラメータK=(KP,KI,KD)を記憶するものである。制御パラメータ供給部72は、挙動検出部50により挙動が検出されると、基準制御パラメータ記憶部70に記憶される基準制御パラメータKを読み出し、この基準制御パラメータK0からΔK=(ΔKP,ΔKI,ΔKD)を減算して制御パラメータK-ΔK=(KP-ΔKP,KI-ΔKI,KD-ΔKD)を生成し、これをPID制御部22に供給する。また、次に挙動が検出されると、基準制御パラメータ記憶部70に記憶される基準制御パラメータKを再び読み出し、この基準制御パラメータKにΔK=(ΔKP,ΔKI,ΔKD)を加算して制御パラメータK+ΔK=(KP+ΔKP,KI+ΔKI,KD+ΔKD)を生成し、これをPID制御部22に供給し、これを繰り返す。すなわち、2回分の挙動を単位に、1回目の挙動では、基準制御パラメータKからΔKを減算したものをPID制御部22に供給し、2回目の挙動では、基準制御パラメータKにΔKを加算したものをPID制御22に供給している。
【0031】
一時記憶部64は一挙動分の時間だけ改善量ΔEを記憶するものである。差分算出部66には、一つ前の挙動における制御の特徴ベクトルPn-1に関する改善量ΔEn-1と、現在の挙動における制御の特徴ベクトルPに関する改善量ΔEと、が入力されており、次式(4)に示すように、後者から前者を差し引いた値ΔEを算出する。すなわち、ΔEは、基準制御パラメータKにΔKを加算したものを制御に用いた場合の改善量ΔEと、基準制御パラメータKからΔKを減算したものを制御に用いた場合の改善量ΔEn-1と、の差であり、この値は基準制御パラメータ更新部68に供給される。
ΔE=ΔE-ΔEn-1 …(4)
【0032】
基準制御パラメータ更新部68は、次式(5)に従って基準制御パラメータ記憶部70に記憶された基準制御パラメータK0を更新するものである。ここで、Knewは更新後の基準制御パラメータK、Koldは更新前の基準制御パラメータK、αは係数である。
new=Kold+α×ΔE×ΔK …(5)
【0033】
以上の自動操舵制御装置10では、方位θを順次取得して、この方位θが所定条件を満たすタイミングを始期及び終期とする時間範囲、すなわち挙動が順次判断される。そして各挙動の時間範囲毎に、基準制御パラメータ記憶部70から読み出される基準制御パラメータKに所定の変更(-ΔK又は+ΔK)を加え、変更が加わった基準制御パラメータK±ΔKに従って方位θが制御される。
【0034】
このとき、各挙動の時間範囲において取得される方位θに基づいて、該時間範囲における制御の特徴を示す特徴ベクトルPが算出される。そして、この特徴ベクトルPに基づいて、特徴ベクトルデータベース58の記憶内容が更新される。また、特徴ベクトルPとの類似度に基づいて、特徴ベクトルデータベース58に記憶される特徴ベクトル(重みベクトル)のうち1以上を選出するとともに、該選出される特徴ベクトルに応じた特徴ベクトルPwinが取得される。
【0035】
そして、特徴ベクトルPwinにより特徴が示される制御の評価値Ewin、及び特徴ベクトルPにより特徴が示される制御の評価値Eが算出され、その改善量ΔEが算出される。そして、この改善量ΔEに応じて、基準制御パラメータ記憶部70に記憶される基準制御パラメータKに対して、上記ΔKに応じた変更を加えること、すなわちα×ΔE×ΔKを加算することによって、基準制御パラメータK0が更新される。
【0036】
本実施形態によると、基準制御パラメータKに試行的に変更(±ΔK)が加えられ、その変更が加わった基準制御パラメータ(K±ΔK)により制御が実行される。そして、その制御の評価Enに応じて、基準制御パラメータKが更新される。このとき、特徴ベクトルデータベース58には過去に算出された特徴ベクトル自体、又はそこから算出された特徴ベクトルが重みベクトルとして記憶されており、新たに特徴ベクトルPが算出されると、該特徴ベクトルPとの類似度に基づいて特徴ベクトルデータベース58に記憶される特徴ベクトルから1つが特徴ベクトルPwinとして取得される。特徴ベクトルPwinにより特徴が示される制御の評価値Ewinから見た、現在算出されている特徴ベクトルPにより特徴が示される制御の評価値Eの改善量ΔEが算出され、これに応じて基準制御パラメータKが更新される。本実施形態よると、類似した特徴を有する制御から見た評価の改善量ΔEを指標とするので、外乱状況によらず制御内容の評価を適正に行うことができ、この結果、適切に制御パラメータを最適化することができる。
【図面の簡単な説明】
【0037】
【図1】本発明の実施形態に係る自動操舵制御装置の構成を示す図である。
【図2】操舵量決定部の構成を示す図である。
【図3】デッドバンド処理部の処理内容を説明する図である。
【図4】制御パラメータ決定部の構成を示す図である。
【図5】方位差(実方位と目標方位との差)の経時変化を示す図である。
【図6】挙動あたりの方位差とその一階微分の推移を位相面で示す図である。
【符号の説明】
【0038】
10 自動操舵制御装置、12 針路設定部、14 方位センサ、15 舵角センサ、16 舵機、18,24,40 加算器、20 制御パラメータ決定部、22 PID制御部、26 デッドバンド処理部、30 積分器、32 積分パラメータ乗算部、34 比例パラメータ乗算部、36 微分器、38 微分パラメータ乗算部、50 挙動検出部、52 特徴ベクトル算出部、54 データベース更新部、56 特徴ベクトル抽出部、58 特徴ベクトルデータベース、60 評価値算出部、62 評価値改善量算出部、64 一時記憶部、66 差分算出部、68 基準制御パラメータ更新部、70 基準制御パラメータ記憶部、72 制御パラメータ供給部。
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5