TOP > 国内特許検索 > 動き推定方法、動き推定装置、及び動き推定プログラム

動き推定方法、動き推定装置、及び動き推定プログラム

国内特許コード P120007384
整理番号 PG09E06JP
掲載日 2012年4月23日
出願番号 特願2009-298796
公開番号 特開2011-081761
登録番号 特許第5467346号
出願日 平成21年12月28日(2009.12.28)
公開日 平成23年4月21日(2011.4.21)
登録日 平成26年2月7日(2014.2.7)
優先権データ
  • 特願2009-210991 (2009.9.11) JP
発明者
  • 広林 茂樹
  • 上田 貴晃
出願人
  • 国立大学法人富山大学
発明の名称 動き推定方法、動き推定装置、及び動き推定プログラム
発明の概要 【課題】 高精度に且つ少ない演算量で、動画像を3次元解析して得られた時空間スペクトルを利用して動画像内の移動物体の動きを推定することができる動き推定装置を提供する。
【解決手段】 動き推定装置は、解析対象となる動画像データを入力すると、その動画像データの3次元信号と、周波数f’及び初期位相φ’を用いた位相と振幅A’とによって表される正弦波モデル信号との差の二乗和が最小値になるような周波数f’、振幅A’、及び初期位相φ’を、非周期信号のフーリエ変換式のパラメータとして求め、時空間スペクトルを抽出し、抽出した時空間スペクトル分布を、平面をなすスペクトル群毎に切り分けして1つ又は複数の平面群を推定し、推定した平面群の傾きを求める。
【選択図】 図3
従来技術、競合技術の概要



動画像の圧縮符号化において、参照フレームからの移動物体の動き量を予測する動き予測技術は、動画像データの記述量を大幅に削減する上で極めて重要な技術である。





動き予測に広く使われている方法としては、MPEG-4 AVC/H.264として規格化されている方法が知られている。MPEG-4 AVC/H.264の動画像符号化技術で用いられる動き予測技術においては、動画像から得られるデータを時間領域又は空間領域において解析することによって動き予測を行っている。すなわち、この動き予測技術は、2次元の画素ブロックに対して整数精度の直交変換を行う解析手法であり、また、その解析は、動画像データを構成する前後のフレームを利用し、これら前後のフレームの画素情報から予測した予測誤差画像に対して行っている。





しかしながら、このような動き予測は、画素ブロック単位でのパターン認識に基づくものであることから、異なる方向へ移動する複数の物体や、複雑に形状を変えながら移動する物体については対応することができず、さらに別の手法を必要とする。





このような別の手法としては、動画像を、高さ、幅、時間からなる3次元信号として捉えて3次元解析し、得られた時空間スペクトルを利用して動画像内の移動物体の動きを予測する手法がある。





一般的に、移動物体を含む動画像を3次元解析して得られた時空間スペクトルのうち、高エネルギーを有するスペクトルに注目すると、これらのスペクトルは、3次元周波数領域空間において平面状に分布する平面群となる。この平面群の構成は、動画像内の物体の動きによって決まり、平面群の傾きを求めることによって動き予測が可能となる。したがって、複数のそれぞれ異なる動きをする移動物体を含む動画像の場合には、移動物体の数と平面の数とが等しくなるため、各平面の傾きをそれぞれ求めることにより、個々の物体の動きを予測することが可能となる。





しかしながら、周波数解析手法として通常用いられる高速フーリエ変換(Fast

Fourier Transform;FFT)や離散フーリエ変換(Discrete Fourier Transform;DFT)に代表される、等間隔な周波数分解幅を有する解析手法においては、分解能がフレーム長に依存し、動画像の解析において十分な分解能が得られないことから、分解能不足に起因して解析できない動きに対応するためには、さらに別の手法を組み合わせる必要がある。





例えば、非特許文献1には、FFTを用いて動画像を3次元解析して時空間スペクトルを得た後、時空間スペクトルで表される平面群の傾きを決定する方法として直線群フィルタを用いる手法が開示されている。





また、非特許文献2に記載された技術においては、平面推定を前提としたFFTアルゴリズムを利用して時空間周波数スペクトルを得ることによって動画像を3次元解析し、平面推定時にファジー推論を使用してスペクトルデータの誤差を補正することによって解析精度の向上を図っている。





一方、特許文献1には、本願発明者の一部が考案した周波数解析手法として、非周期信号の解析手法であるNon-Harmonic Analysis(NHA)が開示されている。このNHAは、解析対象信号と、周波数f’及び初期位相φ’を用いた位相と振幅A’とによって表される正弦波モデル信号との差の二乗和が最小値になるような周波数f’、振幅A’、及び初期位相φ’を、非周期信号のフーリエ変換式のパラメータとして算出するものである。

産業上の利用分野



本発明は、動画像内の移動物体の動き解析や動画像の圧縮符号化の分野に関し、特に、動画像内の1つ又は複数の移動物体の動きを推定する動き推定方法、動き推定装置、及び動き推定プログラムに関する。

特許請求の範囲 【請求項1】
解析対象となる動画像データを、前記動画像データの3次元信号と、周波数及び初期位相を用いた位相と振幅とによって表される正弦波モデル信号との差の二乗和が最小値になるような前記周波数,前記振幅及び前記初期位相を、非周期信号のフーリエ変換式のパラメータとして求め、時空間スペクトルを抽出し、抽出された前記時空間スペクトル分布を、平面をなすスペクトル群毎に切り分けして1つ又は複数の平面群を推定し、推定された前記平面群の傾きを求めることで、前記動画像内の1つ又は複数の移動物体の動きを推定する動き推定方法であって、
前記時空間スペクトルに対して最小二乗法を用いたクラスタリングを行い、1つ又は複数の平面群を推定するに際し、前記時空間スペクトルが所定の平面に属するものとした場合の存在確率変数を1又は小数に設定し、最小二乗法を用いたクラスタリングを行うことを特徴とする動き推定方法。

【請求項2】
解析対象となる動画像データを入力する動画像入力手段と、入力された前記動画像データの3次元信号と、周波数及び初期位相を用いた位相と振幅とによって表される正弦波モデル信号との差の二乗和が最小値になるような前記周波数,前記振幅及び前記初期位相を、非周期信号のフーリエ変換式のパラメータとして求め、時空間スペクトルを抽出する時空間スペクトル抽出手段と、抽出された前記時空間スペクトル分布を、平面をなすスペクトル群毎に切り分けして1つ又は複数の平面群を推定する平面推定手段と、推定された前記平面群の傾きを求める傾き算出手段とが備わっており、前記動画像内の1つ又は複数の移動物体の動きを推定する動き推定装置であって、
前記時空間スペクトルに対して最小二乗法を用いたクラスタリングを行い、1つ又は複数の平面群を推定するに際し、前記時空間スペクトルが所定の平面に属するものとした場合の存在確率変数を1又は小数に設定し、最小二乗法を用いたクラスタリングを行う構成であることを特徴とする動き推定装置。

【請求項3】
解析対象となる動画像データを入力する動画像入力手段と、入力された前記動画像データの3次元信号と、周波数及び初期位相を用いた位相と振幅とによって表される正弦波モデル信号との差の二乗和が最小値になるような前記周波数,前記振幅及び前記初期位相を、非周期信号のフーリエ変換式のパラメータとして求め、時空間スペクトルを抽出する時空間スペクトル抽出手段、前記時空間スペクトル分布を、平面をなすスペクトル群毎に切り分けして1つ又は複数の平面群を推定する平面推定手段、及び、推定された前記平面群の傾きを求める傾き算出手段としてコンピュータを機能させ、前記動画像内の1つ又は複数の移動物体の動きを推定するコンピュータ実行可能な動き推定プログラムであって、
前記時空間スペクトルに対して最小二乗法を用いたクラスタリングを行い、1つ又は複数の平面群を推定するに際し、前記時空間スペクトルが所定の平面に属するものとした場合の存在確率変数を1又は小数に設定し、最小二乗法を用いたクラスタリングを行うことを特徴とする動き推定プログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2009298796thum.jpg
出願権利状態 登録
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください。


PAGE TOP

close
close
close
close
close
close
close