Top > Search of Japanese Patents > METHOD, APPARATUS AND PROGRAM FOR ESTIMATION OF MOTION

METHOD, APPARATUS AND PROGRAM FOR ESTIMATION OF MOTION

Patent code P120007384
File No. PG09E06JP
Posted date Apr 23, 2012
Application number P2009-298796
Publication number P2011-081761A
Patent number P5467346
Date of filing Dec 28, 2009
Date of publication of application Apr 21, 2011
Date of registration Feb 7, 2014
Priority data
  • P2009-210991 (Sep 11, 2009) JP
Inventor
  • (In Japanese)広林 茂樹
  • (In Japanese)上田 貴晃
Applicant
  • (In Japanese)国立大学法人富山大学
Title METHOD, APPARATUS AND PROGRAM FOR ESTIMATION OF MOTION
Abstract PROBLEM TO BE SOLVED: To provide a motion estimation apparatus capable of estimating the motion of a moving object within a moving image by using a time-space spectrum obtained by three-dimensional analysis of the moving image with high accuracy and with small amounts of operations.
SOLUTION: When moving image data to be analyzed is input, the motion estimation apparatus calculates a frequency f', an amplitude A', and an initial phase Φ' as parameters of a Fourier transform equation of nonperiodic signals configured such that the square sum of the difference between a three-dimensional signal of the moving image data and a sine wave model signal represented by a phase and the amplitude A' using the frequency f' and the initial phase Φ' assumes a minimum value. The apparatus then extracts time-space spectra, segments a distribution of the extracted time-space spectra for each group of spectra forming a plane, estimates one or a plurality of groups of planes, and calculates the inclination of the group of planes estimated.
Outline of related art and contending technology (In Japanese)



動画像の圧縮符号化において、参照フレームからの移動物体の動き量を予測する動き予測技術は、動画像データの記述量を大幅に削減する上で極めて重要な技術である。





動き予測に広く使われている方法としては、MPEG-4 AVC/H.264として規格化されている方法が知られている。MPEG-4 AVC/H.264の動画像符号化技術で用いられる動き予測技術においては、動画像から得られるデータを時間領域又は空間領域において解析することによって動き予測を行っている。すなわち、この動き予測技術は、2次元の画素ブロックに対して整数精度の直交変換を行う解析手法であり、また、その解析は、動画像データを構成する前後のフレームを利用し、これら前後のフレームの画素情報から予測した予測誤差画像に対して行っている。





しかしながら、このような動き予測は、画素ブロック単位でのパターン認識に基づくものであることから、異なる方向へ移動する複数の物体や、複雑に形状を変えながら移動する物体については対応することができず、さらに別の手法を必要とする。





このような別の手法としては、動画像を、高さ、幅、時間からなる3次元信号として捉えて3次元解析し、得られた時空間スペクトルを利用して動画像内の移動物体の動きを予測する手法がある。





一般的に、移動物体を含む動画像を3次元解析して得られた時空間スペクトルのうち、高エネルギーを有するスペクトルに注目すると、これらのスペクトルは、3次元周波数領域空間において平面状に分布する平面群となる。この平面群の構成は、動画像内の物体の動きによって決まり、平面群の傾きを求めることによって動き予測が可能となる。したがって、複数のそれぞれ異なる動きをする移動物体を含む動画像の場合には、移動物体の数と平面の数とが等しくなるため、各平面の傾きをそれぞれ求めることにより、個々の物体の動きを予測することが可能となる。





しかしながら、周波数解析手法として通常用いられる高速フーリエ変換(Fast

Fourier Transform;FFT)や離散フーリエ変換(Discrete Fourier Transform;DFT)に代表される、等間隔な周波数分解幅を有する解析手法においては、分解能がフレーム長に依存し、動画像の解析において十分な分解能が得られないことから、分解能不足に起因して解析できない動きに対応するためには、さらに別の手法を組み合わせる必要がある。





例えば、非特許文献1には、FFTを用いて動画像を3次元解析して時空間スペクトルを得た後、時空間スペクトルで表される平面群の傾きを決定する方法として直線群フィルタを用いる手法が開示されている。





また、非特許文献2に記載された技術においては、平面推定を前提としたFFTアルゴリズムを利用して時空間周波数スペクトルを得ることによって動画像を3次元解析し、平面推定時にファジー推論を使用してスペクトルデータの誤差を補正することによって解析精度の向上を図っている。





一方、特許文献1には、本願発明者の一部が考案した周波数解析手法として、非周期信号の解析手法であるNon-Harmonic Analysis(NHA)が開示されている。このNHAは、解析対象信号と、周波数f’及び初期位相φ’を用いた位相と振幅A’とによって表される正弦波モデル信号との差の二乗和が最小値になるような周波数f’、振幅A’、及び初期位相φ’を、非周期信号のフーリエ変換式のパラメータとして算出するものである。

Field of industrial application (In Japanese)



本発明は、動画像内の移動物体の動き解析や動画像の圧縮符号化の分野に関し、特に、動画像内の1つ又は複数の移動物体の動きを推定する動き推定方法、動き推定装置、及び動き推定プログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
解析対象となる動画像データを、前記動画像データの3次元信号と、周波数及び初期位相を用いた位相と振幅とによって表される正弦波モデル信号との差の二乗和が最小値になるような前記周波数,前記振幅及び前記初期位相を、非周期信号のフーリエ変換式のパラメータとして求め、時空間スペクトルを抽出し、抽出された前記時空間スペクトル分布を、平面をなすスペクトル群毎に切り分けして1つ又は複数の平面群を推定し、推定された前記平面群の傾きを求めることで、前記動画像内の1つ又は複数の移動物体の動きを推定する動き推定方法であって、
前記時空間スペクトルに対して最小二乗法を用いたクラスタリングを行い、1つ又は複数の平面群を推定するに際し、前記時空間スペクトルが所定の平面に属するものとした場合の存在確率変数を1又は小数に設定し、最小二乗法を用いたクラスタリングを行うことを特徴とする動き推定方法。

【請求項2】
 
解析対象となる動画像データを入力する動画像入力手段と、入力された前記動画像データの3次元信号と、周波数及び初期位相を用いた位相と振幅とによって表される正弦波モデル信号との差の二乗和が最小値になるような前記周波数,前記振幅及び前記初期位相を、非周期信号のフーリエ変換式のパラメータとして求め、時空間スペクトルを抽出する時空間スペクトル抽出手段と、抽出された前記時空間スペクトル分布を、平面をなすスペクトル群毎に切り分けして1つ又は複数の平面群を推定する平面推定手段と、推定された前記平面群の傾きを求める傾き算出手段とが備わっており、前記動画像内の1つ又は複数の移動物体の動きを推定する動き推定装置であって、
前記時空間スペクトルに対して最小二乗法を用いたクラスタリングを行い、1つ又は複数の平面群を推定するに際し、前記時空間スペクトルが所定の平面に属するものとした場合の存在確率変数を1又は小数に設定し、最小二乗法を用いたクラスタリングを行う構成であることを特徴とする動き推定装置。

【請求項3】
 
解析対象となる動画像データを入力する動画像入力手段と、入力された前記動画像データの3次元信号と、周波数及び初期位相を用いた位相と振幅とによって表される正弦波モデル信号との差の二乗和が最小値になるような前記周波数,前記振幅及び前記初期位相を、非周期信号のフーリエ変換式のパラメータとして求め、時空間スペクトルを抽出する時空間スペクトル抽出手段、前記時空間スペクトル分布を、平面をなすスペクトル群毎に切り分けして1つ又は複数の平面群を推定する平面推定手段、及び、推定された前記平面群の傾きを求める傾き算出手段としてコンピュータを機能させ、前記動画像内の1つ又は複数の移動物体の動きを推定するコンピュータ実行可能な動き推定プログラムであって、
前記時空間スペクトルに対して最小二乗法を用いたクラスタリングを行い、1つ又は複数の平面群を推定するに際し、前記時空間スペクトルが所定の平面に属するものとした場合の存在確率変数を1又は小数に設定し、最小二乗法を用いたクラスタリングを行うことを特徴とする動き推定プログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2009298796thum.jpg
State of application right Registered
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close