TOP > 国内特許検索 > 時間情報を用いた予測装置、予測方法、予測プログラムおよびそのプログラムを記録した記録媒体

時間情報を用いた予測装置、予測方法、予測プログラムおよびそのプログラムを記録した記録媒体

国内特許コード P140010838
整理番号 1920
掲載日 2014年8月11日
出願番号 特願2007-282843
公開番号 特開2009-110341
登録番号 特許第5071851号
出願日 平成19年10月31日(2007.10.31)
公開日 平成21年5月21日(2009.5.21)
登録日 平成24年8月31日(2012.8.31)
発明者
  • 岩田 具治
  • 田中 利幸
出願人
  • 日本電信電話株式会社
  • 国立大学法人京都大学
発明の名称 時間情報を用いた予測装置、予測方法、予測プログラムおよびそのプログラムを記録した記録媒体
発明の概要 【課題】時間とともに性質が変化する時系列データにおいて最新の時刻におけるデータを高い精度で予測することができる予測装置を提供すること。
【解決手段】予測装置1は、入力データ44から得られる、最新時刻における入出力サンプルデータに対する期待誤差が、入出力サンプルデータが与えられたときのモデルの誤差関数と、それぞれの入出力サンプルデータの時間情報の重みとを用いて近似された期待誤差を最小化させるように、重みを推定する重み推定部21と、推定された重みを用いた期待誤差に基づく目的関数と入力データ44とを用いて、サンプルデータ47から、最新時刻における未知の出力サンプルを予測するモデルパラメータ46を構築するモデル構築部22と、モデルパラメータ46と、サンプル47とに基づいて、最新時刻におけるサンプル47の未知の出力サンプルを予測する処理を行う予測処理部23とを備える。
【選択図】図1
従来技術、競合技術の概要



従来、生起順序が予め与えられている事象を示す学習データを学習することで、将来生じる事象を予測する予測問題に関する技術が知られている。この予測問題では、例えば、式(101)で示す入力サンプル(入力データ)xと、式(102)で示す出力サンプル(出力データ)yとを想定している。ここで、Xは入力サンプル集合、Yは出力サンプル集合を示す。入力サンプルxと出力サンプルyとには必ずしも因果関係がある訳ではない。そして、式(103)で示す入出力サンプル(x,y)が生成したときの時刻tを式(104)で定義する。ここで、Tは例えば最新の時刻を示す。そして、予測装置は、学習段階において、例えば式(105)で示す学習データを学習する。ここで、nはインデックスを示し、Nは学習データ数を示す。そして、予測装置は、予測段階において、式(106)で示すように、出力yが未知のサンプル(x,t)についてその出力yを予測する。





【数1】








この予測問題を、例えば、店舗側の購買予測に適用した場合には、出力サンプルyは購買商品を示し、入力サンプルxはそのときの購買履歴を示し、入出力サンプル(x,y)が生成したときの時刻tは購買時刻を示すこととなる。なお、インデックスnは例えば購買番号や購買者(ユーザ)を示し、学習データ数Nは例えば購買数や購買者数(ユーザ数)を示すこととなる。購買予測の場合のデータ(購買データ)の具体例を表1に示す。ここで、購買履歴としては1つ前に購買した商品とした。購買履歴および購買商品(入出力サンプル)は時系列データである。なお、x,y,tはすべて離散的なものとする。





【表1】








このような時系列データの多くは、時間とともにその性質が変化するものである。時間とともに性質が変化する時系列データとは、式(107)に示すように、時刻tにおける入出力の(確率)分布Pと、時刻t′における入出力の(確率)分布Pと、が異なるような時系列データである。なお、時系列データの一例として購買データを挙げたが、時系列データには、例えば、ニュース記事データ、論文データ、Webサーフィンデータ等が含まれる。





【数2】








時間とともにその性質が変化する時系列データの具体例を説明するために、ここでは、購買データを考える。例えば、商品販売の予測においては、現実にはメーカや店舗の経営戦略や都合に起因して、新商品の発表や発売中止等の突発的な事象が生じる。そのため、このような最新の情報を予測に反映させることにより、予測される商品候補(出力される商品候補)は日々変化することとなる。また、季節や流行、社会的、経済的環境等の大局的な事象の変化により、各商品の出力分布(予測される確率分布)も変化する。





この購買データから、次にユーザが購入すると思われる商品を高い精度で予測できれば、その商品をユーザにリコメンドすることができる。従来、例えば、オンラインショッピング等の商品について購買順序を考慮した予測精度の高いリコメンド技術が知られている(例えば、非特許文献1参照)。

【非特許文献1】

田具治、山田武士、上田修功、“購買順序を考慮した協調フィルタリング”、人工知能と知識処理研究会、AI2007-3,13-18,2007

産業上の利用分野



本発明は、生起順序が予め与えられている事象を示す学習データを学習することで将来生じる事象を予測する予測装置、予測方法、予測プログラムおよびそのプログラムを格納した記録媒体に関する。

特許請求の範囲 【請求項1】
学習用サンプルデータの系列である系列データおよび予測用サンプルデータを入力する入力手段と、
演算手段と、
前記入力された系列データと前記予測用サンプルデータとを格納すると共に前記演算手段による演算処理結果を記憶する記憶手段と、
前記演算手段による予測結果を出力する出力手段と、を備え、
前記学習用サンプルデータを、時間または地域に応じて性質が変化する第1観測データと、前記第1観測データに関連して時間または地域に応じて性質が変化する第2観測データと、前記第1および第2観測データに対応する時間または地域の情報の離散値を示す指標情報と、の3つの要素を有するデータとし、
前記予測用サンプルデータを、前記学習用サンプルデータを構成する3つの要素のうち、前記第2観測データが未知であり前記第1観測データおよび前記指標情報が既知であるデータとしたとき、
前記演算手段は、
前記指標情報の予め定められた離散値における前記系列データの真の分布を近似するために、前記指標情報の各離散値における経験分布に混合される予め定められた混合比と、前記系列データにおける所定の学習用サンプルデータの前記第1および第2観測データとを条件として、前記第1および第2観測データの前記指標情報に対する事後確率をそれぞれ推定する事後確率推定手段と、
前記推定されたそれぞれの事後確率を利用して、前記指標情報の前記予め定められた離散値における前記系列データに対する尤度を最大化するように、前記混合比を推定し、前記尤度が最大化されたときの前記混合比から前記指標情報の重みを決定する混合比推定手段と、
前記決定された指標情報の重みを前記記憶手段に書き込む重み書込手段と、
前記記憶手段から前記決定された指標情報の重みを読み込んで、当該重みを用いた期待誤差に基づく目的関数と前記系列データとを用いて、前記予測用サンプルデータから、前記指標情報の前記予め定められた離散値における前記未知の第2観測データを予測するモデルを構築して前記記憶手段に書き込むモデル構築手段と、
前記記憶手段から前記構築されたモデルと前記予測用サンプルデータとを読み込んで、前記構築されたモデルと、前記予測用サンプルデータとに基づいて、前記指標情報の前記予め定められた離散値における当該予測用サンプルデータの前記未知の第2観測データを予測する処理を行う予測処理手段とを備えることを特徴とする予測装置。

【請求項2】
学習用サンプルデータの系列である系列データおよび予測用サンプルデータを入力する入力手段と、
演算手段と、
前記入力された系列データと前記予測用サンプルデータとを格納すると共に前記演算手段による演算処理結果を記憶する記憶手段と、
前記演算手段による予測結果を出力する出力手段と、を備え、
前記学習用サンプルデータを、時間または地域に応じて性質が変化する第1観測データと、前記第1観測データに関連して時間または地域に応じて性質が変化する第2観測データと、前記第1および第2観測データに対応する時間または地域の情報の離散値を示す指標情報と、の3つの要素を有するデータとし、
前記系列データを、第2観測データyが与えられたときの第1観測データxの分布が、異なる前記指標情報の離散値において類似している学習用サンプルデータの系列とし、
前記予測用サンプルデータを、前記学習用サンプルデータを構成する3つの要素のうち、前記第2観測データが未知であり前記第1観測データおよび前記指標情報が既知であるデータとしたとき、
前記演算手段は、
前記指標情報の予め定められた離散値における前記系列データの真の分布を近似するために、前記指標情報の各離散値における経験分布に混合される予め定められた混合比と、前記系列データにおける所定の学習用サンプルデータの前記第2観測データを条件として、前記第2観測データの前記指標情報に対する事後確率をそれぞれ推定する事後確率推定手段と、
前記推定されたそれぞれの事後確率を利用して、前記指標情報の前記予め定められた離散値における前記系列データに対する尤度を最大化するように、前記混合比を推定し、前記尤度が最大化されたときの前記混合比から前記指標情報の重みを決定する混合比推定手段と
前記決定された指標情報の重みを前記記憶手段に書き込む重み書込手段と、
前記記憶手段から前記決定された指標情報の重みを読み込んで、当該重みを用いた期待誤差に基づく目的関数と前記系列データとを用いて、前記予測用サンプルデータから、前記指標情報の前記予め定められた離散値における前記未知の第2観測データを予測するモデルを構築して前記記憶手段に書き込むモデル構築手段と、
前記記憶手段から前記構築されたモデルと前記予測用サンプルデータとを読み込んで、前記構築されたモデルと、前記予測用サンプルデータとに基づいて、前記指標情報の前記予め定められた離散値における当該予測用サンプルデータの前記未知の第2観測データを予測する処理を行う予測処理手段とを備えることを特徴とする測装置。

【請求項3】
前記モデル構築手段は、
前記推定された指標情報の重みと、前記重みのハイパーパラメータと、前記近似された期待誤差における誤差関数とに基づく目的関数を最小化させるように、前記系列データおよび前記推定された重みに基づいてモデルを学習することで、前記予め定められた離散値におけるモデルを推定するモデルパラメータ推定手段と、
前記推定されたモデルに対して適用される前記誤差関数を最小化させるように、前記ハイパーパラメータを推定するハイパーパラメータ推定手段と、を備え、
前記モデルパラメータ推定手段は、
前記誤差関数が最小化されたときの前記ハイパーパラメータを用いて推定されたモデルを構築すべきモデルとして決定することを特徴とする請求項1または請求項に記載の予測装置。

【請求項4】
学習用サンプルデータの系列である系列データおよび予測用サンプルデータを入力する入力手段と、
演算手段と、
前記入力された系列データと前記予測用サンプルデータとを格納すると共に前記演算手段による演算処理結果を記憶する記憶手段と、
前記演算手段による予測結果を出力する出力手段と、を備える予測装置の予測方法であって、
前記学習用サンプルデータを、時間または地域に応じて性質が変化する第1観測データと、前記第1観測データに関連して時間または地域に応じて性質が変化する第2観測データと、前記第1および第2観測データに対応する時間または地域の情報の離散値を示す指標情報と、の3つの要素を有するデータとし、
前記予測用サンプルデータを、前記学習用サンプルデータを構成する3つの要素のうち、前記第2観測データが未知であり前記第1観測データおよび前記指標情報が既知であるデータとしたとき、
前記予測装置の演算手段は、
前記指標情報の予め定められた離散値における前記系列データの真の分布を近似するために、前記指標情報の各離散値における経験分布に混合される予め定められた混合比と、前記系列データにおける所定の学習用サンプルデータの前記第1および第2観測データとを条件として、前記第1および第2観測データの前記指標情報に対する事後確率をそれぞれ推定するステップと、
前記推定されたそれぞれの事後確率を利用して、前記指標情報の前記予め定められた離散値における前記系列データに対する尤度を最大化するように、前記混合比を推定し、前記尤度が最大化されたときの前記混合比から前記指標情報の重みを決定するステップと、
前記決定された指標情報の重みを前記記憶手段に書き込むステップと、
前記記憶手段から前記決定された指標情報の重みを読み込んで、当該重みを用いた期待誤差に基づく目的関数と前記系列データとを用いて、前記予測用サンプルデータから、前記指標情報の前記予め定められた離散値における前記未知の第2観測データを予測するモデルを構築して前記記憶手段に書き込むモデル構築ステップと、
前記記憶手段から前記構築されたモデルと前記予測用サンプルデータとを読み込んで、前記構築されたモデルと、前記予測用サンプルデータとに基づいて、前記指標情報の前記予め定められた離散値における当該予測用サンプルデータの前記未知の第2観測データを予測する処理を行う予測処理ステップと、を含んで実行することを特徴とする予測方法。

【請求項5】
学習用サンプルデータの系列である系列データおよび予測用サンプルデータを入力する入力手段と、
演算手段と、
前記入力された系列データと前記予測用サンプルデータとを格納すると共に前記演算手段による演算処理結果を記憶する記憶手段と、
前記演算手段による予測結果を出力する出力手段と、を備える予測装置の予測方法であって、
前記学習用サンプルデータを、時間または地域に応じて性質が変化する第1観測データと、前記第1観測データに関連して時間または地域に応じて性質が変化する第2観測データと、前記第1および第2観測データに対応する時間または地域の情報の離散値を示す指標情報と、の3つの要素を有するデータとし、
前記系列データを、第2観測データyが与えられたときの第1観測データxの分布が、異なる前記指標情報の離散値において類似している学習用サンプルデータの系列とし、
前記予測用サンプルデータを、前記学習用サンプルデータを構成する3つの要素のうち、前記第2観測データが未知であり前記第1観測データおよび前記指標情報が既知であるデータとしたとき、
前記予測装置の演算手段は、
前記指標情報の予め定められた離散値における前記系列データの真の分布を近似するために、前記指標情報の各離散値における経験分布に混合される予め定められた混合比と、前記系列データにおける所定の学習用サンプルデータの前記第2観測データを条件として、前記第2観測データの前記指標情報に対する事後確率をそれぞれ推定するステップと、
前記推定されたそれぞれの事後確率を利用して、前記指標情報の前記予め定められた離散値における前記系列データに対する尤度を最大化するように、前記混合比を推定し、前記尤度が最大化されたときの前記混合比から前記指標情報の重みを決定するステップと、
前記決定された指標情報の重みを前記記憶手段に書き込むステップと、
前記記憶手段から前記決定された指標情報の重みを読み込んで、当該重みを用いた期待誤差に基づく目的関数と前記系列データとを用いて、前記予測用サンプルデータから、前記指標情報の前記予め定められた離散値における前記未知の第2観測データを予測するモデルを構築して前記記憶手段に書き込むモデル構築ステップと、
前記記憶手段から前記構築されたモデルと前記予測用サンプルデータとを読み込んで、前記構築されたモデルと、前記予測用サンプルデータとに基づいて、前記指標情報の前記予め定められた離散値における当該予測用サンプルデータの前記未知の第2観測データを予測する処理を行う予測処理ステップと、を含んで実行することを特徴とする予測方法。

【請求項6】
請求項4または5に記載の予測方法をコンピュータに実行させるための予測プログラム。

【請求項7】
請求項6に記載の予測プログラムが記録されたことを特徴とするコンピュータ読み取り可能な記録媒体。
国際特許分類(IPC)
Fターム
  • 5L049AA04
  • 5L049DD01
画像

※ 画像をクリックすると拡大します。

JP2007282843thum.jpg
出願権利状態 登録
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください。


PAGE TOP

close
close
close
close
close
close
close