Top > Search of Japanese Patents > SOUND LEARNING DEVICE

SOUND LEARNING DEVICE meetings

Patent code P08A013438
Posted date Jun 6, 2008
Application number P2006-252798
Publication number P2008-077177A
Patent number P4972739
Date of filing Sep 19, 2006
Date of publication of application Apr 3, 2008
Date of registration Apr 20, 2012
Inventor
  • (In Japanese)岩田 彰
  • (In Japanese)黒柳 奨
Applicant
  • (In Japanese)国立大学法人 名古屋工業大学
Title SOUND LEARNING DEVICE meetings
Abstract

PROBLEM TO BE SOLVED: To provide a sound learning device to learn separately sounds emitted from a plurality of sound sources.

SOLUTION: The sound learning device comprises a plurality of competitive learning neurons 1. Each competitive learning neuron 1 comprises a plurality of input parts 2 and is configured to fire when an internal potential value exceeds a threshold. Updating of connection weights so that a reference vector of a winner neuron approximates to an input vector are repeated for input vectors for learning. ON neurons 4 are provided in association with the respective input parts 2 to detect pulse signal leading edges. Each ON neuron 4 is configured to fire for a predetermined time from a pulse signal leading edge. A pulse signal output from each ON neuron 4 is used to change the connection weight on each input part 2 of each competitive learning neuron 1 to a nonzero value for the predetermined time from the pulse signal leading edge.

Outline of related art and contending technology (In Japanese)


下記非特許文献1には、聴覚情報処理システムのためのパルスニューロンモデルを用いた競合学習ニューラルネットワークが開示されている。以下、この非特許文献1に開示された競合学習ニューラルネットワークである音学習装置を「CONP」と言う。



パルスニューロンモデル(以下、「PNモデル」と言う。)とは、入出力信号としてパルス列を用いるニューロンモデルを言う。図1に、PNモデルの模式図を示す。このPNモデルでは、i番目の入力チャンネルからパルスxi(t)=1がi番目の入力部に到着すると、i番目の入力部の局所膜電位pi(t)が結合重みwi分上昇し、その後時定数τで静止電位まで減衰する。PNモデルの内部電位I(t)は、その時刻の各局所膜電位の総和として表される。PNモデルは、この内部電位が閾値TH以上となった時発火(すなわち、出力パルス「1」を発生)する。但し、神経細胞には発火に関する不応期RPが存在するため、このPNモデルにおいても、ある発火からRPの間は内部電位が閾値を超えた場合でも発火しない。以下、PNモデルを単にニューロンとも言う。



CONPは、聴覚情報処理システムにおける多次元ベクトルの次元圧縮及び代表ベクトルを用いたパターン変動の吸収を目的とする、PNモデルのみを用いたベクトル量子化ネットワークであり、Kohonenの競合学習モデルならびに自己組織化マップ(Self-Organizing Maps 以下、「SOM」と言う。)をパルスニューラルネットワークに適用したものである。



従来のSOMを用いた競合学習及び認識処理の動作フローを、図2に示す。この図は、M個のニューロンを有するパルスニューラルネットワークの各ニューロンに、n個のチャンネルを介して、入力パルスを各要素とする入力ベクトル(n次元データベクトル)xiが入力された場合の動作フローである。このニューラルネットワークは、入力ベクトルxiが入力されると(S01)、各ニューロンの評価値1/|wj-xi|を演算する(S02)。なお、wjはニューロンの参照ベクトル(結合重みを各要素とするベクトル)である。ニューロンの評価値は、参照ベクトルwjと入力ベクトルxiとのユークリッド距離が近い程高くなる。次に、ニューロンのうち評価値が最大となるもの(以下、「勝者ニューロン」とも言う。)を検索し(S03)、学習フェイズであれば、勝者ニューロンの参照ベクトルwjが入力ベクトルxiに近づくように結合重みを更新するとともに(S04)、勝者ニューロンの近傍のニューロンについても同様に結合重みを更新する(S05)。そして、評価値が最大のニューロンのラベルjを出力する(S06)。なお、既に学習を終えて実際に認識を行う場合、すなわち、学習フェイズでない場合は、結合重みの更新は行わない。そして、結合重みの更新(参照ベクトルの更新)のための係数を更新して、次の入力ベクトルについて、ステップS01~S06の処理を行う(S07)。



SOMアルゴリズムでは、参照ベクトルが入力ベクトルに最も近いニューロンを勝者ニューロンとし、勝者ニューロンの参照ベクトルを入力ベクトルに近づけるのみならず、勝者ニューロンの周辺のニューロンについても参照ベクトルを入力ベクトルに近づける。これにより、SOMでは、入力ベクトル群の位相関係を保持したベクトル量子化が可能となる。



CONPでは、かかるSOMアルゴリズムにより学習を行う。但し、CONPでは、入力ベクトルに近いか否かを、ユークリッド距離ではなく、入力ベクトルと参照ベクトルの内積EV=cosθ|w||x|(w:参照ベクトル、x:入力ベクトル、θ:両ベクトルのなす角)で評価し、この評価値の最も高かったニューロンを勝者ニューロンとしている。内部電位は局所膜電位の総和であり、局所膜電位の大きさは結合重みに比例し、かつ入力パルスの頻度に比例するため、入力ベクトルと参照ベクトルの内積による評価は、内部電位による評価と等価である。



また、CONPでは、評価値が最も高かったニューロンを検索するために、最も高い評価値を持ったニューロンだけが発火するように構成している。詳しくは、図3に示すように、外部に複数個の状態検出ニューロン、すなわち、競合学習ニューロンが1つも発火していないときに発火する無発火検出ニューロン(以下、「NFDニューロン」と言う。)11と、競合学習ニューロンが2つ以上発火しているときに発火する複数発火検出ニューロン(以下、「MFDニューロン」と言う。)12の2つの状態検出ニューロンを設け、それらの状態検出ニューロンの発火状況に応じて競合学習ニューロンの閾値を一律に変化させることで、唯一つの競合学習ニューロンが発火する状況を保持している。なお、NFDニューロン11、MFDニューロン12等との区別のために必要なときは、競合学習を行うニューロンを競合学習ニューロン(Competitive Learning Neuron)と言う。



図4-1、4-2に、CONPの動作フローを示す。CONPでは、n個のデータパルスからなる入力ベクトルx(t)=(x1(t),x2(t),…,xi(t),…,xn(t))が、単位時間毎に入力される(S101)。なお、tは時刻である。すると、CONPでは、NFDニューロンの出力値ynfd(t)を演算するとともに、MFDニューロンの出力値ymfd(t)を演算する(S102、S103)。次に、CONPの有するM個の競合学習ニューロンの内部電位Ij(t) (j=1,…,M)を演算し(S104)、内部電位Ij(t)が閾値THを超えたニューロンについては、y(t)=1を出力し、それ以外のニューロンについては、y(t)=0を出力する(S105)。なお、詳しい演算方法については後述する。そして、「1」を出力したニューロンについて結合重みを更新するとともに(S106)、そのニューロンの近傍のニューロンについても結合重みを更新し(S107)、参照ベクトルをノルム1に正規化する(S108)。なお、学習フェイズでない場合は、結合重みの更新は行わない。そして、結合重みの更新のための係数を更新して、次の入力ベクトルについて、ステップS101~108の処理を行う(S109)。



CONPにおける演算方法について説明する。まず、CONPにおけるPNモデルの動作を明確にするために、下記の式(数1)、(数2)により以下のように定義する。



システムをサンプリング周波数Fsの離散時間系とし、△t=1/Fsとする(△:デルタ)。ここで、引数として、時刻t、減衰時定数τ、結合重みw、時刻tにおける入力信号x(t)の4つを持つ関数Fを導入し、下記(数1)のように定義する。



【数式1】


すると、時刻tにおけるPNモデルの内部電位I(t)は、局所膜電位pi(t)の総和として、下記(数2)のように記述できる。



【数式2】


ここで、τはpi(t)の減衰時定数である。PNモデルの不応期をRP、時刻tにおける前回発火からの経過時間をET(t)とし、ET(0)>RPとすると、PNモデルの出力値y(t)は、以下のアルゴリズムにより計算される。



if I(t)≧TH and ET(t)>RP
then y(t)=1,ET(t)=0
else y(t)=0,ET(t)=ET(t-△t)+△t
パラメータτ、w1、w2、…、wn、THは、各PNモデルにより可変の値であり、この組合せにより各PNモデルの動作は決定される。



CONPでは、各ニューロンにおける入力ベクトルの類似度の評価値としてニューロンの内部電位I(t)を用いる。なお、上述したように、入力ベクトルと参照ベクトルの内積による評価と、内部電位による評価とは、同等である。そして、上述したように、状態検出ニューロンを用いて、最も評価値の高いニューロンのみが発火するように構成する。このように、CONPではネットワークにおいて発火した競合学習ニューロンを勝者ニューロンとするため、各ニューロンが発火した場合に学習を行う。学習すべき入力パターンの表現法としては、結合重みを1に固定したシナプスにおける局所膜電位pcwi(t)を用いる。図5に図3に対して学習に必要な要素を加えた競合学習用パルスニューロンモデルを示す。ここで入力パルス列数はnであり、このニューロンはM個ある競合学習ニューロンのh番目とする。図5において,時刻tにおけるNFDニューロン11、MFDニューロン12の出力をそれぞれynfd(t)、ymfd(t)、競合学習ニューロンのNFDニューロン11、MFDニューロン12に対する結合重みをそれぞれwfd、-wfd(但し、wfd>0)とすると、時刻tにおけるh番目の競合学習ニューロンの内部電位Ih(t)は前述の関数Fを用いて次式(数3)のように記述できる。



【数式3】


なお、CONPにおいてはpnfd、pmfdを発火閾値の動的変化量として扱うことで制御を行うため、減衰時定数τfdは時定数τに対して充分大きいものと仮定する。時刻uにおける勝者ニューロンの結合重みwwin,i(u)の更新は、学習係数をαとしたとき次式(数4)で表すことができる。



【数式4】


各更新の後,結合重みベクトルw(u)=(wwin,1(u),…,wwin,n(u))はノルムが1となるよう正規化される。



入力パルス列によって発生する内部電位の総量が大きく変動する場合,この変動量を吸収するために閾値の変化が生じることになり、閾値の変化が入力ベクトルの方向変化に追従できない場合がある。そこで、CONPでは内部電位I(t)に対して、pcwiの総和を一定の比率βpcw(但し、0≦βpcw≦1)であらかじめ差引くことで、入力信号のノルム変動に対する内部電位の変化を抑制している。これにより上記(数3)のIh(t)は以下の(数5)のように修正される。



【数式5】


以上のアルゴリズムによりパルスニューラルネットワークにおいてKohonenの競合学習を実現することが可能であり、これにより入力信号に含まれるスペクトルパターンなどが時々刻々と変化する場合でも、これを統計的に学習、ベクトル量子化することが可能である。なお、これまで述べて来た結合重みの更新を勝者ニューロンの近傍のニューロンに対しても適用することにより、SOMアルゴリズムは容易に実現可能である。



そして、CONPでは、非特許文献1の第5節に記載されているように、パルス頻度変調された時系列信号に対して競合学習が可能であり、聴覚情報処理システムのための競合学習ニューラルネットワークとして、十分な時間分解能、量子化分解能を持つことが確認されている。



なお、出願人による音源定位のための時間差検出器についての出願に、下記特許文献1がある。また、関連する文献として下記非特許文献2、3、4、5、6がある。

【特許文献1】特願2005-362915

【非特許文献1】黒柳奨、岩田彰、「聴覚情報処理システムのためのパルスニューロンモデルを用いた競合学習ニューラルネットワーク」、電子情報通信学会論文誌(D-II)、2004年7月、第J87-D-II巻、第7号、p.1496-1504

【非特許文献2】黒柳奨、平田浩一、岩田彰、「パルスニューラルネットワークのための競合学習手法」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2002年3月、NC2001-210、p.113-120

【非特許文献3】坂口晋也、黒柳奨、岩田彰、「環境把握のための音源識別システム」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、1999年12月、NC99-70、p.61-68

【非特許文献4】駒木根隆士、平原達也、「蝸牛の周波数分析機能を模擬するフィルターバンクの一構成法」、電子情報通信学会技術研究報告、社団法人電子情報通信学会、1987年、SP87-45、p.65-72

【非特許文献5】早川昭二、梶田将司、坂倉文忠、「蝸牛フィルタを用いた話者の個人性の分析・認識」、電子情報通信学会技術研究報告、社団法人電子情報通信学会、1992年、EA92-19、p.17-23

【非特許文献6】黒柳奨(Susumu Kuroyanagi)、岩田彰(Akira Iwata)、「聴覚情報処理パルスニューラルネットワークモデルを用いた音源定位のための両耳間時間差及び音圧差の抽出(Auditory Pulse Neural Network Model to Extract the Inter-Aural Time and Level Difference for Sound Localization)」、英文論文誌(情報・システム)(Transactions on Information and Systems)、電子情報通信学会(IEICE)、1994年、E77-DNo.4、p.466-474

Field of industrial application (In Japanese)


本発明は、パルスニューロンモデルを用いた音学習装置に関する。

Scope of claims (In Japanese)
【請求項1】
 
複数個の競合学習パルスニューロンモデル部(以下、「競合学習ニューロン」と言う。)を備え、
前記各競合学習ニューロンは、音信号から生成されたパルス信号が入力される複数個の入力部を備えて、各入力部が有する結合重みと各入力部に入力されたパルス信号とを用いて演算された内部電位値が、該競合学習ニューロンが有する閾値を超えたときに、発火するように構成され、
前記内部電位値が最も高かった前記競合学習ニューロン(以下、「勝者ニューロン」と言う。)について、結合重みから構成されてノルムを1としたベクトル(以下、「参照ベクトル」と言う。)が、入力されたパルス信号から構成されるベクトル(以下、「入力ベクトル」と言う。)に近づくように、結合重みを更新することを、各入力ベクトルについて繰り返すことにより学習を行う音学習装置において、
前記各入力部に対応して、パルス信号の立ち上がりを検出するための立ち上り検出パルスニューロンモデル部(以下、「ONニューロン」と言う。)が設けられ、
前記各ONニューロンは、パルス信号の立ち上がり時から所定時間だけ発火するように構成され、
前記各ONニューロンが出力したパルス信号を用いて、前記各競合学習ニューロンの各入力部の結合重みを、パルス信号の立ち上がり時から所定時間だけ非零となるように変化させる
ことを特徴とする音学習装置。
Industrial division
  • Computation controlling device
  • Electric application devices
IPC(International Patent Classification)
Drawing

※Click image to enlarge.

JP2006252798thum.jpg
State of application right Right is in force
(In Japanese)ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください。


PAGE TOP

close
close
close
close
close
close
close