TOP > 国内特許検索 > 音源定位・同定装置

音源定位・同定装置 新技術説明会

国内特許コード P08A013439
掲載日 2008年6月6日
出願番号 特願2006-260853
公開番号 特開2008-085472
登録番号 特許第4982743号
出願日 平成18年9月26日(2006.9.26)
公開日 平成20年4月10日(2008.4.10)
登録日 平成24年5月11日(2012.5.11)
発明者
  • 岩田 彰
  • 黒柳 奨
出願人
  • 国立大学法人 名古屋工業大学
発明の名称 音源定位・同定装置 新技術説明会
発明の概要

【課題】音源定位と音源同定の2つの機能の実装を容易化するとともに、実用的な演算速度を実現可能な音源定位・同定装置を提供する。
【解決手段】音源の方向を識別する音源定位部8と、音源の種類を識別する音源同定部9とを備え、音源定位部8と音源同定部9とは、いずれも、複数のパルスニューロンモデルを備えたニューラルネットワークにより構成され、各パルスニューロンモデルは、ディジタル回路により構成されている音源定位・同定装置1。
【選択図】図3

従来技術、競合技術の概要


音による周辺環境把握の基本機能は、音源方向を識別する音源定位と、音源種類を識別する音源認識(音源同定)であり、ニューラルネットワークを用いた音源認識装置(音源同定装置)には、下記非特許文献1、非特許文献2、特許文献1に記載されたものがある。また、ニューラルネットワークを用いた音源定位装置には、下記非特許文献3、非特許文献4、非特許文献5に記載されたものがある。さらに、音源定位装置の時間差検出機構を音源認識装置の前処理機構として用いるものもとして、下記非特許文献6に記載されたものがある。



なお、出願人による音源定位のための時間差検出器についての出願に、下記特許文献2がある。また、関連する文献として下記非特許文献7、8、9がある。

【特許文献1】特許第3164100号公報

【特許文献2】特願2005-362915

【非特許文献1】坂口晋也、「パルスニューロンモデルを用いた音源認識に関する研究」、名古屋工業大学平成9年度卒業論文、1998年3月

【非特許文献2】坂口晋也、黒柳奨、岩田彰、「環境把握のための音源識別システム」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、1999年12月、NC99-70、p.61-68

【非特許文献3】黒柳奨、岩田彰、「パルス伝達型聴覚神経回路モデルによる音源方向知覚-時間差・音圧差の抽出-」、電子情報通信学会技術研究報告、社団法人電子情報通信学会、1993年3月、NC92-149、p.163-170

【非特許文献4】黒柳奨、岩田彰、「パルスニューロンモデルのための教師あり学習則」、電子情報通信学会技術研究報告、社団法人電子情報通信学会、1998年3月、NC97-151、p.95-102

【非特許文献5】黒柳奨、平田浩一、岩田彰、「パルスニューラルネットワークのための競合学習手法」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2002年3月、NC2001-210、p.113-120

【非特許文献6】中尾裕之、黒柳奨、岩田彰、「パルスニューラルネットワークによる音源の方向情報を用いた音像抽出モデル」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2001年3月、NC2000-108、p.39-46

【非特許文献7】田中愛久、黒柳奨、岩田彰、「FPGAのためのニューラルネットワークのハードウェア化手法」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2001年3月、NC2000-179、p.175-182

【非特許文献8】二俣宣義、黒柳奨、岩田彰、「FPGAのためのパルスニューロンモデルの実装方法」、電子情報通信学会NC研究会技術研究報告、社団法人電子情報通信学会、2002年3月、NC2001-211、p.121-128

【非特許文献9】黒柳奨、岩田彰、「聴覚情報処理システムのためのパルスニューロンモデルを用いた競合学習ニューラルネットワーク」、電子情報通信学会論文誌(D-II)、2004年7月、第J87-D-II巻、第7号、p.1496-1504

産業上の利用分野


本発明は、音源定位と音源同定とを行う装置(以下、「音源定位・同定装置」と言う)に関し、特に、パルスニューロンモデルを用いた音源定位・同定装置に関する。

特許請求の範囲 【請求項1】
左右のマイクロフォンと、左の前記マイクロフォンに接続されて左の前記マイクロフォンから入力された左の入力信号を周波数成分毎に信号強度に応じたパルス頻度を持つパルス列(以下、「左信号」という。)に変換する左の入力信号処理部と、右の前記マイクロフォンに接続されて右の前記マイクロフォンから入力された右の入力信号を周波数成分毎に信号強度に応じたパルス頻度を持つパルス列(以下、「右信号」という。)に変換する右の入力信号処理部と、左右の前記入力信号処理部の両方に接続されて音源の方向を識別する音源定位部と、左右の前記入力信号処理部の少なくとも一方に接続されて音源の種類を識別する音源同定部とを備え、
前記音源定位部は、時間差特徴検出部と、前記時間差特徴検出部に接続された音源定位用抽出結果マッピング部とを備え、
前記音源同定部は、音源同定用周波数パターン検出部と、前記音源同定用周波数パターン検出部に接続された音源同定用検出パターンマッピング部とを備え、
前記時間差特徴検出部は、周波数成分毎に、それぞれ2つの入力端子と1つの出力端子とを有して両方の入力端子から同時に信号が入力されたときのみ発火するように構成された時間差検出用パルスニューロンモデルの列と、左信号用の時間遅れ素子の列と、右信号用の時間遅れ素子の列とを備えて、前記左信号用の時間遅れ素子の列を経由させることにより前記時間差検出用パルスニューロンモデルの列の一方の端から順に左信号を入力するとともに、前記右信号用の時間遅れ素子の列を経由させることにより前記時間差検出用パルスニューロンモデルの列の他方の端から順に右信号を入力することにより、入力信号間の時間差によって変化する特異パターンを出力するように構成され、
前記音源定位用抽出結果マッピング部は、
それぞれ複数の入力端子と1つの出力端子とを有する複数の第1競合学習パルスニューロンモデルと、複数の入力端子と1つの出力端子とを有し各入力端子が前記第1競合学習パルスニューロンモデルの出力端子に接続されて前記第1競合学習パルスニューロンモデルが1つも発火していないときに発火するように構成された第1無発火検出パルスニューロンモデルと、複数の入力端子と1つの出力端子とを有し各入力端子が前記第1競合学習パルスニューロンモデルの出力端子に接続されて前記第1競合学習パルスニューロンモデルが2つ以上発火しているときに発火するように構成された第1複数発火検出パルスニューロンモデルとを備え、前記各時間差検出用パルスニューロンモデルの出力端子、前記第1無発火検出パルスニューロンモデルの出力端子、及び、前記第1複数発火検出パルスニューロンモデルの出力端子が、前記各第1競合学習パルスニューロンモデルの入力端子に接続された第1ニューラルネットワーク、
から構成されて、認識時に前記時間差特徴検出部から入力された特異パターンを代表する参照ベクトルを持つ前記第1競合学習パルスニューロンモデルが発火するように構成され、
前記音源同定用周波数パターン検出部は、
それぞれ複数の入力端子と1つの出力端子とを有する複数の第2競合学習パルスニューロンモデルと、複数の入力端子と1つの出力端子とを有し各入力端子が前記第2競合学習パルスニューロンモデルの出力端子に接続されて前記第2競合学習パルスニューロンモデルが1つも発火していないときに発火するように構成された第2無発火検出パルスニューロンモデルと、複数の入力端子と1つの出力端子とを有し各入力端子が前記第2競合学習パルスニューロンモデルの出力端子に接続されて前記第2競合学習パルスニューロンモデルが2つ以上発火しているときに発火するように構成された第2複数発火検出パルスニューロンモデルとを備え、前記音源同定部に接続されている前記入力信号処理部の周波数成分毎の出力端子、前記第2無発火検出パルスニューロンモデルの出力端子、及び、前記第2複数発火検出パルスニューロンモデルの出力端子が、それぞれ前記各第2競合学習パルスニューロンモデルの入力端子に接続された第2ニューラルネットワーク、
から構成されて、認識時に前記入力信号処理部から入力された入力信号に存在する周波数パターンを代表する参照ベクトルを持つ前記第2競合学習パルスニューロンモデルが発火するように構成され、
前記音源同定用検出パターンマッピング部は、
それぞれ複数の入力端子と1つの出力端子とを有する複数の第3競合学習パルスニューロンモデルと、複数の入力端子と1つの出力端子とを有し各入力端子が前記第3競合学習パルスニューロンモデルの出力端子に接続されて前記第3競合学習パルスニューロンモデルが1つも発火していないときに発火するように構成された第3無発火検出パルスニューロンモデルと、複数の入力端子と1つの出力端子とを有し各入力端子が前記第3競合学習パルスニューロンモデルの出力端子に接続されて前記第3競合学習パルスニューロンモデルが2つ以上発火しているときに発火するように構成された第3複数発火検出パルスニューロンモデルとを備え、前記各第2競合学習パルスニューロンモデルの出力端子、前記第3無発火検出パルスニューロンモデルの出力端子、及び、前記第3複数発火検出パルスニューロンモデルの出力端子が、それぞれ前記各第3競合学習パルスニューロンモデルの入力端子に接続された第3ニューラルネットワーク、
から構成されて、認識時に前記音源同定用周波数パターン検出部から入力された発火パターンを代表する参照ベクトルを持つ前記第3競合学習パルスニューロンモデルが発火するように構成され、
前記各時間差検出用パルスニューロンモデル、前記各第1競合学習パルスニューロンモデル、前記第1無発火検出パルスニューロンモデル、前記第1複数発火検出パルスニューロンモデル、前記各第2競合学習パルスニューロンモデル、前記第2無発火検出パルスニューロンモデル、前記第2複数発火検出パルスニューロンモデル、前記各第3競合学習パルスニューロンモデル、前記第3無発火検出パルスニューロンモデル、及び、前記第3複数発火検出パルスニューロンモデルは、それぞれ、保持している内部電位値に各入力端子からの入力値と結合重みとの乗算値を加算することにより内部電位値を計算して保持し直す部分と、内部電位値をビットシフトと減算とにより減衰する部分と、内部電位値と閾値とを比較して比較結果に応じて出力パルスを出力する部分とを備えたディジタル回路により構成されている
ことを特徴とする音源定位・同定装置。
産業区分
  • 電子応用機器
  • その他通信
  • 演算制御装置
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2006260853thum.jpg
出願権利状態 権利存続中
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください。


PAGE TOP

close
close
close
close
close
close
close