TOP > 技術シーズ検索 > 調音特徴抽出装置、調音特徴抽出方法、及び調音特徴抽出プログラム

調音特徴抽出装置、調音特徴抽出方法、及び調音特徴抽出プログラム

シーズコード S120008999
掲載日 2012年2月22日
研究者
  • 新田 恒雄
技術名称 調音特徴抽出装置、調音特徴抽出方法、及び調音特徴抽出プログラム
技術概要 調音特徴抽出装置の記憶部207には、各種係数セット2071が記憶され、特徴分析部210、調音特徴抽出部220、及び調音運動修正部230より、係数セットが参照可能な状態にある。記憶部206には、発音単語辞書2061、隠れマルコフモデル2062、言語モデル2063、及びその他のデータが記憶され、単語分類部204より記憶されているデータが参照可能な状態にある。音声認識処理の流れにおいて、入力部201より入力された未知の音声は、A/D変換部202を通して離散化され、デジタル信号に変換される。そのデジタル信号は、特徴分析部210に出力され、特徴分析部210においてフーリエ解析及びフィルタリングされた結果、音声スペクトルデータが得られる。次に、調音特徴抽出部220において、調音特徴の時系列データである調音特徴系列が抽出される。そして調音運動修正部230において、調音特徴系列の変位成分より速度成分と加速度成分とが抽出され、各成分に基づき、ニューラルネットワークを経ることで、調音運動が修正される。修正された調音運動に基づき、単語分類部204において該当する単語が検索され、音声認識処理が実行される。
画像

※ 画像をクリックすると拡大します。

thum_2008-241072.gif
研究分野
  • パターン認識
  • 自然語処理
展開可能なシーズ 未知語への対応が可能であり、音声対話や音声検索からの要求に耐えうる高い音素識別精度を有する調音特徴抽出装置、調音特徴抽出方法、及び調音特徴抽出プログラムを提供する。
音声発話に伴う調音動作の特徴を高い精度で抽出することが可能となる。これにより、音声スペクトルを使用して音声を認識する従来の音声認識装置と比較して、精度の高い音声認識を行うことが可能となる。また、調音特徴の高精度抽出は、音素認識性能を飛躍的に向上させ、未知語の問題に対して人間が行っている対応と同様の対応を行うことが可能となる。従って、音素系列を利用した確認発話文の合成により、対話をスムースに進めることが可能になる。さらに、調音特徴は多くの場合、テキスト(かな系列に変換した読み)と一対一に対応するため、音声ドキュメントとテキストドキュメントに対する検索を、音声およびテキスト(キーボード)の双方から相互に検索することが可能となる。
用途利用分野 調音特徴抽出装置、調音特徴抽出プログラム、音声認識装置
出願特許   特許 国際特許分類(IPC)
( 1 ) 国立大学法人豊橋技術科学大学, . 新田 恒雄, . 調音特徴抽出装置、調音特徴抽出方法、及び調音特徴抽出プログラム. 特開2010-072446. 2010-04-02
  • G10L  15/02     
  • G10L  25/75     

PAGE TOP