TOP > 技術シーズ検索 > 音声対話装置、音声対話方法及びロボット装置

音声対話装置、音声対話方法及びロボット装置

シーズコード S110006655
掲載日 2011年11月30日
研究者
  • 小林 哲則
  • 藤江 真也
  • 渡辺 大地
技術名称 音声対話装置、音声対話方法及びロボット装置
技術概要 音声対話装置1は、話者の発音を集音し、音声信号として得る音声入力部2と、音声入力部2で得られた音声信号に基づき話者の音声の韻律的特徴を示す情報を計算するFO抽出・パワー計算部3と、韻律情報に基づき少ない情報量で音声の特徴を表す情報を算出し、この音声特徴量を用いて相槌音を出力するタイミングを推測する推測部4と、推測部4で推測した相槌タイミングで相槌音を出力するか否かを相槌判定部5で最終的に判定し、その判定結果により所定の相槌タイミングで相槌音を相槌手段としてのスピーカ6から出力する出力部7とから構成される。この音声対話装置1は、話者と対話を行う対話モード時、音声入力部2から話者の音声信号が入力されると、既に記憶部10に記憶されている複数の学習時音声特徴量を用いて相槌音の相槌タイミングを決定し、この相槌タイミングで相槌音を出力することにより話者が発話し易くなると判定したときにのみ、決定した相槌タイミングで相槌音を出力し、これにより話者と円滑な対話が行える。この場合、音声対話装置1は、始めに複数の話者の音声信号に基づいて予め学習時音声特徴量を生成して記憶部10に記憶しておく必要である。
画像

※ 画像をクリックすると拡大します。

thum_2007-161998.gif
研究分野
  • パターン認識
  • ロボットの設計・製造・構造要素
展開可能なシーズ 自然で円滑な対話を実現できる音声認識装置、音声認識方法及びロボット装置を提供する。
一般の対話者が相槌をする目安としている音声特徴量を基に相槌タイミングを推測することで、対話者が相槌をするであろうタイミングを相槌タイミングとして推測でき、かつ2段階の判定により仮に1度目の相槌タイミングが誤検出であっても、当該相槌タイミングを棄却することにより、誤って推測した不自然な相槌を回避でき、かくして自然で円滑な対話を実現できる。また、2度目の判定は相槌タイミングの直前の一瞬の音声信号だけなので、従来のポーズ検出手法のように無音区間を判定するために必要な間が生じることを確実に回避でき、かくして自然で円滑な対話を実現できる。相槌タイミングが推測された場合であっても、当該相槌タイミングの時点で話者が発話しているときには相槌を行わせないことから、話者の発話が相槌で遮られずにすむので、話者との間で円滑な対話を実現できる。一般の対話者が相槌をする目安としている韻律情報を基に相槌タイミングを推測することで、対話者が相槌をするであろう相槌タイミングを推測できる。
用途利用分野 音声対話装置、音声認識装置、ロボット装置
出願特許   特許 国際特許分類(IPC)
( 1 ) 学校法人早稲田大学, . 小林 哲則, 藤江 真也, 渡辺 大地, . 音声対話装置、音声対話方法及びロボット装置. 特開2009-003040. 2009-01-08
  • G10L  15/28     
  • G10L  15/00     
  • G10L  15/22     
  • G10L  15/10     
  • G10L  13/00     

PAGE TOP