TOP > 国内特許検索 > 音声対話装置、音声対話方法及びロボット装置

音声対話装置、音声対話方法及びロボット装置

国内特許コード P110002074
整理番号 746
掲載日 2011年3月31日
出願番号 特願2007-161998
公開番号 特開2009-003040
登録番号 特許第5051882号
出願日 平成19年6月20日(2007.6.20)
公開日 平成21年1月8日(2009.1.8)
登録日 平成24年8月3日(2012.8.3)
発明者
  • 小林 哲則
  • 藤江 真也
  • 渡辺 大地
出願人
  • 学校法人早稲田大学
発明の名称 音声対話装置、音声対話方法及びロボット装置
発明の概要

【課題】自然で円滑な対話を実現できる音声認識装置、音声認識方法及びロボット装置を提案する。
【解決手段】音声入力部に入力された音声信号を基に計算した話者の音声特徴量に基づき、話者との対話中にスピーカから相槌音を出力させる相槌タイミングを推測し、話者との対話中に前記スピーカから相槌音を出力させる相槌タイミングがあるとの推測結果が得られると、相槌タイミング直前のパワーを基に相槌音を出力させるか否かを判定するようにしたことにより、対話者が相槌をする目安としている音声特徴量を基に相槌タイミングを推測することで、対話者が相槌をするであろうタイミングを相槌タイミングとして推測できる。また2段階の判定により仮に1度目で誤検出された相槌タイミングがあっても、当該相槌タイミングを棄却することにより、誤って推測した不自然な相槌音の出力を回避でき、かくして自然で円滑な対話を実現できる。
【選択図】図1

従来技術、競合技術の概要


従来、話者との対話において、所定のタイミングで相槌音を出力することにより、話者の発話を認識していることを通知し、話者との間で円滑な対話を行う音声対話装置が考えられている。



実際上、このような音声対話装置は、例えばマイクロホン等の音声入力部に入力された音声信号に基づいて話者が現在発話中であるか否かを認識する認識手段を備え、当該認識手段において音声信号が所定の無音時間入力されていないと認識すると、話者との対話の区切り目であると判断し、スピーカ等の出力手段から相槌音を出力し得るようになされている(例えば、非特許文献1参照)。



また、他の音声対話装置としては、音声入力部に入力された音声信号に基づいて話者の発話の高さを示す基本周波数を算出すると共に、当該音声信号における音声波形のパワーを算出した後、これら基本周波数及びパワーを関係付けた音声特徴量を算出し、この音声特徴量に基づいて相槌音を出力するタイミングを推測して相槌音を出力する音声対話装置が考えられている(例えば、非特許文献2参照)。

【非特許文献1】竹内真士、北岡教英、中川聖一「韻律・表層的言語情報を発話タイミング制御に用いた雑談対話システム」情報処理学会研究報告、SLP-50、no.14、pp.87-92、2004年2月

【非特許文献2】藤江真也、福島健太、小林哲則、"言語/非言語情報を用いた相槌機能の実現," 日本音響学会春季研究発表会、pp.655-656、2005年3月

産業上の利用分野


本発明は、音声対話装置、音声対話方法及びロボット装置に関し、例えば話者との対話中に所定のタイミングで相槌音を出力する音声対話装置に適用して好適なものである。

特許請求の範囲 【請求項1】
入力された音声信号を基に計算した話者の音声特徴量に基づいて、前記話者との対話中に相槌手段に相槌させる相槌タイミングを推測する推測手段と、
前記話者との対話中に前記相槌手段に相槌させる前記相槌タイミングがあるとの推測結果が前記推測手段により得られると、前記相槌タイミング直前の前記音声信号を基に前記相槌手段に相槌させるか否かを最終的に判定する相槌判定手段と
を備え
前記音声特徴量は、前記話者の韻律的特徴を示した韻律情報であり、
前記相槌判定手段は、前記相槌タイミングの直前で前記話者が発話しているか否かを前記音声信号に基づき判定し、前記相槌タイミングの直前で前記話者が発話していないと判断したときにのみ前記相槌手段に相槌させる
ことを特徴とする音声対話装置。

【請求項2】
前記韻律情報は、前記音声信号の基本周波数とパワーとである
ことを特徴とする請求項1記載の音声対話装置。

【請求項3】
前記相槌判定手段は、前記相槌タイミングの直前の前記音声信号から得られる音声らしさを表す評価値が所定の閾値以下のときに、前記話者が発話していないと判断する
ことを特徴とする請求項又は記載の音声対話装置。

【請求項4】
前記相槌手段は、前記相槌判定手段からの相槌信号により、前記相槌として所定の相槌音を出力する電気音響変換手段である
ことを特徴とする請求項1~のうちいずれか1項記載の音声対話装置。

【請求項5】
入力された音声信号を基に計算した話者の音声特徴量に基づいて、前記話者との対話中に相槌手段に相槌させる相槌タイミングを推測する推測ステップと、
前記話者との対話中に前記相槌手段に相槌させる前記相槌タイミングがあるとの推測結果が得られると、前記相槌タイミング直前の前記音声信号を基に前記相槌手段に相槌させるか否かを最終的に判定する相槌判定ステップと
を備え
前記音声特徴量は、前記話者の韻律的特徴を示した韻律情報であり、
前記相槌判定ステップは、前記相槌タイミングの直前で前記話者が発話しているか否かを前記音声信号に基づき判定し、前記相槌タイミングの直前で前記話者が発話していないと判断したときにのみ前記相槌手段に相槌させる
ことを特徴とする音声対話方法。

【請求項6】
前記韻律情報は、前記音声信号の基本周波数とパワーとである
ことを特徴とする請求項5記載の音声対話方法。

【請求項7】
前記相槌判定ステップは、前記相槌タイミングの直前の前記音声信号から得られる音声らしさを表す評価値が所定の閾値以下のときに、前記話者が発話していないと判断する
ことを特徴とする請求項又は記載の音声対話方法。

【請求項8】
前記相槌手段は、前記相槌判定手段からの相槌信号により、前記相槌として所定の相槌音を出力する電気音響変換手段である
ことを特徴とする請求項のうちいずれか1項記載の音声対話方法。

【請求項9】
前記請求項1~に記載の音声対話装置を備えた
ことを特徴とするロボット装置。

【請求項10】
前記相槌手段は可動部であって、
前記可動部は、前記相槌タイミングに相槌させるとの判定結果を前記相槌判定手段から得ると、前記相槌タイミングに相槌動作を行う
ことを特徴とする請求項記載のロボット装置。
産業区分
  • 電子応用機器
  • 工業用ロボット
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2007161998thum.jpg
出願権利状態 権利存続中
技術導入、技術提携、実用化開発(受託研究・共同研究等)のご相談を承っております。お気軽にご連絡ください。


PAGE TOP

close
close
close
close
close
close
close