Top > Search of Japanese Patents > VOICE INTERACTIVE METHOD AND VOICE INTERACTIVE SYSTEM

VOICE INTERACTIVE METHOD AND VOICE INTERACTIVE SYSTEM

Patent code P180015547
File No. 4507
Posted date Nov 21, 2018
Application number P2014-162579
Publication number P2016-038501A
Patent number P6270661
Date of filing Aug 8, 2014
Date of publication of application Mar 22, 2016
Date of registration Jan 12, 2018
Inventor
  • (In Japanese)河原 達也
  • (In Japanese)渡部 生聖
  • (In Japanese)中野 雄介
Applicant
  • (In Japanese)国立大学法人京都大学
  • (In Japanese)トヨタ自動車株式会社
Title VOICE INTERACTIVE METHOD AND VOICE INTERACTIVE SYSTEM
Abstract PROBLEM TO BE SOLVED: To provide a voice interactive method capable of generating a response that promotes speech production.
SOLUTION: A voice interactive method includes: an input process (S1) of user utterance; an extraction process (S2) of the prosodic feature of inputted user utterance; and generation processes (S4 to S6) of a response to the user utterance based on the extracted prosodic feature. A response for promoting speech production can be generated by adjusting rhythm of the response so that prosodic feature of the response matches prosodic feature of user utterance when the response is generated.
Outline of related art and contending technology (In Japanese)

音声対話システムや人型ロボットにおいては、高齢者や認知症などの患者のケアを行うニーズが高まっており、傾聴する機能が要求されている。傾聴においては、ユーザが話しやすいように相槌を打つことが重要である。

特許文献1には、自然で円滑な対話を実現できる音声認識装置に関する技術が開示されている。特許文献1に開示されている音声認識装置では、音声入力部に入力された音声信号を基に計算した話者の音声特徴量に基づき、話者との対話中にスピーカから相槌音を出力させる相槌タイミングを推測している。そして、相槌タイミングであるとの推測結果が得られると、相槌タイミング直前のパワーを基に相槌音を出力させるか否かを判定している。

Field of industrial application (In Japanese)

本発明は音声対話方法、及び音声対話システムに関する。

Scope of claims (In Japanese)
【請求項1】
 
ユーザ発話を入力する工程と、
入力された前記ユーザ発話の韻律的特徴を抽出する工程と、
抽出された前記韻律的特徴に基づき前記ユーザ発話に応答する相槌を生成する工程と、を備え、
前記ユーザ発話の韻律的特徴を抽出する際、前記ユーザ発話の基本周波数成分およびパワー成分を抽出し、
前記パワー成分は、当該パワー成分の最大値および平均値を含み、
前記相槌を生成する際、前記基本周波数成分および前記パワー成分のうち、前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関が高い成分を用いて、前記相槌の韻律的特徴が前記ユーザ発話の韻律的特徴と合うように前記相槌の韻律を調整する、
音声対話方法。

【請求項2】
 
前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関を示す相関係数テーブルを予め生成し、
前記基本周波数成分および前記パワー成分のうち、前記相槌についての相関係数が高い成分を優先的に用いて前記相槌の韻律を調整する、
請求項1に記載の音声対話方法。

【請求項3】
 
前記基本周波数成分は、当該基本周波数成分の最大値および平均値を含、請求項1または2に記載の音声対話方法。

【請求項4】
 
前記相槌を生成する際、下記の式を用いて、前記基本周波数成分の最大値、平均値、及び前記パワー成分の最大値、平均値の各々について韻律調整パラメータBCipを求め、当該韻律調整パラメータBCipを用いて前記相槌の韻律を調整する、請求項3に記載の音声対話方法。
【数1】
 
(省略)
上記式において、αは相関係数、Siはユーザ発話の韻律的特徴、iはサンプル数、E(S)はユーザ発話の韻律的特徴の平均値、E(BC)は相槌の韻律的特徴の平均値、σ(S)はユーザ発話の韻律的特徴の標準偏差、σ(BC)は相槌の韻律的特徴の標準偏差である。

【請求項5】
 
前記ユーザ発話の韻律的特徴を用いて前記相槌を生成するタイミングを決定する工程を更に備え、
前記ユーザ発話の韻律的特徴であるパワー成分が所定の閾値以下である場合に、前記相槌を生成する、
請求項1乃至4のいずれか一項に記載の音声対話方法。

【請求項6】
 
前記相槌には感情表出系の相槌と応答系の相槌とが含まれており、
前記ユーザ発話が発話中である場合、前記応答系の相槌を選択し、
前記ユーザ発話が終了している場合、前記感情表出系の相槌を選択する、
請求項1乃至5のいずれか一項に記載の音声対話方法。

【請求項7】
 
ユーザ発話を入力する発話入力部と、
前記発話入力部に入力された前記ユーザ発話の韻律的特徴を抽出する韻律的特徴抽出部と、
前記韻律的特徴抽出部で抽出された前記韻律的特徴に基づき前記ユーザ発話に応答する相槌を生成する相槌生成部と、を備え、
前記韻律的特徴抽出部は、前記ユーザ発話の韻律的特徴を抽出する際、前記ユーザ発話の基本周波数成分およびパワー成分を抽出し、
前記パワー成分は、当該パワー成分の最大値および平均値を含み、
前記相槌生成部は、前記相槌を生成する際、前記基本周波数成分および前記パワー成分のうち、前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関が高い成分を用いて、前記相槌の韻律的特徴が前記ユーザ発話の韻律的特徴と合うように前記相槌の韻律を調整する、
音声対話システム。
IPC(International Patent Classification)
Drawing

※Click image to enlarge.

JP2014162579thum.jpg
State of application right Registered
Please contact us by e-mail or facsimile if you have any interests on this patent. Thanks.


PAGE TOP

close
close
close
close
close
close
close