TOP > 国内特許検索 > 音声対話方法、及び音声対話システム

音声対話方法、及び音声対話システム NEW

国内特許コード P180015547
整理番号 4507
掲載日 2018年11月21日
出願番号 特願2014-162579
公開番号 特開2016-038501
登録番号 特許第6270661号
出願日 平成26年8月8日(2014.8.8)
公開日 平成28年3月22日(2016.3.22)
登録日 平成30年1月12日(2018.1.12)
発明者
  • 河原 達也
  • 渡部 生聖
  • 中野 雄介
出願人
  • 国立大学法人京都大学
  • トヨタ自動車株式会社
発明の名称 音声対話方法、及び音声対話システム NEW
発明の概要 【課題】発話を促進させる相槌を生成することが可能な音声対話方法を提供することである。
【解決手段】本発明にかかる音声対話方法は、ユーザ発話を入力する工程(S1)と、入力されたユーザ発話の韻律的特徴を抽出する工程(S2)と、抽出された韻律的特徴に基づき、ユーザ発話に応答する相槌を生成する工程(S4~S6)と、を備える。相槌を生成する際、相槌の韻律的特徴がユーザ発話の韻律的特徴と合うように相槌の韻律を調整することで、発話を促進させる相槌を生成することができる。
【選択図】図2
従来技術、競合技術の概要


音声対話システムや人型ロボットにおいては、高齢者や認知症などの患者のケアを行うニーズが高まっており、傾聴する機能が要求されている。傾聴においては、ユーザが話しやすいように相槌を打つことが重要である。



特許文献1には、自然で円滑な対話を実現できる音声認識装置に関する技術が開示されている。特許文献1に開示されている音声認識装置では、音声入力部に入力された音声信号を基に計算した話者の音声特徴量に基づき、話者との対話中にスピーカから相槌音を出力させる相槌タイミングを推測している。そして、相槌タイミングであるとの推測結果が得られると、相槌タイミング直前のパワーを基に相槌音を出力させるか否かを判定している。

産業上の利用分野


本発明は音声対話方法、及び音声対話システムに関する。

特許請求の範囲 【請求項1】
ユーザ発話を入力する工程と、
入力された前記ユーザ発話の韻律的特徴を抽出する工程と、
抽出された前記韻律的特徴に基づき前記ユーザ発話に応答する相槌を生成する工程と、を備え、
前記ユーザ発話の韻律的特徴を抽出する際、前記ユーザ発話の基本周波数成分およびパワー成分を抽出し、
前記パワー成分は、当該パワー成分の最大値および平均値を含み、
前記相槌を生成する際、前記基本周波数成分および前記パワー成分のうち、前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関が高い成分を用いて、前記相槌の韻律的特徴が前記ユーザ発話の韻律的特徴と合うように前記相槌の韻律を調整する、
音声対話方法。

【請求項2】
前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関を示す相関係数テーブルを予め生成し、
前記基本周波数成分および前記パワー成分のうち、前記相槌についての相関係数が高い成分を優先的に用いて前記相槌の韻律を調整する、
請求項に記載の音声対話方法。

【請求項3】
前記基本周波数成分は、当該基本周波数成分の最大値および平均値を含、請求項またはに記載の音声対話方法。

【請求項4】
前記相槌を生成する際、下記の式を用いて、前記基本周波数成分の最大値、平均値、及び前記パワー成分の最大値、平均値の各々について韻律調整パラメータBCipを求め、当該韻律調整パラメータBCipを用いて前記相槌の韻律を調整する、請求項に記載の音声対話方法。
【数1】


上記式において、αは相関係数、Sはユーザ発話の韻律的特徴、iはサンプル数、E(S)はユーザ発話の韻律的特徴の平均値、E(BC)は相槌の韻律的特徴の平均値、σ(S)はユーザ発話の韻律的特徴の標準偏差、σ(BC)は相槌の韻律的特徴の標準偏差である。

【請求項5】
前記ユーザ発話の韻律的特徴を用いて前記相槌を生成するタイミングを決定する工程を更に備え、
前記ユーザ発話の韻律的特徴であるパワー成分が所定の閾値以下である場合に、前記相槌を生成する、
請求項1乃至のいずれか一項に記載の音声対話方法。

【請求項6】
前記相槌には感情表出系の相槌と応答系の相槌とが含まれており、
前記ユーザ発話が発話中である場合、前記応答系の相槌を選択し、
前記ユーザ発話が終了している場合、前記感情表出系の相槌を選択する、
請求項1乃至のいずれか一項に記載の音声対話方法。

【請求項7】
ユーザ発話を入力する発話入力部と、
前記発話入力部に入力された前記ユーザ発話の韻律的特徴を抽出する韻律的特徴抽出部と、
前記韻律的特徴抽出部で抽出された前記韻律的特徴に基づき前記ユーザ発話に応答する相槌を生成する相槌生成部と、を備え、
前記韻律的特徴抽出部は、前記ユーザ発話の韻律的特徴を抽出する際、前記ユーザ発話の基本周波数成分およびパワー成分を抽出し、
前記パワー成分は、当該パワー成分の最大値および平均値を含み、
前記相槌生成部は、前記相槌を生成する際、前記基本周波数成分および前記パワー成分のうち、前記ユーザ発話の韻律的特徴と前記相槌の韻律的特徴との相関が高い成分を用いて、前記相槌の韻律的特徴が前記ユーザ発話の韻律的特徴と合うように前記相槌の韻律を調整する、
音声対話システム。
国際特許分類(IPC)
画像

※ 画像をクリックすると拡大します。

JP2014162579thum.jpg
出願権利状態 登録
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください。


PAGE TOP

close
close
close
close
close
close
close