TOP > 国内特許検索 > 音声対話装置、その処理方法及びプログラム

音声対話装置、その処理方法及びプログラム 外国出願あり

国内特許コード P200016788
整理番号 5788
掲載日 2020年4月14日
出願番号 特願2017-040580
公開番号 特開2018-146715
登録番号 特許第6696923号
出願日 平成29年3月3日(2017.3.3)
公開日 平成30年9月20日(2018.9.20)
登録日 令和2年4月27日(2020.4.27)
発明者
  • 河原 達也
  • 高梨 克也
  • 中西 亮輔
  • 渡部 生聖
出願人
  • 国立大学法人京都大学
  • トヨタ自動車株式会社
発明の名称 音声対話装置、その処理方法及びプログラム 外国出願あり
発明の概要 【課題】より自然な対話を行うことができること。
【解決手段】音声対話装置は、ユーザの音声を認識する音声認識手段と、音声認識手段により認識された音声に基づいて、ユーザの音声に対する応答文を生成する応答文生成手段と、対話間のフィラー語を生成するフィラー生成手段と、生成された応答文及びフィラー語を出力する出力手段と、応答文生成手段により生成された応答文を、予め設定され発話の種類を示す所定の発話パターンのうちのいずれかに分類する分類手段と、を備える。出力手段が、第1の応答文に続くユーザの音声後、フィラー語を出力し、第2の応答文を出力する場合において、分類手段は、第1の応答文を、発話パターンのうちのいずれかに分類し、フィラー生成手段は、分類手段により分類された発話パターンに基づいて、フィラー語を生成する。
【選択図】図1
従来技術、競合技術の概要

対話間にフィラー語(場つなぎ語)を挿入して不自然に間延びしないようにする音声対話装置が知られている(特許文献1参照)。

産業上の利用分野

本発明は、ユーザと音声対話を行う音声対話装置、その処理方法及びプログラムに関する。

特許請求の範囲 【請求項1】
ユーザの音声を認識する音声認識手段と、
前記音声認識手段により認識された音声に基づいて、前記ユーザの音声に対する応答文を生成する応答文生成手段と、
前記ユーザとの対話間に挿入するフィラー語を生成するフィラー生成手段と、
前記応答文生成手段により生成された応答文及び前記フィラー生成手段により生成されたフィラー語を出力する出力手段と、
を備える音声対話装置であって、
前記応答文生成手段により生成された応答文を、予め設定され発話の種類を示す所定の発話パターンのうちのいずれかに分類する分類手段を備え、
前記出力手段が、第1の前記応答文に続く前記ユーザの音声後、前記フィラー語を出力し、第2の前記応答文を出力する場合において、
前記分類手段は、前記第1の応答文を、前記発話パターンのうちのいずれかに分類し、
前記フィラー生成手段は、前記分類手段により分類された発話パターンに基づいて、前記フィラー語を生成する、
ことを特徴とする音声対話装置。

【請求項2】
請求項1記載の音声対話装置であって、
前記発話パターンと、該発話パターンに対応付けられた特徴量の種類に関する情報と、を含むテーブル情報を記憶する記憶手段と、
前記分類手段により分類された発話パターンに対応付けられた特徴量の種類に関する情報に基づいて、先行又は後続の発話の特徴量を算出する特徴量算出手段と、
を更に備え、
前記フィラー生成手段は、前記特徴量算出手段により算出された特徴量に基づいて、前記フィラー語を生成する、
を特徴とする音声対話装置。

【請求項3】
請求項2記載の音声対話装置であって、
前記特徴量の種類に関する情報は、先行発話の韻律情報、先行発話の言語情報、後続発話の言語情報、及び、後続発話の韻律情報のうち少なくとも1つを含む、
ことを特徴とする音声対話装置。

【請求項4】
請求項2又は3記載の音声対話装置であって、
前記記憶手段は、少なくとも1つの前記フィラー語を含み該フィラー語の系統を示すフィラー系に特徴量がそれぞれ対応付けられたフィラー形態情報を記憶しており、
前記フィラー生成手段は、前記分類手段により分類された発話パターンに基づいて、前記フィラー系の数を絞り込み、該絞り込んだフィラー系の中から、前記特徴量算出手段により算出された特徴量に対応付けられ1つのフィラー系を選択し、該選択したフィラー系に含まれる前記フィラー語を選択することで、前記フィラー語を生成する、
ことを特徴とする音声対話装置。

【請求項5】
ユーザの音声を認識する音声認識手段と、
前記音声認識手段により認識された音声に基づいて、前記ユーザの音声に対する応答文を生成する応答文生成手段と、
前記ユーザとの対話間に挿入するフィラー語を生成するフィラー生成手段と、
前記応答文生成手段により生成された応答文及び前記フィラー生成手段により生成されたフィラー語を出力する出力手段と、を備える音声対話装置の処理方法であって、
前記出力手段が、第1の前記応答文に続く前記ユーザの音声後、前記フィラー語を出力し、第2の前記応答文を出力する場合において、
前記第1の応答文を、予め設定され発話の種類を示す所定の発話パターンのうちのいずれかに分類するステップと、
前記分類された発話パターンに基づいて、前記フィラー語を生成するステップと、
を含む
ことを特徴とする音声対話装置の処理方法。

【請求項6】
ユーザの音声を認識する音声認識手段と、
前記音声認識手段により認識された音声に基づいて、前記ユーザの音声に対する応答文を生成する応答文生成手段と、
前記ユーザとの対話間に挿入するフィラー語を生成するフィラー生成手段と、
前記応答文生成手段により生成された応答文及び前記フィラー生成手段により生成されたフィラー語を出力する出力手段と、を備える音声対話装置のプログラムであって、
前記出力手段が、第1の前記応答文に続く前記ユーザの音声後、前記フィラー語を出力し、第2の前記応答文を出力する場合において、
前記第1の応答文を、予め設定され発話の種類を示す所定の発話パターンのうちのいずれかに分類する処理と、
前記分類された発話パターンに基づいて、前記フィラー語を生成する処理と、
をコンピュータに実行させることを特徴とする音声対話装置のプログラム。
国際特許分類(IPC)
画像

※ 画像をクリックすると拡大します。

JP2017040580thum.jpg
出願権利状態 登録
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください。


PAGE TOP

close
close
close
close
close
close
close