TOP > 国内特許検索 > 音声合成装置、音声合成方法、及びプログラム

音声合成装置、音声合成方法、及びプログラム コモンズ

国内特許コード P140010632
整理番号 08-10
掲載日 2014年6月9日
出願番号 特願2008-231612
公開番号 特開2010-066422
登録番号 特許第5164041号
出願日 平成20年9月10日(2008.9.10)
公開日 平成22年3月25日(2010.3.25)
登録日 平成24年12月28日(2012.12.28)
発明者
  • 津崎 実
  • 坂井 信輔
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 音声合成装置、音声合成方法、及びプログラム コモンズ
発明の概要 【課題】部分的に発話速度を変更することができる音声合成装置を提供する。
【解決手段】コーパスベースの音声合成装置1であって、テキスト情報と当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部11と、前記テキスト情報に対応する音素列と、当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部13と、前記速度情報に応じて前記韻律情報を変更する韻律情報変更部14と、前記音素列と、韻律情報変更部14による変更後の韻律情報とを用いて音声信号を生成する音声信号生成部15と、音声信号生成部15が生成した音声信号を出力する音声信号出力部16とを備える。
【選択図】図1
従来技術、競合技術の概要


従来の音声合成装置において、発話速度を変換する技術が確立されてきている(例えば、特許文献1参照)。したがって、状況の切迫度などに応じて、発話速度の速い音声を出力することもできる。
【特許文献1】
特開2007-279975号公報

産業上の利用分野



本発明は、コーパスベースの音声合成装置等に関する。

特許請求の範囲 【請求項1】
コーパスベースの音声合成装置であって、
テキスト情報と、当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部と、
前記テキスト情報に対応する音素列と、当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部と、
前記速度情報に応じて前記韻律情報を変更する韻律情報変更部と、
前記音素列と、前記韻律情報変更部による変更後の韻律情報とを用いて音声信号を生成する音声信号生成部と、
前記音声信号生成部が生成した音声信号を出力する音声信号出力部と、を備え
前記音素列には、ポーズが含まれており、
前記韻律情報には、前記ポーズに対応する持続時間情報も含まれており、
前記韻律情報変更部は、ポーズに対応する持続時間情報を変更しない、音声合成装置。

【請求項2】
前記音声信号生成部は、素片接続合成法により音声信号を生成する、請求項1記載の音声合成装置。

【請求項3】
前記音声信号生成部は、HMM合成法により音声信号を生成する、請求項1記載の音声合成装置。

【請求項4】
前記テキスト情報から音素列、及び当該音素列に対応する韻律情報を生成し、前記韻律情報記憶部に蓄積する音素列・韻律情報生成部をさらに備えた、請求項1から請求項のいずれか記載の音声合成装置。

【請求項5】
前記韻律情報は、前記音素列の各音素の基本周波数情報を含む、請求項1から請求項のいずれか記載の音声合成装置。

【請求項6】
前記韻律情報は、前記音素列の各音素のパワースペクトル情報を含む、請求項1から請求項のいずれか記載の音声合成装置。

【請求項7】
コーパスベースの音声合成方法であって、
テキスト情報と当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部で記憶されている前記速度情報に応じて、前記テキスト情報に対応する音素列と当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部で記憶されている前記韻律情報を変更する韻律情報変更ステップと、
前記音素列と、前記韻律情報変更ステップでの変更後の韻律情報とを用いて音声信号を生成する音声信号生成ステップと、
前記音声信号生成ステップで生成した音声信号を出力する音声信号出力ステップと、を備え
前記音素列には、ポーズが含まれており、
前記韻律情報には、前記ポーズに対応する持続時間情報も含まれており、
前記韻律情報変更ステップでは、ポーズに対応する持続時間情報を変更しない、音声合成方法。

【請求項8】
コーパスベースの音声合成装置としてコンピュータを機能させるためのプログラムであって、
コンピュータを、
テキスト情報と当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部で記憶される前記速度情報に応じて、前記テキスト情報に対応する音素列と当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部で記憶される前記韻律情報を変更する韻律情報変更部、
前記音素列と、前記韻律情報変更部による変更後の韻律情報とを用いて音声信号を生成する音声信号生成部、
前記音声信号生成部が生成した音声信号を出力する音声信号出力部、として機能させ
前記音素列には、ポーズが含まれており、
前記韻律情報には、前記ポーズに対応する持続時間情報も含まれており、
前記韻律情報変更部は、ポーズに対応する持続時間情報を変更しない、プログラム。
国際特許分類(IPC)
画像

※ 画像をクリックすると拡大します。

JP2008231612thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close