Top > Search of Japanese Patents > VOICE SYNTHESIS DEVICE, VOICE SYNTHESIS METHOD AND PROGRAM

VOICE SYNTHESIS DEVICE, VOICE SYNTHESIS METHOD AND PROGRAM commons

Patent code P140010632
File No. 08-10
Posted date Jun 9, 2014
Application number P2008-231612
Publication number P2010-066422A
Patent number P5164041
Date of filing Sep 10, 2008
Date of publication of application Mar 25, 2010
Date of registration Dec 28, 2012
Inventor
  • (In Japanese)津崎 実
  • (In Japanese)坂井 信輔
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title VOICE SYNTHESIS DEVICE, VOICE SYNTHESIS METHOD AND PROGRAM commons
Abstract PROBLEM TO BE SOLVED: To provide a voice synthesis device capable of partially changing a speaking speed.
SOLUTION: The voice synthesis device 1 of a corpus base comprises: a text information storage section 11 in which text information and speed information which is information regarding a speed of a part of the text information are stored; a prosody information storage section 13 in which a phoneme string corresponding to the text information, and prosody information which is information including at least continuation time information which is information regarding continuation time of each phoneme of the phoneme string are stored; a prosody information changing section 14 for changing the prosody information according to the speed information; a voice signal generating section 15 for generating a voice signal by using the phoneme string and the prosody information after changing by the prosody information changing section 14; and a voice signal output section 16 for outputting the voice signal generated by the voice signal generating section 15.
Outline of related art and contending technology (In Japanese)

従来の音声合成装置において、発話速度を変換する技術が確立されてきている(例えば、特許文献1参照)。したがって、状況の切迫度などに応じて、発話速度の速い音声を出力することもできる。
【特許文献1】
特開2007-279975号公報

Field of industrial application (In Japanese)

本発明は、コーパスベースの音声合成装置等に関する。

Scope of claims (In Japanese)
【請求項1】
 
コーパスベースの音声合成装置であって、
テキスト情報と、当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部と、
前記テキスト情報に対応する音素列と、当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部と、
前記速度情報に応じて前記韻律情報を変更する韻律情報変更部と、
前記音素列と、前記韻律情報変更部による変更後の韻律情報とを用いて音声信号を生成する音声信号生成部と、
前記音声信号生成部が生成した音声信号を出力する音声信号出力部と、を備え
前記音素列には、ポーズが含まれており、
前記韻律情報には、前記ポーズに対応する持続時間情報も含まれており、
前記韻律情報変更部は、ポーズに対応する持続時間情報を変更しない、音声合成装置。

【請求項2】
 
前記音声信号生成部は、素片接続合成法により音声信号を生成する、請求項1記載の音声合成装置。

【請求項3】
 
前記音声信号生成部は、HMM合成法により音声信号を生成する、請求項1記載の音声合成装置。

【請求項4】
 
前記テキスト情報から音素列、及び当該音素列に対応する韻律情報を生成し、前記韻律情報記憶部に蓄積する音素列・韻律情報生成部をさらに備えた、請求項1から請求項3のいずれか記載の音声合成装置。

【請求項5】
 
前記韻律情報は、前記音素列の各音素の基本周波数情報を含む、請求項1から請求項4のいずれか記載の音声合成装置。

【請求項6】
 
前記韻律情報は、前記音素列の各音素のパワースペクトル情報を含む、請求項1から請求項5のいずれか記載の音声合成装置。

【請求項7】
 
コーパスベースの音声合成方法であって、
テキスト情報と当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部で記憶されている前記速度情報に応じて、前記テキスト情報に対応する音素列と当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部で記憶されている前記韻律情報を変更する韻律情報変更ステップと、
前記音素列と、前記韻律情報変更ステップでの変更後の韻律情報とを用いて音声信号を生成する音声信号生成ステップと、
前記音声信号生成ステップで生成した音声信号を出力する音声信号出力ステップと、を備え
前記音素列には、ポーズが含まれており、
前記韻律情報には、前記ポーズに対応する持続時間情報も含まれており、
前記韻律情報変更ステップでは、ポーズに対応する持続時間情報を変更しない、音声合成方法。

【請求項8】
 
コーパスベースの音声合成装置としてコンピュータを機能させるためのプログラムであって、
コンピュータを、
テキスト情報と当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部で記憶される前記速度情報に応じて、前記テキスト情報に対応する音素列と当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部で記憶される前記韻律情報を変更する韻律情報変更部、
前記音素列と、前記韻律情報変更部による変更後の韻律情報とを用いて音声信号を生成する音声信号生成部、
前記音声信号生成部が生成した音声信号を出力する音声信号出力部、として機能させ
前記音素列には、ポーズが含まれており、
前記韻律情報には、前記ポーズに対応する持続時間情報も含まれており、
前記韻律情報変更部は、ポーズに対応する持続時間情報を変更しない、プログラム。
IPC(International Patent Classification)
Drawing

※Click image to enlarge.

thum_JPA 422066422_i_000002.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close