Top > Search of Japanese Patents > DEVICE AND SOFTWARE FOR VOICE OUTPUT USING SPOKEN LANGUAGE

DEVICE AND SOFTWARE FOR VOICE OUTPUT USING SPOKEN LANGUAGE commons

Patent code P140010701
File No. 01-60
Posted date Jul 3, 2014
Application number P2001-324097
Publication number P2003-131679A
Patent number P3593563
Date of filing Oct 22, 2001
Date of publication of application May 9, 2003
Date of registration Sep 10, 2004
Inventor
  • (In Japanese)村田 真樹
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title DEVICE AND SOFTWARE FOR VOICE OUTPUT USING SPOKEN LANGUAGE commons
Abstract PROBLEM TO BE SOLVED: To develop a technique for producing a 3rd language text usable for machine translation not only between main languages, but also between a main language and a non-main language and to provide a producing technique which can generate a text with higher precision than before at the same time.
SOLUTION: The technique is actualized which generates the 3rd language text with higher precision than conventional single-language input by inputting a language text having a plurality of translation relations and using translation corpuses of both languages. After the input, a target language document is outputted through stages for analysis, conversion, and generation. The target language document does not require a large-scale corpus, etc., since characteristic information can automatically be obtained.
Outline of related art and contending technology (In Japanese)

近時のコンピュータによる音声合成技術の進歩にともなって、音声によって聴覚的に情報を伝達出力する技術は、日常生活においても様々な場面で使われている。例えば、カーナビゲーションシステムにおいては、運転中の運転者に対して音声で進路、渋滞情報等の各種情報を伝えるために、運転に支障を及ぼさない、音声で伝達するようになっている。また、文字を読みとることができない、盲人・弱視者向けのテキスト音読システムもある。

該システムでは、テキストを入力することによって、文字を読みの辞書に従って読み上げるようになっており、より聞き取りやすい読み方で読み上げる手法等が研究されている。

ところで、現在の音声合成技術は、主に与えられたテキストをそのまま音読するため、聞き取りやすい話し言葉で出力するためには、あらかじめ話し言葉で構成されるテキストを用意しているのが一般的である。このような方法では、上述のテキスト音読システムで書籍や新聞等を入力しても、そのまま読み上げるだけのため、書き言葉特有の表現がそのまま音読され、不自然な印象を与えるばかりでなく、非常に聞き取りにくい問題がある。

これらの問題点を解消するため、従来の技術としては、例えば特開2001-166787号公報は、書き言葉のテキストを話し言葉の表現に置き換えて話し言葉らしい韻律で読み上げ、かつ、話し言葉韻律にあわせて規則韻律を調整することで、話し言葉として自然にテキストを読み上げることができる音声合成装置を開示している。

該手法によると、確かにスムーズな韻律によって聞き取りやすい音声合成を行うことはできるので、上記問題点に関する一定の解決方法にはなりうる。

しかし、上記発明では主に読み上げる文全体の韻律等に重きをおいており、話し言葉の表現に置き換える手法は、あらかじめ備えられたテキスト変換テーブルによって機械的に置き換えるのみであって、しかもそのテキスト変換テーブルの作成については特徴的な手法は提案されていない。

Field of industrial application (In Japanese)

本発明は、書き言葉で構成されたテキストを話し言葉で音声出力する音声出力装置及びそのソフトウェアに関する。より詳しくは、特に変換手法に特徴を有する出力装置及びソフトウェアの提供を図る技術に係るものである。

Scope of claims (In Japanese)
【請求項1】
 
書き言葉によって構成されたテキストを、話し言葉で読み上げる音声出力装置であって、該音声出力装置が、
テキストをコンピュータ処理用の書き言葉データとして装置内に入力するテキスト入力手段と、
該書き言葉データを、話し言葉データに変換する言葉変換手段と、
該話し言葉データから音声データを作成する音声データ作成手段と、
該音声データに基づき、音声を出力する音声出力手段と
を有する構成において、
該言葉変換手段が、
少なくともその一部において同一意味内容を含む、書き言葉学習用データ及び話し言葉学習用データを用い、各言葉学習用データを所定の文字単位に分解した上、各言葉学習用データ間の不一致部分における各言葉間の書き換え可能確率が所定の値よりも高いものをパラフレーズとし、それをあらかじめ記載したパラフレーズテーブルを備えると共に、
該パラフレーズテーブルを参照して書き言葉データを話し言葉データに変換する変換エンジンを備え、該変換エンジンが、
1個又は複数個の文字単位から構成される文字単位群が前記パラフレーズテーブルに記載されているか、或いはその記載の態様を判別し、
その結果、該文字単位群が、書き言葉から話し言葉に変換可能な1個以上の変換後候補群を有すると判断される場合に、
該文字単位群の前後に近接する少なくとも1個の文字単位から成る前文字単位群及び後文字単位群が直前直後に出現する場合の該文字単位群と変換後候補群の当該言葉学習用データ中における出現頻度及び/又は出現確率に係る値を算出し、その値が最も大きい1個の変換後候補を特定した上で、
該文字単位群と、変換後候補との、出現頻度及び/又は出現確率に係る値が後者の方が大きいときに
該文字単位群を書き言葉から話し言葉に変換する
ことを特徴とする音声出力装置。

【請求項2】
 
前記パラフレーズテーブルにおいて、
1個又は複数個の文字単位から構成される文字単位群に着目し、該着目文字単位群を前記不一致部分として捉えるとき、
該着目文字単位群の前後に連接した前文字単位又は後文字単位の少なくともいずれかの、当該言葉学習用データ中における出現頻度に係る値又は、該値から所定の計算式によって算出された値に基づき、
該着目文字単位群をパラフレーズテーブルに記載するか否か、或いはパラフレーズテーブルへの記載の態様を決定する
請求項1に記載の音声出力装置。

【請求項3】
 
前記パラフレーズテーブルにおいて、
1個又は複数個の文字単位から構成される文字単位群に着目し、該着目文字単位群を前記不一致部分として捉えるとき、
該着目文字単位群が、当該言葉学習用データ中における出現頻度に係る値、或いは該値から所定の計算式によって算出された値に基づき、
該着目文字単位群をパラフレーズテーブルに記載するか否か、或いはパラフレーズテーブルへの記載の態様を決定する
請求項1又は2に記載の音声出力装置。

【請求項4】
 
書き言葉によって構成されたテキストを、話し言葉で読み上げる音声出力ソフトウェアであって、該音声出力ソフトウェアが、
テキストをコンピュータ処理用の書き言葉データとして装置内に入力するテキスト入力部と、
該書き言葉データを、話し言葉データに変換する言葉変換部と、
該話し言葉データから音声データを作成する音声データ作成部と、
該音声データに基づき、音声を出力する音声出力部と
を有する構成において、
該言葉変換部が、
少なくともその一部において同一意味内容を含む、書き言葉学習用データ及び話し言葉学習用データを用い、各言葉学習用データを所定の文字単位に分解した上、各言葉学習用データ間の不一致部分における各言葉間の書き換え可能確率が所定の値よりも高いものをパラフレーズとし、それをあらかじめ記載したパラフレーズテーブルを有すると共に、
該パラフレーズテーブルを参照して書き言葉データを話し言葉データに変換する変換ルーチンを有し、該変換ルーチンが、
1個又は複数個の文字単位から構成される文字単位群が前記パラフレーズテーブルに記載されているか、或いはその記載の態様を判別し、
その結果、該文字単位群が、書き言葉から話し言葉に変換可能な1個以上の変換後候補群を有すると判断される場合に、
該文字単位群の前後に近接する少なくとも1個の文字単位から成る前文字単位群及び後文字単位群が直前直後に出現する場合の該文字単位群と変換後候補群の当該言葉学習用データ中における出現頻度及び/又は出現確率に係る値を算出し、その値が最も大きい1個の変換後候補を特定した上で、
該文字単位群と、変換後候補との、出現頻度及び/又は出現確率に係る値が後者の方が大きいときに
該文字単位群を書き言葉から話し言葉に変換する
ことを特徴とする音声出力ソフトウェア。

【請求項5】
 
前記パラフレーズテーブルにおいて、
1個又は複数個の文字単位から構成される文字単位群に着目し、該着目文字単位群を前記不一致部分として捉えるとき、
該着目文字単位群の前後に連接した前文字単位又は後文字単位の少なくともいずれかの、当該言葉学習用データ中における出現頻度に係る値又は、該値から所定の計算式によって算出された値に基づき、
該着目文字単位群をパラフレーズテーブルに記載するか否か、或いはパラフレーズテーブルへの記載の態様を決定する
請求項4に記載の音声出力ソフトウェア。

【請求項6】
 
前記パラフレーズテーブルにおいて、
1個又は複数個の文字単位から構成される文字単位群に着目し、該着目文字単位群を前記不一致部分として捉えるとき、
該着目文字単位群が、当該言葉学習用データ中における出現頻度に係る値又は、該値から所定の計算式によって算出された値に基づき、
該着目文字単位群をパラフレーズテーブルに記載するか否か、或いはパラフレーズテーブルへの記載の態様を決定する
請求項4又は5に記載の音声出力ソフトウェア。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2001324097thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close