TOP > 国内特許検索 > 話し言葉による音声出力装置及びソフトウェア

話し言葉による音声出力装置及びソフトウェア コモンズ

国内特許コード P140010701
整理番号 01-60
掲載日 2014年7月3日
出願番号 特願2001-324097
公開番号 特開2003-131679
登録番号 特許第3593563号
出願日 平成13年10月22日(2001.10.22)
公開日 平成15年5月9日(2003.5.9)
登録日 平成16年9月10日(2004.9.10)
発明者
  • 村田 真樹
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 話し言葉による音声出力装置及びソフトウェア コモンズ
発明の概要 【課題】 主要言語間のみならず主要言語・非主要言語間における機械翻訳に用いることができる第3言語テキストの生成技術を創出すること。同時に、従来よりも高精度にテキストを生成することのできる生成技術を提供する。
【解決手段】 複数の対訳関係を有する言語テキストを入力し、両言語の対訳コーパスを用いることで、従来の単言語入力よりも高精度な第3言語テキストを生成する技術を実現する。入力後、解析過程、変換過程、生成過程の各過程を経て、目標言語文書を出力する。目標言語文書は、固有情報を自動獲得可能なため、大規模なコーパス等を必要としないことに特徴を有する。
従来技術、競合技術の概要



近時のコンピュータによる音声合成技術の進歩にともなって、音声によって聴覚的に情報を伝達出力する技術は、日常生活においても様々な場面で使われている。例えば、カーナビゲーションシステムにおいては、運転中の運転者に対して音声で進路、渋滞情報等の各種情報を伝えるために、運転に支障を及ぼさない、音声で伝達するようになっている。また、文字を読みとることができない、盲人・弱視者向けのテキスト音読システムもある。

該システムでは、テキストを入力することによって、文字を読みの辞書に従って読み上げるようになっており、より聞き取りやすい読み方で読み上げる手法等が研究されている。





ところで、現在の音声合成技術は、主に与えられたテキストをそのまま音読するため、聞き取りやすい話し言葉で出力するためには、あらかじめ話し言葉で構成されるテキストを用意しているのが一般的である。このような方法では、上述のテキスト音読システムで書籍や新聞等を入力しても、そのまま読み上げるだけのため、書き言葉特有の表現がそのまま音読され、不自然な印象を与えるばかりでなく、非常に聞き取りにくい問題がある。





これらの問題点を解消するため、従来の技術としては、例えば特開2001-166787号公報は、書き言葉のテキストを話し言葉の表現に置き換えて話し言葉らしい韻律で読み上げ、かつ、話し言葉韻律にあわせて規則韻律を調整することで、話し言葉として自然にテキストを読み上げることができる音声合成装置を開示している。

該手法によると、確かにスムーズな韻律によって聞き取りやすい音声合成を行うことはできるので、上記問題点に関する一定の解決方法にはなりうる。





しかし、上記発明では主に読み上げる文全体の韻律等に重きをおいており、話し言葉の表現に置き換える手法は、あらかじめ備えられたテキスト変換テーブルによって機械的に置き換えるのみであって、しかもそのテキスト変換テーブルの作成については特徴的な手法は提案されていない。

産業上の利用分野



本発明は、書き言葉で構成されたテキストを話し言葉で音声出力する音声出力装置及びそのソフトウェアに関する。より詳しくは、特に変換手法に特徴を有する出力装置及びソフトウェアの提供を図る技術に係るものである。

特許請求の範囲 【請求項1】
書き言葉によって構成されたテキストを、話し言葉で読み上げる音声出力装置であって、該音声出力装置が、
テキストをコンピュータ処理用の書き言葉データとして装置内に入力するテキスト入力手段と、
該書き言葉データを、話し言葉データに変換する言葉変換手段と、
該話し言葉データから音声データを作成する音声データ作成手段と、
該音声データに基づき、音声を出力する音声出力手段と
を有する構成において、
該言葉変換手段が、
少なくともその一部において同一意味内容を含む、書き言葉学習用データ及び話し言葉学習用データを用い、各言葉学習用データを所定の文字単位に分解した上、各言葉学習用データ間の不一致部分における各言葉間の書き換え可能確率が所定の値よりも高いものをパラフレーズとし、それをあらかじめ記載したパラフレーズテーブルを備えると共に、
該パラフレーズテーブルを参照して書き言葉データを話し言葉データに変換する変換エンジンを備え、該変換エンジンが、
1個又は複数個の文字単位から構成される文字単位群が前記パラフレーズテーブルに記載されているか、或いはその記載の態様を判別し、
その結果、該文字単位群が、書き言葉から話し言葉に変換可能な1個以上の変換後候補群を有すると判断される場合に、
該文字単位群の前後に近接する少なくとも1個の文字単位から成る前文字単位群及び後文字単位群が直前直後に出現する場合の該文字単位群と変換後候補群の当該言葉学習用データ中における出現頻度及び/又は出現確率に係る値を算出し、その値が最も大きい1個の変換後候補を特定した上で、
該文字単位群と、変換後候補との、出現頻度及び/又は出現確率に係る値が後者の方が大きいときに
該文字単位群を書き言葉から話し言葉に変換する
ことを特徴とする音声出力装置。

【請求項2】
前記パラフレーズテーブルにおいて、
1個又は複数個の文字単位から構成される文字単位群に着目し、該着目文字単位群を前記不一致部分として捉えるとき、
該着目文字単位群の前後に連接した前文字単位又は後文字単位の少なくともいずれかの、当該言葉学習用データ中における出現頻度に係る値又は、該値から所定の計算式によって算出された値に基づき、
該着目文字単位群をパラフレーズテーブルに記載するか否か、或いはパラフレーズテーブルへの記載の態様を決定する
請求項1に記載の音声出力装置。

【請求項3】
前記パラフレーズテーブルにおいて、
1個又は複数個の文字単位から構成される文字単位群に着目し、該着目文字単位群を前記不一致部分として捉えるとき、
該着目文字単位群が、当該言葉学習用データ中における出現頻度に係る値、或いは該値から所定の計算式によって算出された値に基づき、
該着目文字単位群をパラフレーズテーブルに記載するか否か、或いはパラフレーズテーブルへの記載の態様を決定する
請求項1又は2に記載の音声出力装置。

【請求項4】
書き言葉によって構成されたテキストを、話し言葉で読み上げる音声出力ソフトウェアであって、該音声出力ソフトウェアが、
テキストをコンピュータ処理用の書き言葉データとして装置内に入力するテキスト入力部と、
該書き言葉データを、話し言葉データに変換する言葉変換部と、
該話し言葉データから音声データを作成する音声データ作成部と、
該音声データに基づき、音声を出力する音声出力部と
を有する構成において、
該言葉変換部が、
少なくともその一部において同一意味内容を含む、書き言葉学習用データ及び話し言葉学習用データを用い、各言葉学習用データを所定の文字単位に分解した上、各言葉学習用データ間の不一致部分における各言葉間の書き換え可能確率が所定の値よりも高いものをパラフレーズとし、それをあらかじめ記載したパラフレーズテーブルを有すると共に、
該パラフレーズテーブルを参照して書き言葉データを話し言葉データに変換する変換ルーチンを有し、該変換ルーチンが、
1個又は複数個の文字単位から構成される文字単位群が前記パラフレーズテーブルに記載されているか、或いはその記載の態様を判別し、
その結果、該文字単位群が、書き言葉から話し言葉に変換可能な1個以上の変換後候補群を有すると判断される場合に、
該文字単位群の前後に近接する少なくとも1個の文字単位から成る前文字単位群及び後文字単位群が直前直後に出現する場合の該文字単位群と変換後候補群の当該言葉学習用データ中における出現頻度及び/又は出現確率に係る値を算出し、その値が最も大きい1個の変換後候補を特定した上で、
該文字単位群と、変換後候補との、出現頻度及び/又は出現確率に係る値が後者の方が大きいときに
該文字単位群を書き言葉から話し言葉に変換する
ことを特徴とする音声出力ソフトウェア。

【請求項5】
前記パラフレーズテーブルにおいて、
1個又は複数個の文字単位から構成される文字単位群に着目し、該着目文字単位群を前記不一致部分として捉えるとき、
該着目文字単位群の前後に連接した前文字単位又は後文字単位の少なくともいずれかの、当該言葉学習用データ中における出現頻度に係る値又は、該値から所定の計算式によって算出された値に基づき、
該着目文字単位群をパラフレーズテーブルに記載するか否か、或いはパラフレーズテーブルへの記載の態様を決定する
請求項に記載の音声出力ソフトウェア。

【請求項6】
前記パラフレーズテーブルにおいて、
1個又は複数個の文字単位から構成される文字単位群に着目し、該着目文字単位群を前記不一致部分として捉えるとき、
該着目文字単位群が、当該言葉学習用データ中における出現頻度に係る値又は、該値から所定の計算式によって算出された値に基づき、
該着目文字単位群をパラフレーズテーブルに記載するか否か、或いはパラフレーズテーブルへの記載の態様を決定する
請求項又はに記載の音声出力ソフトウェア。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2001324097thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close