TOP > 国内特許検索 > 話し言葉の書き言葉への変換装置

話し言葉の書き言葉への変換装置 コモンズ

国内特許コード P140010702
整理番号 01-58
掲載日 2014年7月3日
出願番号 特願2001-324096
公開番号 特開2003-132047
登録番号 特許第3721397号
出願日 平成13年10月22日(2001.10.22)
公開日 平成15年5月9日(2003.5.9)
登録日 平成17年9月22日(2005.9.22)
発明者
  • 村田 真樹
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 話し言葉の書き言葉への変換装置 コモンズ
発明の概要 【課題】 話し言葉で入力した文章等を書き言葉の文章等で出力することができる話し言葉の書き言葉への変換装置を提供すること。
【解決手段】 話し言葉の入力手段11と、前記入力手段により入力された話し言葉を書き言葉に変換する言葉変換手段12と、前記言葉変換手段により変換された書き言葉を出力する出力手段13とを有するものである。また、前記言葉変換手段は、話し言葉と書き言葉のデータを用いているものが好ましく、更に、前記言葉変換手段は、話し言葉と書き言葉の差分部分のデータを用いているものが好ましい。
従来技術、競合技術の概要



話し言葉と書き言葉には違いがあり、例えば、書き言葉の「データ」、「え」と「=」が、話し言葉でそれぞれ「データー」、「えー」と「は」となったり、また話し言葉では「という」をいれて柔らかく言う場合等がある。話し言葉と書き言葉の差分を抽出し、前記のような話し言葉と書き言葉の違いを調べ、その差分結果により作成した書き言葉から話し言葉への変形規則を用い、書き言葉から話し言葉へ自動で言い換える方法に関しては、既に論文等で発表された周知の技術である。また、前記変形規則を用い、話し言葉から書き言葉へ自動で言い換えることも同様な方法により可能である。





前記話し言葉から書き言葉への変換は、様々な人の話し言葉を誰でも容易に理解できる書き言葉として残したり、話し言葉で入力したものを書き言葉の原稿として容易に得たり、テレビ、映画等において話す言葉を逐次画面の端等に表示する等に利用される。





また、話し言葉の入力手段としては、パソコン等に搭載された音声認識機能等があり、マイクを通して入力された話し言葉の音声から、単語、文章等の話し言葉データに変換する方法等、他にも多種多数の従来技術がある。前記変換後の単語、文章等の話し言葉データは、パソコン等のメモリに一時記憶あるいはハードディスク等の記録媒体に保存され、必要に応じた処理が行われる、尚、話し言葉は、マイクを通してのみではなく、磁気テープ等の記録媒体に記録された音声を再成する装置からの出力をパソコン等に入力し、前記同様に話し言葉データとして得られる場合もある。





また、パソコン等のキーボードにより、音声を聞きながらあるいは映画の台本、原稿等に話し言葉で記述された文章等をパソコン等に入力する方法もある。前記入力された文章等の話し言葉データは、パソコン等のハードディスク等の記録媒体に保存され、必要に応じて処理される。





尚、前記パソコン等では、前記記録媒体に記録する出力形態ばかりでなく、前記記録された文章等の話し言葉データを、専用のソフトウェアあるいは市販のワードプロセッサー等のソフトウェアを用いてCRT等の表示装置に表示したり、プリンターによりプリントとして出力することができる。

産業上の利用分野



この発明は、入力された話し言葉を書き言葉に変換し、変換後の書き言葉により表された文章等の保存、表示、プリント等の出力機能を備えた話し言葉の書き言葉への変換装置に関するものである。

特許請求の範囲 【請求項1】
話し言葉の入力手段と、
前記入力手段により入力された話し言葉を書き言葉に変換する言葉変換手段と、
前記言葉変換手段により変換された書き言葉を出力する出力手段とを有する話し言葉の書き言葉への変換装置であって、
入力手段は、
(1)話し言葉のデータを入力すると共に、話し言葉データを所定のファイル形式で記録媒体に保存する動作を行い、
言葉変換手段は、
(2)データ読み出し部において該記録媒体から話し言葉データを読み出し、
(3)次いで形態素列分解部において該話し言葉データを形態素の羅列に分解し、
(4)次いで文頭から順次着目する形態素で始まる形態素列について、(4-1)変換候補抽出部が、予め記録媒体に備えた書き言葉・話し言葉間の言い換えテーブル中の話し言葉文字列と一致する被変換候補の形態素列を抽出すると共に、該言い換えテーブルにおいて話し言葉文字列に対応する書き言葉文字列を変換候補として読み出し、メモリ上に保持する処理と、(4-2)頻度測定部において、当該着目中の形態素列の前後所定個数の形態素が予め記録媒体に備えた書き言葉データベース中で、当該被変換候補を挟んで並ぶ頻度と、当該変換候補を挟んで並ぶ頻度とを測定して比較する処理と、(4-3)変換処理部が、該比較において後者の頻度が大きい時に着目中の形態素列をメモリ上の変換候補で置き換える処理、の各処理(4-1)~(4-3)を文末の形態素まで行い、
出力手段は、
(5)少なくとも所定のファイル形式によって置き換えられた書き言葉データを記録媒体に保存する動作を行う
ことを特徴とする話し言葉の書き言葉への変換装置。

【請求項2】
前記言葉変換手段における言い換えテーブルを、
コンピュータのプロセッサにおけるデータ照合部により、記憶媒体内に予め記録された対を成す話し言葉データベース及び書き言葉データベースから不一致部分及び一致部分の検出を行うと共に、
確率演算部により、
前一致部分、不一致部分、後一致部分となる文字列の組合せにおいて、前一致部分については後方所定の文字数以内に後一致部分の文字列が現れる確率と、後一致部分については前方所定の文字数以内に前一致部分の文字列が現れる確率とのそれぞれ余事象同士を乗じ、当該不一致部分が差分として確からしい確率を算出する第1のステップ及び、
不一致部分が同一の全ての前一致部分及び後一致部分について該第1のステップにおける確率の余事象の直積を演算し、その余事象を当該不一致部分が、差分として確からしい確率として算出する第2のステップ
を処理し、
所定の確率値を超えた差分部分だけを備えることにより構成した
ことを特徴とする請求項1記載の話し言葉の書き言葉への変換装置。

【請求項3】
前記話し言葉の書き言葉への変換装置における言い換えテーブルが、確率演算部の第1のステップにおける処理において、
前一致部分、不一致部分、後一致部分となる文字列の組合せを取り出す際に、該不一致部分がその内部に一致部分である文字列を含んで構成される
ことを特徴とする請求項2記載の話し言葉の書き言葉への変換装置

【請求項4】
前記入力手段が、
マイク又は音声再生装置から話し言葉の音声波形をコンピュータのプロセッサにおける音声処理部に入力する音声入力部と、
入力された音声波形を音素認識して記号化データを記憶し、該記号化データをセグメン
テーション処理により音声単位データに分割し、該音声単位データから単語認識して話し言葉データに変換する処理を少なくとも行う音声処理部と、
該話し言葉データをファイルとして記録媒体に保存する保存部とを備える
請求項1ないし3記載の話し言葉の書き言葉への変換装置。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2001324096thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close