TOP > 国内特許検索 > 音声入力によるテキスト検索装置 > 明細書

明細書 :音声入力によるテキスト検索装置

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第4115723号 (P4115723)
公開番号 特開2003-271629 (P2003-271629A)
登録日 平成20年4月25日(2008.4.25)
発行日 平成20年7月9日(2008.7.9)
公開日 平成15年9月26日(2003.9.26)
発明の名称または考案の名称 音声入力によるテキスト検索装置
国際特許分類 G06F  17/30        (2006.01)
G10L  15/06        (2006.01)
G10L  15/20        (2006.01)
G10L  15/22        (2006.01)
FI G06F 17/30 310Z
G06F 17/30 170A
G06F 17/30 350C
G10L 3/00 521C
G10L 3/00 531P
G10L 3/00 561E
請求項の数または発明の数 2
全頁数 12
出願番号 特願2002-073850 (P2002-073850)
出願日 平成14年3月18日(2002.3.18)
審査請求日 平成17年1月31日(2005.1.31)
特許権者または実用新案権者 【識別番号】301021533
【氏名又は名称】独立行政法人産業技術総合研究所
【識別番号】503360115
【氏名又は名称】独立行政法人科学技術振興機構
発明者または考案者 【氏名】藤井 敦
【氏名】伊藤 克亘
【氏名】石川 徹也
個別代理人の代理人 【識別番号】100089635、【弁理士】、【氏名又は名称】清水 守
審査官 【審査官】紀田 馨
参考文献・文献 山本 哲也,キーワードスポッティングを用いた情報検索システムにおける拡張辞書の効果,電子情報通信学会技術研究報告 ,日本,社団法人電子情報通信学会,2002年 1月18日,Vol.101 No.604,第41頁乃至第46頁
渡邉 圭輔,未知語を含む入力文に対する対話管理方式の検討,日本音響学会平成6年度春季研究発表会講演論文集 ,日本,社団法人日本音響学会,1994年 3月23日,-I- MARCH 1994,第25頁乃至第26頁
藤井 敦,音声入力型文書検索システムの開発とテストコレクションの構築,情報処理学会研究報告 ,日本,社団法人情報処理学会,2001年 7月25日,Vol.2001 No.74,第65頁乃至第72頁
山田 雅章,音声対話CD-ROM情報検索システム,電子情報通信学会技術研究報告 ,日本,社団法人電子情報通信学会,1993年 6月17日,Vol.93 No.87,第57頁乃至第64頁
伊藤 克亘,連続音声認識における未知語の扱い,電子情報通信学会技術研究報告 ,日本,社団法人電子情報通信学会,1991年12月20日,Vol.91 No.396,第41頁乃至第47頁
調査した分野 G06F 17/30
G10L 15/06
G10L 15/20
G10L 15/22
JMEDPlus(JDreamII)
特許請求の範囲 【請求項1】
(a)音声認識部(1)と、
(b)書き起こし部(5)と、
)テキスト検索部(6)と、
検索対象テキストコレクション(7)と、
)未知語補完部(9)
補完された検索要求部(10)と、
(g)検索結果の出力部(8)とを備え、
(h)ユーザが検索要求を発話すると、前記音声認識部(1)が、音声認識用の辞書に登録されていない未知語を含むユーザの発話を前記書き起こし部(5)で書き起こし、前記検索対象テキストコレクション(7)の索引語から、検出された未知語と音韻的に等価な語もしくは類似する語を探索してユーザの発話中の未知語を自動的に前記未知語補完部(9)で補完し、前記補完された検索要求部(10)で補完された検索要求を用いて前記テキスト検索部(6)で再検索を行い、前記検索結果の出力部(8)から最終的な検索結果を得ることを特徴とする音声入力によるテキスト検索装置。
【請求項2】
請求項記載の音声入力によるテキスト検索装置において、前記音声認識部(1)は、音響モデル(2)、辞書(3)及び言語モデル(4)を有することを特徴とする音声入力によるテキスト検索装置。
発明の詳細な説明 【0001】
【発明の属する技術分野】
本発明は、音声入力によるテキスト検索装置に関するものである。
【0002】
【従来の技術】
従来、このような技術分野の参考文献としては、以下に示されるようなものがあった。
【0003】
〔1〕J.Barnett,S.Anderson,J.Broglio,M.Singh,R.Hudson,and S.W.Kuo.Experiments in spoken queries for document retrieval.In Proceedings of Eurospcech,97,pp.1323-1326,1997.
〔2〕Fabio Crestani.Word recognition errors and relevance feedback in spoken query processing.In Proceedings of the Fourth International Conference on Flexible Query Answring Systems,pp.267-281,2000.
〔3〕Atsushi Fujii,Katunobu Itou,and Tetsuya Ishikawa.Speech-driven text retrieval:Using target IR collections for statistical language model adaptation in speech recognition.In Information Retrieval Techniques for Speech Applications,pp.94-104,Springer,2002.
〔4〕John S.Garofolo,Ellen M.Voorhees,Vincent M.Stanford,and Karen Sparck Jones.Trec-6 1997 spoken document retrieval track overview and results.In Proceedings of the 6th Text REtrieval Conference,pp.83-91,1997.
〔5〕Katunobu Itou,Atsushi Fujii,and Tetsuya Ishikawa.Language modeling for multi-domain speech-driven text retrieval.In IEEE Automatic Speech Recognition and Understanding Workshop,2001.
〔6〕Katunobu Itou,Mikio Yamamoto,Kazuya Takeda,Toshiyuki Takezawa,Tatsuo Matsuoka,Tetsunori Kobayashi,and Kiyohiro Shikano.JNAS:Japanese speech corpus for large vocabulary continuous speech recognition research.Journal of Acoustic Society of Japan,Vol.20,No.3,pp.199-206,1999.
JP0004115723B2_000002t.gif【0004】
〔8〕K.L.Kwok and M.Chan.Improving two-stage ad-hoc retrieval for short queries.In Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retreval,pp.250-256,1998. 〔9〕Douglas B.Paul and Janet M.Baker.The design for the Wall Street Journal-based CSR corpus.In Proceedings of DARPA Speech & Natural Language Workshop,pp.357-362,1992.
〔10〕S.E Robertson and S.Walker.Some simple effective approximations to the 2-poisson model for probabilistic weighted retrieval.In Proceedings of the 17th Annual International ACM SIGIR Conference on Research and Development in Information.Retrieval,pp.232-241,1994.
〔11〕Herman J.M.Steeneken and David A.van Leeuwen.Multilingual assessment of speaker independent large vocabulary speech-recognition systems:The SQALE-project.In Proceedings of Eurospeech95,pp.1271-1274,1995.
JP0004115723B2_000003t.gif【0005】
〔13〕Steve Young.A review of large-vocabulary continuous-speech recognition.IEEE Signal Processing Magazine,pp.45-57,September 1996.
〔14〕伊藤克亘,田中和世.被覆率を重視した大語彙連続音声認識用統計的言語モデル.日本音響学会論文集,pp.65-66,March 1999. 〔15〕鹿野清宏、伊藤克亘、河原達也、武田一哉、山本幹雄(編)、音声認識システム、オーム社、2001.
近年の音声認識技術は、ある程度内容が整理されている発話に対しては実用的な認識精度を達成できるようになっており、様々な応用が考えられる。また、情報検索の分野では音声認識を採り入れた研究も数多く行われている。これらの研究は目的に応じて「音声データの検索」と「音声による検索」の2つに大別される。前者は、TRECのSpoken Document Retrieval(SDR)トラック(参考文献〔4〕)で放送音声データを対象にしたテストコレクションが整備されていることを背景にして盛んに研究が行われ、既に実用レベルに達している(参考文献〔7〕)。
【0006】
【発明が解決しようとする課題】
それに対して、音声による検索は、カーナビゲーションシステムやコールセンターのようにキーボード入力を前提としないアプリケーションを支える重要な基盤技術であるにも拘らず、音声データ検索に比べて研究事例は少ない。
【0007】
また、従来の研究では既存の音声認識とテキスト検索システムが単純に接続されているだけであり、音声認識誤りによって検索精度が顕著に低下する(参考文献〔1〕,〔2〕)。
【0008】
そこで、本願発明者らは、検索対象のコレクションを用いて音声認識用の言語モデルを作成し、音声認識と検索精度の両方を向上させることができる手法を提案した(参考文献〔3〕,〔5〕)。
【0009】
しかし、音声入力型の検索システムでは、未知語(システム辞書未登録語)の問題がある。近年の情報検索システムは、古典的な統制語彙型システムとは異なり、検索対象テキスト中の任意の語による検索を可能とする。索引のサイズが数100万のオーダーに達することは珍しくない。
【0010】
助詞などの機能語などは不要語として索引から除外されるものの、これらが検索キーワードとして利用されることは稀であるため、事実上、語彙制限はないと考えてよい。
【0011】
他方において、近年の音声認識システムでは語彙サイズ(辞書登録語数)が制限される。これは、ハードウェアに関する制約や統計モデルの学習効率が主な原因であるため(参考文献〔13〕)、登録語数を増やすという単純な方法では解決が困難である。多くの言語において、語彙サイズは高々数万語に制限されており(参考文献〔6〕,〔9〕,〔11〕)、実用的な検索システムの検索サイズに比べると極端に小さい。
【0012】
また、統計的な音声認識では、機能語などの高頻出語ほど高い精度で認識されるのに対して、情報検索では特定の文書にしか出現しない低頻度語ほど効果的な索引語になりやすい。すなわち、ユーザ発話中の効果的な検索キーワードほど誤認識されやすいという矛盾が生じる。
【0013】
以上をまとめると、音声入力型の検索システムにおいて「未知語問題」は本質的に不可避であり、何らかの積極的な解決策が必要である。
【0014】
本発明は、上記状況に鑑みて、音声認識でカバーできない単語を検索用の索引語によって自動的に補完することにより、音声発話の誤認識をなくし、検索精度の向上を図り得る音声入力によるテキスト検索装置を提供することを目的とする。
【0015】
【課題を解決するための手段】
本発明は、上記目的を達成するために、
〕音声入力によるテキスト検索装置において、音声認識部(1)と、書き起こし部(5)と、テキスト検索部(6)と、検索対象テキストコレクション(7)と、未知語補完部(9)、補完された検索要求部(10)と、検索結果の出力部(8)とを備え、ユーザが検索要求を発話すると、前記音声認識部(1)が、音声認識用の辞書に登録されていない未知語を含むユーザの発話を前記書き起こし部(5)で書き起こし、前記検索対象テキストコレクション(7)の索引語から、検出された未知語と音韻的に等価な語もしくは類似する語を探索してユーザの発話中の未知語を自動的に前記未知語補完部(9)で補完し、前記補完された検索要求部(10)で補完された検索要求を用いて前記テキスト検索部(6)で再検索を行い、前記検索結果の出力部(8)から最終的な検索結果を得ることを特徴とする。
【0016】
〕上記〔〕記載の音声入力によるテキスト検索装置において、前記音声認識部(1)は、音響モデル(2)、辞書(3)及び言語モデル(4)を有することを特徴とする。
【0017】
【発明の実施の形態】
以下、本発明の実施の形態を詳細に説明する。
【0018】
図1は本発明の実施例を示す音声入力型テキスト検索システムの構成図、図2は本発明の実施例を示す音声入力型テキスト検索フローチャートである。
【0019】
図1において、BはユーザAによる検索要求の発話、1は音声認識部、2は音響モデル、3は辞書、4は言語モデル、5は書き起こし部、6はテキスト検索部、7は検索対象テキストコレクション、8は検索結果の出力部、9は未知語補完部、10は補完された検索要求部である。
【0020】
このように、本発明の音声入力型テキスト検索システムは、音声認識部1、テキスト検索部6、未知語補完部9の3つのモジュールで構成されている。現在は日本語を対象に実装されているものの、本発明で提案する手法は言語の種類を問わない。
【0021】
以下、図1を参照しながら、この音声入力型テキスト検索システムの処理について説明する。
【0022】
まず、ユーザAが検索要求の発話Bをすると、音声認識部1が辞書3、音響モデル2、言語モデル4を用いてユーザAの発話Bの書き起こしを生成する。本発明のシステムでは、日本語ディクテーションツールキット(参考文献〔15〕)で提供されている音声認識部1と音響モデル2を利用した。しかし、ユーザ発話B中に含まれる未知語を検出するために、辞書3と言語モデル4は独自に作成して利用した(参考文献〔14〕)。
【0023】
具体的には毎日新聞CD-ROM 10年分(1991-2000)の記事を「茶筌」で形態素解析し、高頻度語20,000語を抽出して辞書を構成した。通常は、辞書中の単語Nグラムなどによって言語モデル4を作成する。しかし、これでは辞書未登録語は認識できない。そこで、辞書に登録されなかった約30万語(異なり数)を音節単位に分割し、単語と音節を併用してトライグラムを作成した。音節は異なりで700件あった。
【0024】
すなわち、本発明のシステムの言語モデル4において、辞書未登録語は音節の組み合わせとしてモデル化されている。その結果、辞書未登録語は単語としては認識されないものの、音節単位でカタカナ列として書き起こしされる。また、当該言語モデル4は通常の統計的Nグラムなので、既存のデコーダを拡張せずに利用できる。そこで、音韻系列の認識を別途必要とする手法(参考文献〔12〕)とは異なる。
【0025】
「オレンジやグレープフルーツなどの柑橘系果物の輸入に関する記事」という発話を例にとると、
『オレンジや/グレープラチナガノ/などの/カンキツケイ/果物の輸入に関する記事』のように「グレープフルーツ」や「柑橘系」が未知語として検出される(ここでは未知語部分をスラッシュで括っている)。
【0026】
なお、「柑橘系」のように未知語箇所の検出と音韻列の特定に成功する場合や「グレープフルーツ」のように音韻列の特定は不完全でも未知語箇所の検出に成功する場合がある。いずれの場合も、未知語に対する正しい語を推定することができれば、音声認識精度が向上し、結果として検索精度も向上する。
【0027】
本発明のシステムのユーザは、検索対象のテキストコレクションから何らかの情報を引き出したいという意図を持って発話を行う。言い替えれば、ユーザの発話はテキストコレクション中の情報に関連したものである可能性が高い。そこで、上記「グレープラチナガノ」や「カンキツケイ」に対応する正しい語がコレクション中に含まれていると考えることは自然な発想である。
【0028】
直感的には、検索対象テキストコレクションの索引語から、検出された未知語と音韻的に等価な語もしくは類似する語を探索してユーザ発話中の未知語を補完すればよい。しかし、音韻的に「類似する」語の探索(すなわち、音韻列の部分一致による探索)を大規模な索引に対して行うことは効率が悪く、実時間処理には耐えない。
【0029】
そこで、まず、ユーザ発話中で単語として認識された部分だけを用いて初期検索を実行し、ユーザの検索要求に関連する文書を選択的に取得する。テキスト検索には確率型の「Okapi法」(参考文献〔10〕)を用いた。当該手法は、与えられた検索要求に対するスコアを各文書に対して計算し、スコアが高い順番に文書を出力する。本発明のシステムでは、対象テキストを「茶筌」で形態素解析して名詞を索引語として抽出し、単語単位で索引付けを行って転置ファイルを事前に作成する。
【0030】
次に、初期検索で得られた文書から、検出された未知語に対応する語を探索し、未知語と置き換えることで検索要求を補完する。具体的な方法については後述する。
【0031】
最後に、補完された検索要求を用いて再検索を行い、最終的な検索結果が得られる。
【0032】
上記の手法は、初期検索の結果を用いて最終的な検索精度を向上させるという点において、情報検索で用いられる検索要求の拡張(query expansion)やローカルフィードバックに類似している(参考文献〔8〕)。
【0033】
しかし、これらは検索精度を向上させることに主眼が置かれ、ユーザが意図しない索引語を追加する可能性がある。それに対して本手法は、ユーザの発話を正しく認識することを目的としている点が異なる。これは「自分が発話(意図)した通りに検索が行われている」という安心感をユーザに与える上で重要である。
【0034】
次に、未知語の自動補完について説明する。
【0035】
本発明のシステムの特長は、音声認識で検出された未知語の音韻系列を、初期検索で取得された上位文書中の索引語に対応付けることによって単語として正しく認識する点にある。この処理を「未知語の補完」と呼ぶことにする。
【0036】
同音意義語のために、一つの音韻系列が複数の単語に対応することがある(例えば「河川」と「架線」)。また、未知語の音韻系列は誤って検出されることがあるため、補完対象の音韻系列一つに対して、音韻的に類似する複数の索引語を考慮する必要がある。すなわち、未知語の自動補完では、複数の候補から適切な索引語を選択するための曖昧性解消が必要である。
【0037】
そこで、選択されるべき索引語が満たす条件について検討し、以下に示す3つの基準を設定した。
【0038】
(1)補完対象の未知語との音韻的な類似度が高い(完全一致すれば類似度は最大となる)。
【0039】
(2)上位文書における出現頻度が高い。
【0040】
(3)より上位の文書に出現する。
【0041】
これらを確率論的な枠組みで定式化すると、未知語補完は、式(1)で計算されるスコアを最大化するtを選択することに相当する。
【0042】
【数1】
JP0004115723B2_000004t.gif【0043】
ここで、Dq は検索要求qによって初期検索された上位文書の集合である。P(ω|t)はtが音韻的にωと等価である確率、P(t|d)は上位文書の一つdから索引語を無作為に選んだ場合に、それがtである確率、P(d|q)は検索要求qによって文書dが検索される確率である。これらのパラメタは、上記3つの基準(1)~(3)に順番に対応している。
【0044】
しかし、実際にはP(ω|t)やP(d|q)の確率値を正確に推定することは難しい。また、音韻的な類似度(上記、第1の基準)が他の基準よりもかなり強い制約になることが経験的に分かっている。そこで、予備実験の結果に基づいて、式(1)を式(2)のように近似する。
【0045】
【数2】
JP0004115723B2_000005t.gif【0046】
ここで、P(ω|t)はtとωが共有する音韻数とωに含まれる音韻総数の比率によって計算する。具体的には、DPマッチングによってtとωを音韻単位で比較し、両者に共通して含まれる音韻列を特定する。P(t|d)はdにおけるtの相対頻度で計算する。P(d|q)としてOkapi法で計算される文書dのスコアで代用する。また、P(d|q)とP(d|q)のlogを用いることで、これら2つの影響力が相対的に小さくなるように制御している。
【0047】
以上の方法は、索引付けの手法に依存しない点に注意が必要である。言い替えれば、索引語tの単位として、文字、単語、複合語など文書中に現れる任意の文字列を対象とすることができる。
【0048】
初期検索によって文書数を制限しても、索引語数は膨大なものになる場合がある。特に、DPマッチングによる音韻単位の比較は実時間応答を低下させる要因となる。
【0049】
また、上位文書中の索引語の多くは、補完対象の未知語と音韻的に全く類似しないため、これらのノイズを早期に排除できれば、計算効率の向上が期待できる。
【0050】
通常のテキスト検索に用いられる索引(本発明のシステムでは転置ファイル)は、入力されたキーワードとの完全一致によって、該当する項目を効率良く検索できる。しかし、未知語補完用索引では、入力された音韻列に対して、部分一致を許容しながら、ある程度類似した項目だけを効率良く特定できなければならない。
【0051】
本発明のシステムで用いる未知語検出の傾向を調査した結果、検出された未知語と、それに対応する正しい索引語は、前方もしくは後方で一致していることが多く、両端が一致せずに語中のみが一致することは少ない。そこで、未知語補完用の索引を以下の手順で事前に作成した。
【0052】
まず、コレクション中の全文書を「茶筌」で形態素解析し、単語表記とカナ表記を抽出する。次に、カナ表記を規則によって音韻系列に変換する(規則数143)。最後に、音韻系列の前方と後方から任意長の部分列を抽出して、前方/後方部分一致探索が可能な索引を編成する。
【0053】
このとき、単語一つと単語バイグラムを併用して索引を作成することで「弥生/時代」や「オゾン/ホール」のように2単語で構成される複合語にも対応した。
【0054】
原理的には、3単語以上で構成される長い複合語も扱うことができる。しかし、未知語の長さに比例して探索時間がかかるため、現在は2単語までとしている。また、現状の音声認識では機能語のような高頻度語は既知語として正しく認識されやすいため、長い単語列(例えば「情報検索の応用分野」)が一つにまとまった未知語として検出されることは稀である。
【0055】
本発明で実装したシステムを評価するために、IREXの日本語検索コレクションを用いて実験を行った。当コレクションは、毎日新聞1994-1995年(記事総数211,853件)を対象にした検索課題30件と各課題に対する正解記事IDで構成されている。検索課題の例を以下に示す。
【0056】
<TOPIC><TOPIC-ID>1010</TOPIC-ID>
<DESCRIPTION>柑橘類の輸入</DESCRIPTION>
<NARRAATIVE>オレンジ、レモン、グレープフルーツなどの柑橘系果物の日本への輸入の記事、政府の市場開放や輸入による日本生産地の影響、段への影響や消費者の反応などの記事を含む。</NARRATIVE></TOPIC>
さらに、4名の話者(男女各2名)に<NARRATIVE>フィールドを読み上げてもらい、合計120件の音声発話データを作成して実験に利用した。初期検索、再検索ともに上位300件を出力した。
【0057】
まず、未知語の検出と補完に関する評価を行った。30件の検索要求(<NARRATIVE>のみ)に含まれる単語は、のべ数で約400語あり、14単語(異なりで13単語)が音声認識用辞書に登録されていなかった。
【0058】
未知語検出の再現率と精度はそれぞれ71.4%と22.6%であった。本発明のシステムは未知語を網羅的に特定する傾向があることが分かる。さらに、未知語の補完精度を調べた結果、36.2%であった。ここでは、辞書登録語が未知語として誤検出されても、補完処理によって正しい索引語に対応付けられた場合は正解と判定した。正しく補完された未知語と、索引語の例を以下に示す。
【0059】
グレープラチナガノ/グレープフルーツ
ヤヨイチタ/弥生時代
ニククライス/ニックプライス
ベンピ/便秘
次に、検索精度への影響を調べるために、以下の異なる検索手法(システム)を比較した。
【0060】
(i)テキスト入力型検索システム
(ii)高頻度語20,000語のみを含む言語モデルを音声認識に使用した音声入力型検索システム
(iii )検出した未知語は補完しないシステム
(iv)本発明のシステム(未知語の検出・補完を併用)
システム(iv)が本発明で提案するシステムに相当する。システム(ii)は未知語音節をモデル化していないため、未知語の検出と補完を行わない点を除けば、本発明のシステムと同じである。
【0061】
各システムの平均適合率(%)を以下に示す。
【0062】
【表1】
JP0004115723B2_000006t.gif【0063】
本発明のシステムの精度はテキスト検索には及ばないものの、約87%を再現している。また、全ての話者に対してそれ以外の音声入力型システム〔(ii)と(iii )〕の検索精度を向上させた。システム(iii )と(iv)を比較することで未知語補完の効果が分かり、システム(ii)と(iv)を比較することで、未知語の検出と補完を併用した提案手法の有効性が分かる。
【0064】
しかし、精度の向上はそれほど大きくなかった。今回の実験では未知語が本質的に少なかったため、全体的な差異が大きくならなかった。また、未知語を人工的に作るような不自然な実験設定は避けた。未知語問題がより深刻な対象(例えば、技術文書やウェブページ)について、今後さらなる評価実験を行う予定である。
【0065】
システム(ii)に比べて、本発明のシステム(iv)の精度が顕著に低下した課題を分析した結果、初期検索の上位文書に正しい索引語を含まれているにも拘らず、式(2)のスコアで適切に選択されなかった事例が大半を占めた。例えば「制度」が未知語検出によって「センド」と誤認識されたために「鮮度」のように音韻的に等価な別の語が選択されてしまった。文書中の索引語頻度や文書順位などとのバランスについて今後検討が必要である。また、未知語音節をモデル化したために、辞書登録語を誤認識し、検索精度が低下した事例が若干あった。
【0066】
最後に、オンライン処理のCPU時間を測定した。未知語の検出は、通常の統計的音声認識の枠組み内で行われるため、それに伴う付加的なCPU時間は発生しない。補完に要したCPU時間は未知語あたり平均3.5秒だった(CPUとしてAMD Athlon MP 1900+を使用)。依然として改善の余地はあるものの、ほぼ実時間で動作すると考えて良い。
【0067】
音声入力型の検索システムでは、音声認識と検索における語彙サイズの不整合は不可避である。本発明は、単語と音節を併用した言語モデルによってユーザ発話中の未知語を検出し、検索対象文書中の索引語によって適切に補完する手法を提案した。例としては、新聞記事を対象にした実験の結果、本発明は実時間で動作し、既存の手法を上回る検索精度を実現することができた。また、上述のように、技術文書やウェブページの検索では未知語問題がより深刻になるが、このような場合に、本発明の実用的効果は著大である。
【0068】
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨に基づいて種々の変形が可能であり、これらを本発明の範囲から排除するものではない。
【0069】
【発明の効果】
以上、詳細に説明したように、本発明によれば、音声認識でカバーできない単語を検索用の索引語によって自動的に補完することにより、音声発話の誤認識をなくし、検索精度の向上を図ることができる。
【図面の簡単な説明】
【図1】 本発明の実施例を示す音声入力型テキスト検索システムの構成図である。
【図2】 本発明の実施例を示す音声入力型テキスト検索フローチャートである。
【符号の説明】
A ユーザ
B 検索要求の発話
1 音声認識部
2 音響モデル
3 辞書
4 言語モデル
5 書き起こし部
6 テキスト検索部
7 検索対象テキストコレクション
8 検索結果の出力部
9 未知語補完部
10 補完された検索要求部
図面
【図1】
0
【図2】
1