TOP > 国内特許検索 > 音声検索装置および音声検索方法

音声検索装置および音声検索方法 新技術説明会

国内特許コード P120008366
掲載日 2012年11月29日
出願番号 特願2011-501548
登録番号 特許第5408631号
出願日 平成22年2月10日(2010.2.10)
登録日 平成25年11月15日(2013.11.15)
国際出願番号 JP2010051937
国際公開番号 WO2010098209
国際出願日 平成22年2月10日(2010.2.10)
国際公開日 平成22年9月2日(2010.9.2)
優先権データ
  • 特願2009-044842 (2009.2.26) JP
発明者
  • 桂田 浩一
  • 新田 恒雄
  • 手島 茂樹
出願人
  • 国立大学法人豊橋技術科学大学
発明の名称 音声検索装置および音声検索方法 新技術説明会
発明の概要 検索速度が高速であり、かつ、検索性能も良好である、あいまい検索を行う音声検索装
置および音声検索方法を提供する。
接尾辞配列と動的計画法をともに用いて音声に対する、あいまい検索を行うだけでなく、音声データに含まれる音素弁別特徴間の距離を算出して類似性を判定し、音素による検索キーワード分割と、複数の分割された検索キーワードに対する検索の閾値により検索対象を絞り込み、検索の閾値を逐次的に増加させながら繰り返し検索し、検索キーワードの長さに応じてキーワード分割の有無を判定することにより、検索速度が高速で、検索性能も良好な音声検索を実現している。
従来技術、競合技術の概要



ブロードバンド回線の普及など情報通信技術の発展により、Web上で音声や動画像のコンテンツを利用する機会が増え、コンテンツの数も急激に増加している。このため、Web上の音声データや動画データを効率的に探索し、利用するには、音声検索技術が必要不可欠である。特に高速に検索するシステムが求められている。





このようなニーズを満たすために、非特許文献1および2に記載の先行技術では、音声データベースから索引データを作成し、これを用いて高速な音声検索を実現する手法が提案されている。





また、特許文献1に記載の先行技術では、接尾辞配列と動的計画法を組み合わせて、文書検索において表記揺れの解消と高速化について記述がある。

産業上の利用分野



本発明は、音声検索装置および音声検索方法に関する。より詳細には、音声に対する検索を高速かつ効率的に行う装置ならびに方法に関するものである。

特許請求の範囲 【請求項1】
音声を入力として、前記入力された音声をサンプリングして得られる音声データを検索する音声検索装置であって、
音声データベースに記録される音声を認識するデータベース用音声認識器と、
前記データベース用音声認識器によって認識された単語列から音素列を生成する音声用音素列生成部と、
前記音声用音素列生成部によって生成された音素列から接尾辞配列を生成するSuffix Array生成部と、
検索キーワードを入力する入力装置と、
前記入力装置により入力された検索キーワードから音素列を生成する入力音素生成部と、前記接尾辞配列上で検索キーワードを動的計画法により検索する音声検索部と、
前記音声検索部により検索された結果を出力する出力装置とを備え、
前記音声検索部は、検索で用いる第1の閾値を設定する手段と、
前記第1の閾値を用いて動的計画法により検索対象を検索する手段と、
前記第1の閾値を逐次的に増加させながら繰り返し検索し、検索結果を逐次的に提示する閾値調整手段と
を備えた音声検索部であることを特徴とする音声検索装置。
【請求項2】
請求項1に記載の音声検索装置であって、
前記音声検索部は、さらに、
検索キーワードが所定長さ以上であるとき、該検索キーワードを音素により分割する手段と、
前記検索キーワードの分割手段によって分割されたキーワードに対する検索に用いる第2の閾値を前記第1の閾値から決定する手段とを備え、
前記検索対象を検索する手段は、前記第2の閾値を用いて動的計画法により検索対象を検索する手段である
ことを特徴とする音声検索装置。
【請求項4】
請求項1または2に記載の音声検索装置であって、
前記音声検索部は、さらに、
検索キーワードの長さによりキーワード分割の有無を判定する手段と、
前記キーワード分割後の音素数の決定を行うキーワード分割手段と
を備えた音声検索部であることを特徴とする音声検索装置。
【請求項5】
請求項1ないし4のいずれかに記載の音声検索装置であって、
前記動的計画法により検索対象を検索する手段は、さらに、
動的計画法において音素弁別特徴に基づく音素間距離を用いて音素間の類似性を算出する手段を備えた検索対象を検索する手段であることを特徴とする音声検索装置。
【請求項6】
音声を入力として、前記入力された音声をサンプリングして得られる音声データを検索する音声検索方法であって、
音声データを音素列に変換し、接尾辞配列を作成するステップと、
検索キーワードを受け付け、音素列に変換するステップと、
検索で用いる第1の閾値を設定するステップと、
前記第1の閾値を用いて動的計画法により検索対象を検索するステップと、
前記第1の閾値を逐次的に増加させながら繰り返し検索する閾値調整ステップと、
前記検索のステップにより検索された結果を出力するステップと
を含むことを特徴とする音声検索方法。
【請求項7】
請求項6に記載の音声検索方法であって、さらに、
検索キーワードが所定長さ以上であるとき、該検索キーワードを音素により分割するステップと、
前記検索キーワードの分割ステップによって分割されたキーワードに対する検索に用いる第2の閾値を前記第1の閾値から決定するステップとを備え、
前記検索対象を検索するステップは、前記第2の閾値を用いて動的計画法により検索対象を検索するステップである
ことを特徴とする音声検索方法。
【請求項9】
請求項6または7に記載の音声検索方法であって、さらに、
前記検索キーワードの長さによりキーワード分割の有無を判定するステップと、
前記キーワード分割後の音素数の決定を行うキーワード分割ステップと
を含むことを特徴とする音声検索方法。
【請求項10】
請求項6ないし9のいずれかに記載の音声検索方法であって、
前記検索対象を検索するステップは、前記動的計画法において音素弁別特徴に基づく音素間距離を用いて音素間の類似性を算出するステップを有することを特徴とする音声検索方法。
産業区分
  • 演算制御装置
  • 記憶装置
  • 入出力装置
  • 計算機応用
  • その他情報処理
  • 電子応用機器
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2011501548thum.jpg
出願権利状態 登録
ご興味のある特許について詳しく内容をお知りになりたい方は、下記までお問い合せください。


PAGE TOP

close
close
close
close
close
close
close