TOP > 技術シーズ検索 > 音声検索装置及び音声検索方法

音声検索装置及び音声検索方法

シーズコード S120007754
掲載日 2012年1月5日
研究者
  • 佐藤 寧
技術名称 音声検索装置及び音声検索方法
技術概要 検索対象音声データやクエリー音声データは、入力音声データとして音声符号化器2に入力される。音声符号化器2は入力音声データに対して有声音のピッチ周期を等化し、特徴データに変換する。入力音声データのピッチ周期の情報は特徴データとは分離され、符号化ピッチデータが出力される。特徴データはサブバンド波形として出力され、さらに、音声符号化器2は特徴データを符号化し、符号化特徴データを出力し、また、入力音声データに音素ラベリング処理を行い、各音素の音素ラベル及び時間区間情報からなる音素ラベルデータを出力する。音声記憶手段3は、前記各データに分解され符号化検索対象音声データを記憶する。これらの記憶された符号化特徴データ及び符号化ピッチデータが、符号化検索対象特徴データである。データ読出手段4は、データ選択信号に従って、音声記憶手段3内の検索対象音声データの部分データを読み出す。音声復号器5は、読み出された符号化特徴データ及び符号化ピッチデータを復号し、特徴データ又は出力音声データとして出力する。部分音声検索手段6は、検索対象音声データから、クエリー音声データに一致又は類似する部分データを検索する。
画像

※ 画像をクリックすると拡大します。

thum_2007-529275.gif
研究分野
  • パターン認識
展開可能なシーズ 標準音声パターンを必要とせず、音声の個人差にも影響されず検索精度の高い音声検索装置を提供する。
検索対象音声データ及びクエリー音声データのピッチ周期を等化することにより、音声帯域の男女差や個人差が除去した音声データを用いて、特徴量のマッチングにより音声検索を行うことで、音声帯域の男女差や個人差にほとんど影響されず、音声検索の精度を向上させることができる。また、音素区間ごとにピッチ周期を等化した検索対象音声データ及びクエリー音声データの特徴量を平均化し、その特徴量の平均値の時間列のマッチング検査によって音声検索を行うことで、ノイズや揺らぎの影響が低減されるとともに、音声の伸縮による影響が除去される。その結果、音声検索の精度を向上させることができる。
用途利用分野 音声検索装置、音声データベース、マルチメディア・データベース、ニュース・オンデマンド・システム
出願特許   特許 国際特許分類(IPC)
( 1 ) 国立大学法人九州工業大学, . 佐藤 寧, . 音声検索装置及び音声検索方法. . 2009-02-19
  • G10L  15/00     
  • G10L  15/20     
  • G10L  11/00     

PAGE TOP