TOP > 国内特許検索 > 音源検索装置および音源検索方法

音源検索装置および音源検索方法 コモンズ

国内特許コード P160012909
掲載日 2016年4月18日
出願番号 特願2015-043586
公開番号 特開2016-162411
出願日 平成27年3月5日(2015.3.5)
公開日 平成28年9月5日(2016.9.5)
発明者
  • 高橋 徹
出願人
  • 学校法人大阪産業大学
発明の名称 音源検索装置および音源検索方法 コモンズ
発明の概要 【課題】混合音を検索キーとする音源検索装置において、検索速度を高速化させ、かつ、検索精度を向上させることが可能な音源検索装置を提供する。
【解決手段】この音源検索装置100は、楽曲信号と音声信号とを含む混合音からクロマスペクトルを特徴量として抽出する特徴量抽出手段10と、特徴量の平均値以上の場合に特徴量を1とし、平均値未満の場合に特徴量を0とすることにより、抽出した特徴量を2値化する2値化手段20と、2値化手段20により2値化された混合音の特徴量を検索キーとして、音源データベース50から音源を検索する検索手段30とを備える。
【選択図】図1
従来技術、競合技術の概要


従来、音源検索装置が知られている(たとえば、非特許文献1参照)。



上記非特許文献1には、混合音を検索キーとした音源検索装置が開示されている。この音源検索装置では、混合音から特徴量を抽出するとともに、抽出された特徴量を検索キーとして、音源データベースから音源を検索するように構成されている。ここで、特徴量としては、クロマスペクトルが用いられている。クロマスペクトルは、所定の時間長さを有する混合音(信号)の各分析フレームにおけるフーリエスペクトルを算出した後、各帯域窓の出力エネルギを算出することにより求められる。なお、クロマスペクトルの要素は、スカラー量(たとえば、単精度浮動小数点数、32bit)である。そして、混合音の特徴量ベクトルと、音源データベースの音源の特徴量ベクトルとのパターンマッチング(特徴量ベクトル間のユークリッド距離)により、音源を検索するように構成されている。

産業上の利用分野


本発明は、音源検索装置および音源検索方法に関する。

特許請求の範囲 【請求項1】
楽曲信号と音声信号とを含む混合音から特徴量を抽出する検索装置側特徴量抽出手段と、
前記抽出した特徴量を2値化する検索装置側2値化手段と、
前記検索装置側2値化手段により2値化された前記混合音の前記特徴量を検索キーとして、音源データベースから音源を検索する検索手段とを備え、
前記混合音の前記特徴量は、前記混合音のフーリエスペクトルに基づいて算出される各帯域窓の出力エネルギであるクロマスペクトルであり、
前記混合音の前記特徴量は、所定の時間長さを有する1分析フレーム毎または複数の分析フレーム毎に抽出されており、
前記検索装置側2値化手段は、前記混合音の前記特徴量が、前記1分析フレーム毎または前記複数の分析フレーム毎における特徴量の所定の基準値以上の場合に特徴量を1とし、前記所定の基準値未満の場合に特徴量を0とするように構成されている、音源検索装置。

【請求項2】
前記音源データベースは、
データベース用楽曲信号から特徴量を抽出するデータベース側特徴量抽出手段と、
前記抽出した特徴量を2値化するデータベース側2値化手段と、
前記データベース側2値化手段により2値化された前記データベース用楽曲信号の前記特徴量から前記音源データベースを構築する構築手段とを含み、
前記データベース用楽曲信号の前記特徴量は、前記データベース用楽曲信号のフーリエスペクトルに基づいて算出される各帯域窓の出力エネルギであるクロマスペクトルであり、
前記データベース用楽曲信号の前記特徴量は、前記所定の時間長さを有する前記1分析フレーム毎または前記複数の分析フレーム毎に抽出されており、
前記データベース側2値化手段は、前記データベース用楽曲信号の前記特徴量が、前記1分析フレーム毎または前記複数の分析フレーム毎における特徴量の前記所定の基準値以上の場合に特徴量を1とし、前記所定の基準値未満の場合に特徴量を0とするように構成されている、請求項1に記載の音源検索装置。

【請求項3】
楽曲信号と音声信号とを含む混合音から特徴量を抽出する工程と、
前記抽出した特徴量を2値化する工程と、
2値化された前記混合音の前記特徴量を検索キーとして、音源データベースから音源を検索する工程とを備え、
前記混合音の前記特徴量は、所定の時間長さを有する1分析フレーム毎または複数の分析フレーム毎に抽出されており、
前記楽曲信号と音声信号とを含む混合音から特徴量を抽出する工程は、前記混合音のフーリエスペクトルに基づいて算出される各帯域窓の出力エネルギであるクロマスペクトルを特徴量として抽出する工程を含み、
前記抽出した特徴量を2値化する工程は、前記混合音の前記特徴量が、前記1分析フレーム毎または前記複数の分析フレーム毎における特徴量の所定の基準値以上の場合に特徴量を1とし、前記所定の基準値未満の場合に特徴量を0とする工程を含む、音源検索方法。
国際特許分類(IPC)
画像

※ 画像をクリックすると拡大します。

JP2015043586thum.jpg
出願権利状態 公開
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください。


PAGE TOP

close
close
close
close
close
close
close