Top > Search of Japanese Patents > SOUND SOURCE SEARCH DEVICE AND SOUND SOURCE SEARCH METHOD

SOUND SOURCE SEARCH DEVICE AND SOUND SOURCE SEARCH METHOD meetings

Patent code P160012909
Posted date Apr 18, 2016
Application number P2015-043586
Publication number P2016-162411A
Patent number P6588212
Date of filing Mar 5, 2015
Date of publication of application Sep 5, 2016
Date of registration Sep 20, 2019
Inventor
  • (In Japanese)高橋 徹
Applicant
  • OSAKA SANGYO UNIVERSITY
Title SOUND SOURCE SEARCH DEVICE AND SOUND SOURCE SEARCH METHOD meetings
Abstract PROBLEM TO BE SOLVED: To provide a sound source search device that uses mixed sound as a search key and offers high search speed and improved search accuracy.
SOLUTION: A sound source search device 100 includes: characteristic quantity extraction means 10 that extracts a chroma spectrum from mixed sound comprising a music signal and a voice signal as a characteristic quantity; binarization means 20 that binarizes the extracted characteristic quantity by defining characteristic quantity values no less than an average value as "1" and characteristic quantity values less than the average value as "0"; and search means 30 that searches for a sound source in a sound source database 50 using the characteristic quantity of the mixed sound binarized by the binarization means 20 as a search key.
Outline of related art and contending technology (In Japanese)

従来、音源検索装置が知られている(たとえば、非特許文献1参照)。

上記非特許文献1には、混合音を検索キーとした音源検索装置が開示されている。この音源検索装置では、混合音から特徴量を抽出するとともに、抽出された特徴量を検索キーとして、音源データベースから音源を検索するように構成されている。ここで、特徴量としては、クロマスペクトルが用いられている。クロマスペクトルは、所定の時間長さを有する混合音(信号)の各分析フレームにおけるフーリエスペクトルを算出した後、各帯域窓の出力エネルギを算出することにより求められる。なお、クロマスペクトルの要素は、スカラー量(たとえば、単精度浮動小数点数、32bit)である。そして、混合音の特徴量ベクトルと、音源データベースの音源の特徴量ベクトルとのパターンマッチング(特徴量ベクトル間のユークリッド距離)により、音源を検索するように構成されている。

Field of industrial application (In Japanese)

本発明は、音源検索装置および音源検索方法に関する。

Scope of claims (In Japanese)
【請求項1】
 
楽曲信号と音声信号とを含む混合音から特徴量を抽出する検索装置側特徴量抽出手段と、
前記抽出した特徴量を2値化する検索装置側2値化手段と、
前記検索装置側2値化手段により2値化された前記混合音の前記特徴量を検索キーとして、音源データベースから音源を検索する検索手段とを備え、
前記混合音の前記特徴量は、前記混合音のフーリエスペクトルに基づいて算出される各帯域窓の出力エネルギであるクロマスペクトルであり、
前記混合音の前記特徴量は、所定の時間長さを有する1分析フレーム毎または複数の分析フレーム毎に抽出されており、
前記検索装置側2値化手段は、前記混合音の前記特徴量が、前記1分析フレーム毎または前記複数の分析フレーム毎における特徴量のクロマスペクトルに基づいた所定の基準値以上の場合に特徴量を1とし、前記所定の基準値未満の場合に特徴量を0とするように構成されている、音源検索装置。

【請求項2】
 
前記音源データベースは、
データベース用楽曲信号から特徴量を抽出するデータベース側特徴量抽出手段と、
前記抽出した特徴量を2値化するデータベース側2値化手段と、
前記データベース側2値化手段により2値化された前記データベース用楽曲信号の前記特徴量から前記音源データベースを構築する構築手段とを含み、
前記データベース用楽曲信号の前記特徴量は、前記データベース用楽曲信号のフーリエスペクトルに基づいて算出される各帯域窓の出力エネルギであるクロマスペクトルであり、
前記データベース用楽曲信号の前記特徴量は、前記所定の時間長さを有する前記1分析フレーム毎または前記複数の分析フレーム毎に抽出されており、
前記データベース側2値化手段は、前記データベース用楽曲信号の前記特徴量が、前記1分析フレーム毎または前記複数の分析フレーム毎における特徴量の前記所定の基準値以上の場合に特徴量を1とし、前記所定の基準値未満の場合に特徴量を0とするように構成されている、請求項1に記載の音源検索装置。

【請求項3】
 
楽曲信号と音声信号とを含む混合音から特徴量を抽出する工程と、
前記抽出した特徴量を2値化する工程と、
2値化された前記混合音の前記特徴量を検索キーとして、音源データベースから音源を検索する工程とを備え、
前記混合音の前記特徴量は、所定の時間長さを有する1分析フレーム毎または複数の分析フレーム毎に抽出されており、
前記楽曲信号と音声信号とを含む混合音から特徴量を抽出する工程は、前記混合音のフーリエスペクトルに基づいて算出される各帯域窓の出力エネルギであるクロマスペクトルを特徴量として抽出する工程を含み、
前記抽出した特徴量を2値化する工程は、前記混合音の前記特徴量が、前記1分析フレーム毎または前記複数の分析フレーム毎における特徴量のクロマスペクトルに基づいた所定の基準値以上の場合に特徴量を1とし、前記所定の基準値未満の場合に特徴量を0とする工程を含む、音源検索方法。
IPC(International Patent Classification)
Drawing

※Click image to enlarge.

JP2015043586thum.jpg
State of application right Registered
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close