TOP > 国内特許検索 > 楽曲からの音情報抽出方法及び装置 > 明細書

明細書 :楽曲からの音情報抽出方法及び装置

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第3697516号 (P3697516)
公開番号 特開2004-118011 (P2004-118011A)
登録日 平成17年7月15日(2005.7.15)
発行日 平成17年9月21日(2005.9.21)
公開日 平成16年4月15日(2004.4.15)
発明の名称または考案の名称 楽曲からの音情報抽出方法及び装置
国際特許分類 G10H  1/00      
FI G10H 1/00 Z
G10H 1/00 102Z
請求項の数または発明の数 12
全頁数 13
出願番号 特願2002-283390 (P2002-283390)
出願日 平成14年9月27日(2002.9.27)
審査請求日 平成14年9月27日(2002.9.27)
特許権者または実用新案権者 【識別番号】301022471
【氏名又は名称】独立行政法人情報通信研究機構
発明者または考案者 【氏名】熊本 忠彦
【氏名】内元 公子
個別代理人の代理人 【識別番号】100130111、【弁理士】、【氏名又は名称】新保 斎
【識別番号】100090893、【弁理士】、【氏名又は名称】渡邊 敏
審査官 【審査官】板橋 通孝
参考文献・文献 特開平05-108062(JP,A)
特開平05-165464(JP,A)
実開昭60-169695(JP,U)
特開昭58-220190(JP,A)
特開2002-099276(JP,A)
調査した分野 G10H 1/00 - 7/12
特許請求の範囲 【請求項1】
少なくともコンピュータ処理が可能な所定のデータ規格に基づく楽曲データから、物理的特徴量である楽曲基本特徴量の時間的推移を調整処理し、そのストリームデータを出力する音情報抽出方法であって、
少なくとも楽曲基本特徴量を時間的推移に従って抽出するステップ、
抽出された楽曲基本特徴量について、所定の条件に基づいて同時に発音している音同士を認定し、いずれかの音の発音開始時刻を調整する同時発音認定処理、及び抽出された楽曲基本特徴量について、所定の条件に基づいて同時に消音している音同士を認定し、いずれかの音の消音時刻を調整する同時消音認定処理をいずれかの順序により行う同時発消音認定ステップ、
抽出された楽曲基本特徴量について、所定の条件に基づいて発音時間帯が重複している音同士について、発音時間帯が重複しないようにいずれかの音の発音時間帯を調整するオーバーラップ切り捨てステップ、
該オーバーラップ切り捨てステップ後の発音時間帯が重複する音同士を和音として認定する和音認定ステップ、
以上の各ステップにおける処理を経た楽曲基本特徴量の時間的推移を示すストリームデータを出力するステップ
の各ステップを含む
ことを特徴とする音情報抽出方法。
【請求項2】
前記同時発消音認定ステップにおいて、
第1音の発音開始時刻から、所定の時間内に発音を開始した第2音を同時に発音している音と認定し、
該第2音の発音開始時刻を、第1音の発音開始時刻と同時刻に変更する
請求項1に記載の音情報抽出方法。
【請求項3】
前記同時発消音認定ステップにおいて、
第1音の消音時刻から、所定の時間内に消音した第2音を同時に消音している音と認定し、
該第1音の消音時刻を、第2音の消音時刻と同時刻に変更する
請求項1又は2に記載の音情報抽出方法。
【請求項4】
前記オーバーラップ切り捨てステップにおいて、
発音時間帯が重複する、所定の時間以上の長さの発音時間である第1音及び第2音において、
第1音及び第2音が重複して発音する重複発音時間が、所定の時間に満たない長さの時に、
該第1音の消音時刻を、該第2音の発音開始時刻と同時刻に変更する
請求項1ないし3に記載の音情報抽出方法。
【請求項5】
前記データ規格が、MIDI(musical instrument digital interface)規格である
請求項1ないし4に記載の音情報抽出方法。
【請求項6】
前記楽曲基本特徴量が、音の高さ、音の強さ、音の長さ、音色情報である
請求項1ないし5に記載の音情報抽出方法。
【請求項7】
少なくともコンピュータ処理が可能な所定のデータ規格に基づく楽曲データから、物理的特徴量である楽曲基本特徴量の時間的推移を調整処理し、そのストリームデータを出力する音情報抽出装置であって、該装置が、
楽曲データを入力する入力手段と、
少なくとも楽曲基本特徴量を時間的推移に従って抽出する楽曲基本特徴量抽出手段と、
抽出された楽曲基本特徴量について、所定の条件に基づいて同時に発音している音同士を認定し、いずれかの音の発音開始時刻を調整する同時発音認定手段と、
抽出された楽曲基本特徴量について、所定の条件に基づいて同時に消音している音同士を認定し、いずれかの音の消音時刻を調整する同時消音認定手段と、
抽出された楽曲基本特徴量について、所定の条件に基づいて発音時間帯が重複している音同士について、発音時間帯が重複しないようにいずれかの音の発音時間帯を調整するオーバーラップ切り捨て手段と、
発音時間帯が重複する音同士を和音として認定する和音認定手段と、
楽曲基本特徴量の時間的推移を示すストリームデータを出力する出力手段と
を備えることを特徴とする音情報抽出装置。
【請求項8】
前記同時発音認定手段において、
第1音の発音開始時刻から、所定の時間内に発音を開始した第2音を同時に発音している音と認定し、
該第2音の発音開始時刻を、第1音の発音開始時刻と同時刻に変更する
請求項7に記載の音情報抽出装置。
【請求項9】
前記同時消音認定手段において、
第1音の消音時刻から、所定の時間内に消音した第2音を同時に消音している音と認定し、
該第1音の消音時刻を、第2音の消音時刻と同時刻に変更する
請求項7又は8に記載の音情報抽出装置。
【請求項10】
前記オーバーラップ切り捨て手段において、
発音時間帯が重複する、所定の時間以上の長さの発音時間である第1音及び第2音において、
第1音及び第2音が重複して発音する重複発音時間が、所定の時間に満たない長さの時に、
該第1音の消音時刻を、該第2音の発音開始時刻と同時刻に変更する
請求項7ないし9に記載の音情報抽出装置。
【請求項11】
前記データ規格が、MIDI(musical instrument digital interface)規格である
請求項7ないし10に記載の音情報抽出装置。
【請求項12】
前記楽曲基本特徴量が、音の高さ、音の強さ、音の長さ、音色情報である
請求項7ないし11に記載の音情報抽出装置。
発明の詳細な説明
【0001】
【発明の属する技術分野】
本発明は、楽曲データの処理に関するものであり、特に楽曲データから音情報を抽出する方法及び装置に関わる。
【0002】
【従来の技術】
コンピュータにおいて処理可能な楽曲データ、特にインターネット上で広く流通している標準MIDIファイル(SMF:Standard MIDI File)形式の楽曲は、音の構成要素である音の高さや強さ、長さ、音色に関する情報を含んだデジタルコンテンツであり、いわゆる内容に基づく検索(content-based retrieval)を可能にしている。
このようなSMFで制御されるパラメータは、音の高さや強さ、発音・消音のタイミング、音色の選択等であり、これらを巧みに操作することによって芸術性の高い演奏を作ることも可能となる。
【0003】
例えば、演奏者自身による楽譜の解釈や演奏者独自のタッチといったものをSMFで表現しようとする場合、楽譜上では同時に発音(または消音)されているような音をSMF上では微妙にずらして発音(消音)させたり、「ド、レ」と連続的に発音されている音同士に重なり(オーバーラップ)を持たせたり、といったことが行われる。しかしながら、このようなずれやオーバーラップは、SMFから何らかの物理的特徴量を抽出し、楽曲検索や楽曲印象の評価等の処理に利用しようとするとき、ノイズとなって、処理の障害となることがあった。
【0004】
【発明が解決しようとする課題】
本発明は上記従来の技術が有する問題に鑑みて創出されたものであって、不要な情報を適切に除去しながら、楽曲データから物理的特徴量を時間的推移に従って取得することのできる音情報の抽出方法及びその装置を提供する。
【0005】
【問題を解決するための手段】
本発明は上記課題の解決を図るため、次のような手段を創出した。
すなわち、少なくともコンピュータ処理が可能な所定のデータ規格に基づく楽曲データから、物理的特徴量である楽曲基本特徴量の時間的推移を調整処理し、そのストリームデータを出力する音情報抽出方法であって、次の各ステップを含むことを特徴とする。
まず、少なくとも楽曲基本特徴量を時間的推移に従って抽出するステップを経て、同時発消音認定ステップに進む。
【0006】
該同時発消音認定ステップでは、抽出された楽曲基本特徴量について、所定の条件に基づいて同時に発音している音同士を認定し、いずれかの音の発音開始時刻を調整する同時発音認定処理、及び抽出された楽曲基本特徴量について、所定の条件に基づいて同時に消音している音同士を認定し、いずれかの音の消音時刻を調整する同時消音認定処理をいずれかの順序により行う。
【0007】
そして、抽出された楽曲基本特徴量について、所定の条件に基づいて発音時間帯が重複している音同士について、発音時間帯が重複しないようにいずれかの音の発音時間帯を調整するオーバーラップ切り捨てステップの処理を行う。
さらに、オーバーラップ切り捨てステップ後の発音時間帯が重複する音同士を和音として認定する和音認定ステップの処理を行う。
以上が本発明で提供する音情報抽出方法である。
【0008】
前記同時発消音認定ステップにおいて、第1音の発音開始時刻から、所定の時間内に発音を開始した第2音を同時に発音している音と認定し、該第2音の発音開始時刻を、第1音の発音開始時刻と同時刻に変更することができる。
【0009】
前記同時発消音認定ステップにおいて、第1音の消音時刻から、所定の時間内に消音した第2音を同時に消音している音と認定し、該第1音の消音時刻を、第2音の消音時刻と同時刻に変更することもできる。
【0010】
前記オーバーラップ切り捨てステップにおいて、発音時間帯が重複する、所定の時間以上の長さの発音時間である第1音及び第2音において、第1音及び第2音が重複して発音する重複発音時間が、所定の時間に満たない長さの時に、該第1音の消音時刻を、該第2音の発音開始時刻と同時刻に変更する構成でもよい。
【0011】
前記データ規格が、MIDI(musical instrument digital interface)規格であってもよい。
【0012】
前記楽曲基本特徴量が、音の高さ、音の強さ、音の長さ、音色情報であってもよい。
【0013】
本発明はさらに次のような音情報抽出装置を提供することもできる。
すなわち、少なくともコンピュータ処理が可能な所定のデータ規格に基づく楽曲データから、物理的特徴量である楽曲基本特徴量の時間的推移を調整処理し、そのストリームデータを出力する音情報抽出装置を提供する。
該装置は、楽曲データを入力する入力手段と、少なくとも楽曲基本特徴量を時間的推移に従って抽出する楽曲基本特徴量抽出手段と共に、同時発音認定手段・同時消音認定手段・オーバーラップ切り捨て手段を備える。
【0014】
そして、同時発音認定手段では、抽出された楽曲基本特徴量について、所定の条件に基づいて同時に発音している音同士を認定し、いずれかの音の発音開始時刻を調整する。
また、同時消音認定手段では、抽出された楽曲基本特徴量について、所定の条件に基づいて同時に消音している音同士を認定し、いずれかの音の消音時刻を調整する。
【0015】
さらに、オーバーラップ切り捨て手段では、抽出された楽曲基本特徴量について、所定の条件に基づいて発音時間帯が重複している音同士について、発音時間帯が重複しないようにいずれかの音の発音時間帯を調整する。
【0016】
その他、発音時間帯が重複する音同士を和音として認定する和音認定手段を備え、各手段による処理結果を、楽曲基本特徴量の時間的推移を示すストリームデータとして出力手段から出力する。
【0017】
前記同時発音認定手段において、第1音の発音開始時刻から、所定の時間内に発音を開始した第2音を同時に発音している音と認定し、該第2音の発音開始時刻を、第1音の発音開始時刻と同時刻に変更する構成でもよい。
【0018】
前記同時消音認定手段において、第1音の消音時刻から、所定の時間内に消音した第2音を同時に消音している音と認定し、該第1音の消音時刻を、第2音の消音時刻と同時刻に変更する構成でもよい。
【0019】
前記オーバーラップ切り捨て手段において、発音時間帯が重複する、所定の時間以上の長さの発音時間である第1音及び第2音において、第1音及び第2音が重複して発音する重複発音時間が、所定の時間に満たない長さの時に、該第1音の消音時刻を、該第2音の発音開始時刻と同時刻に変更する構成でもよい。
【0020】
前記データ規格が、MIDI(musical instrument digital interface)規格であってもよい。
【0021】
前記楽曲基本特徴量が、音の高さ、音の強さ、音の長さ、音色情報でもよい。
【0022】
【発明の実施の形態】
本発明の実施形態を図面に示した実施例に基づいて説明する。なお、実施形態は、本発明の主旨から逸脱しないかぎり適宜変更可能なものである。
図1には本発明による音情報抽出装置(以下、本装置と呼ぶ。)の構成図を示すと共に、図2に該装置における処理のフローチャートを示す。
【0023】
本装置(1)は、主に演算等の処理を司る中核であるCPU(2)と、ユーザーに対して処理内容や結果を示す表示装置であるモニタ(3)、ユーザーが本装置(1)の操作を行うキーボード(4)、及びCPUと連動して作用するメモリ(5)や、データを記憶可能な外部記憶装置(6)から構成される。
このような構成の装置として公知のパーソナルコンピュータがあり、本装置(1)はパーソナルコンピュータ上に実装することが可能である。
【0024】
このような本装置(1)を用い、本発明では標準MIDIファイルを入力して、不要な音情報を含まないストリームデータを出力する。
図2に示すように、標準MIDIファイル(以下、SMFと呼ぶ。)(20)から音の高さ・強さ・長さ、音色に関する楽曲基本特徴量を抽出(21)し、本発明による方法を用いて同時発音の認定(22)、同時消音の認定(23)、オーバーラップ部分の切り捨て(24)、和音の認定(25)を行う。
これらの各処理を経た楽曲基本特徴量の時間的推移であるストリームデータ(26)を出力する。
次に各処理について詳述する。
【0025】
標準MIDIファイル(20)は、本装置(1)に備えた外部記憶手段に楽曲MIDIデータ(7)として記録されている。図1においては別体としているが、同じく外部記憶手段であるハードディスク(6)内に記録してもよいし、ネットワーク接続された別のコンピュータにおける外部記憶手段に記録してもよい。
CPU(2)は楽曲データ入力部(8)の処理によって楽曲MIDIデータ(7)を読み出し、楽曲基本特徴量を抽出する。
【0026】
楽曲データ入力部(8)において、標準MIDIファイル形式(フォーマット0または1)のデータ(7)から各トラックチャンク及び各チャネル毎に楽曲基本特徴量を抽出するストリーム分割機能を有する。楽曲MIDIデータ(7)の場合には、トラックチャンク及びチャネルが並列的に記載されているため、各ストリームを別個に切り分けて抽出し、それぞれを1つのストリームデータとする。
【0027】
例えば、1トラックチャンク・3チャネルの楽曲からは3つのストリームデータが生成される。本実施例において、抽出される楽曲基本特徴量は、音の高さ、音の強さ、音の長さ、音色情報の4種類であり、それぞれノートナンバー値、オンベロシティ値、ノートオンメッセージからノートオフメッセージが到着するまでの時間(ミリ秒)、GM(General MIDI)規格に基づく音色番号に対応している。
【0028】
但し、MIDIには休符という概念がないので、本実施例では各チャネルにおける無音状態を休符と定義し、音の長さ以外の楽曲基本特徴量を記号「s」で表す。
楽曲データ入力部(8)で抽出された楽曲基本特徴量は、時間的推移に従って、ハードディスク(6)に記録される。
【0029】
次に、同時発音の認定処理(22)を、同時発音認定部(9)において行う。該処理(22)の説明図を図3に示す。図中の上段(30)は処理前、下段(31)は処理後の音情報(楽曲基本特徴量)を視覚的に示したものである。
同時発音認定部(9)では、発音時間帯(発音開始時刻から消音時刻まで)に重複(オーバーラップ)のある音同士において、基準音の発音開始時刻からT1ミリ秒以内に発音を開始した音(対象音)はすべて基準音の発音開始時刻に発音を開始したという情報に書き換えを行う。
【0030】
すなわち、図3では、最初に発音された「ド」(33)が基準音となり、その発音開始時刻からT1ミリ秒以内に発音された「レ」(34)が「ド」(33)と同時発音と認定され、その結果「レ」(34)の発音開始時刻(37a)が「ド」の発音開始時刻(37b)に修正されている。一方、基準音(33)の発音開始時刻からT1ミリ秒以内に発音が開始されなかった「ミ」(35)は修正されずに、元の発音開始時刻(38)のままである。
なお、基準音は発音開始時刻の順序に従って選ばれるが、対象音として処理された音(34)は新たに基準音としては選ばれない。
【0031】
同時発音の認定処理(22)と前後関係は本発明において問わないが、本実施例では、次に同時消音の認定処理(23)を同時消音認定部(10)において行う。
該処理(23)の説明図を図4に示す。図中の上段(40)は処理前、下段(41)は処理後の音情報(楽曲基本特徴量)を視覚的に示したものである。
同時消音認定部(10)では、発音時間帯(発音開始時刻から消音時刻まで)に重複(オーバーラップ)のある音同士において、基準音の消音時刻からT2ミリ秒以内に消音した音(対象音)はすべて対象音の消音時刻に発音したという情報に書き換えを行う。
【0032】
すなわち、図4では、最初に消音した「ド」(42)が基準音となり、その消音時刻からT2ミリ秒(45)以内に消音した「レ」(43)が「ド」(42)と同時消音と認定され、その結果「ド」(42)の消音時刻(46a)が「レ」(43)の消音時刻(46b)に修正されている。一方、基準音(42)の消音時刻からT2ミリ秒以内に消音しなかった「ミ」(44)は修正されずに、元の消音時刻(47)のままである。
なお、基準音は消音時刻の順序に従って選ばれるが、対象音として処理された音(43)は新たな基準音として選ばれない。
【0033】
同時発音の認定処理(22)及び同時消音の認定処理(23)を行った音情報(楽曲基本特徴量)は、ハードディスク(6)に記録されると共に、オーバーラップ切り捨て部(11)がハードディスク(6)を参照しながら、次のオーバーラップ部分の切り捨て処理(24)を行う。
該処理(24)の説明図を図5に示す。図中の上段(50)は処理前、下段(51)は処理後の音情報(楽曲基本特徴量)を視覚的に示したものである。
【0034】
オーバーラップ切り捨て部(11)では、発音時間の長さがT3ミリ秒以上の音同士で、重複時間(オーバーラップ時間)がT4ミリ秒未満の場合、先に消音した音のオーバーラップ部分を切り捨てる。
【0035】
すなわち、図5において、「ド」(52)と「レ」(53)のオーバーラップ時間(55)がT4ミリ秒未満であったので、先に消音した「ド」(52)の消音時刻(56a)を「レ」(53)の発音開始時刻と同時刻(56b)に修正し、オーバーラップ部分(55)を削除する。
その一方で「レ」(53)と「ミ」(54)のオーバーラップ時間(57)はT4ミリ秒以上であったので、削除されていない。
【0036】
本発明では、以上の各処理により、抽出された楽曲基本特徴量のうち、オーバーラップ部分を除去し、処理しやすく調整された楽曲基本特徴量の時間推移を出力することができる。
また、以上の処理を経てもなおオーバーラップする音同士について、和音認定部(12)において和音の認定処理(25)を行う。
【0037】
オーバーラップのある音同士は、そのオーバーラップ部分を和音(同時に発音している2つ以上の音を和音と呼ぶ)として扱う。例えば、図5では、前段の「オーバーラップ部分の切り捨て処理」(24)において削除されなかった「レ」(53)と「ミ」(54)のオーバーラップ部分(57)が1つの和音「レミ」(58)として和音認定される。
【0038】
ここで、楽曲基本特徴量の抽出例として、ある楽曲から抽出されたストリームデータの例を図6に示す。図6の(a)は、本発明によるに音情報抽出方法を用いた場合(以下これを「時間的推移の平滑化」と呼ぶ。)の抽出結果である。
この時、上記時間パラメータの値は、T1=T2=T3=T4=30とした。
図6の(b)は、平滑化を行わなかった場合(又は、本発明の音情報抽出方法において、上記時間パラメータの値T1=T2=T3=T4=0とした場合と同じ。)の抽出結果である。
【0039】
各行の第1列(60)が音の長さ(ミリ秒)、第2列(61)が音の高さ(ノートナンバー値。但し、無音の場合は「s」)、第3列(62)が音の強さ(オンベロシティ値。但し、無音の場合は「s」)、第4列(63)が音色(GM規格に基づく音色番号。但し、無音の場合は「s」)に対応している。
なお、第5列以降(64)(65)(66)には和音認定部(12)で認定された和音の2音目以降の楽曲基本特徴量(音の長さを除く)が繰り返し記述されている。
【0040】
図6の(a)と(b)を比べてみると、(b)に現れている28ミリ秒のオーバーラップ部分(67)の第2音(音の長さ28、音の高さ93、音の強さ111、音色0)(68)と、20ミリ秒のオーバーラップ部分(69)の第2音(音の長さ20、音の高さ91、音の強さ89、音色0)が(a)では削除されていることがわかる。
【0041】
以上の各処理(21)(22)(23)(24)(25)を経た楽曲基本特徴量の時間的推移を示す情報であるストリームデータ(26)は、ストリームデータ出力部(13)から出力される。出力された結果は、ハードディスク(6)に記録される。
【0042】
本発明による音情報抽出装置(1)の一例として、モニタ(3)に表示するメイン画面を図7に示す。このメイン画面(80)において、「ファイル選択」ボタン(81)・「フォルダ選択」ボタン(82)を押すことにより楽曲基本特徴量の抽出対象となる楽曲をファイル単位・フォルダ単位で選択することができ、「実行」ボタン(83)を押すことにより選択された楽曲から楽曲基本特徴量の時間的推移(ストリームデータ)が抽出される。
抽出結果は、ハードディスク(6)上の所定のフォルダの中に置かれる。
【0043】
また、ユーザは各処理部(9)(10)(11)で用いられる4つのパラメータ(T1、T2、T3、T4)を任意に設定することができる。すなわち、メイン画面(80)に表示されている「発音開始時刻の許容誤差」(84)、「消音時刻の許容誤差」(85)、「オーバーラップ処理対象音の音長」(86)、「切り捨てられる同時発音部分の音長」(87)が、それぞれT1、T2、T3、T4に対応しており、0以上の整数値を入力することが可能である。
【0044】
なお、1つのSMFから各トラックチャンク各チャネル毎にストリームデータが生成され、それぞれが1つのファイルとしてテキスト形式で保存される。例えば、1トラックチャンク3チャネルからなる「abc.mid」という名前のSMFからは、「abc-001.txt」、「abc-002.txt」、「abc-003.txt」という3つのファイルが作成される。
この場合は、3桁の数字がSMFの名前に付加されているが、下2桁の数字がチャネル番号(1から16の整数)を表し、残りの百の位以上の数字がトラック番号(0以上の整数)を表している。
【0045】
最後に、本発明による音情報抽出方法が、いかなる効果を奏するかを評価するため、インターネット上で公開されているクラシック系の楽曲80曲(SMF形式)を対象に、平滑化を行う場合(抽出パラメータをT1=T2=T3=T4=30とする。)と平滑化を行わない場合(T1=T2=T3=T4=0とする。)とで、各楽曲から抽出される音の数(図6では行数に相当する)がどのように変化するかを調べた。その結果を表1にまとめる。但し、変化率rは、
(数式1)
r=(平滑化無しの場合の音の数-平滑化ありの場合の音の数)/平滑化無しの場合の音の数
と定義している。
【0046】
【表1】
JP0003697516B2_000002t.gif
【0047】
表1から、全体の3割の楽曲において平滑化の効果が観測され、楽曲によっては平滑化の対象となるような音が20%近くを占めていることがわかる。
次に、本ツールの処理能力を調べるために、処理対象となった楽曲の総データ量(KB)と処理時間(秒)との関係を回帰分析(直線近似)で調べた。結果を図8に示す。白丸と破線(90)が平滑化なしの場合の計測値と回帰式であり、黒菱形と実線(91)が平滑化ありの場合の計測値と回帰式である。
【0048】
図8の回帰式は、本ツールの処理速度が平滑化なしの場合で楽曲1MBあたり約16.8秒、平滑化ありの場合で楽曲1MBあたり約25.2秒であることを示しており、十分実用的な処理が行えることを示している。
【0049】
【発明の効果】
本発明は上記の構成を備えるので、次の効果を奏する。
本発明によれば、標準MIDI(SMF)データなど、コンピュータで処理可能な楽曲データから楽曲基本特徴量を抽出する際に、SMFに含まれるノイズを効果的に削除することができる。
すなわち、楽譜上では同時に発音(または消音)されているような音をSMF上では微妙にずらして発音(消音)させたり、「ド、レ」と連続的に発音されている音同士に重なり(オーバーラップ)を持たせたり、といったことが行われたデータであっても、音のずれやオーバーラップ部分を削除し、楽曲検索や楽曲印象の評価等の処理に利用する場合に不要な音情報が混入されてしまうのを防止できる。
また、音情報のデータ量を削減することができるので、処理の高速化に寄与する音情報を抽出できる。
【図面の簡単な説明】
【図1】 本発明による音情報抽出装置の一実施例の構成図である。
【図2】 本発明における一実施例の処理のフローチャートである。
【図3】 同時発音認定部における処理の説明図である。
【図4】 同時消音認定部における処理の説明図である。
【図5】 オーバーラップ切り捨て部及び和音認定部における処理の説明図である。
【図6】 本発明に係るストリームデータの一例である。
【図7】 本発明による音情報抽出装置のメイン画面の一例である。
【図8】 本発明による平滑化の効果を示すグラフである。
【符号の説明】
1 音情報抽出装置
2 CPU
3 モニタ
4 キーボード
5 メモリ
6 外部記憶手段(ハードディスク)
7 楽曲MIDIデータ
8 楽曲データ入力部
9 同時発音認定部
10 同時消音認定部
11 オーバーラップ切り捨て部
12 和音認定部
13 ストリームデータ出力部
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7