TOP > 国内特許検索 > 電子透かし検出装置及び電子透かし検出方法 > 明細書

明細書 :電子透かし検出装置及び電子透かし検出方法

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第5879075号 (P5879075)
公開番号 特開2013-057825 (P2013-057825A)
登録日 平成28年2月5日(2016.2.5)
発行日 平成28年3月8日(2016.3.8)
公開日 平成25年3月28日(2013.3.28)
発明の名称または考案の名称 電子透かし検出装置及び電子透かし検出方法
国際特許分類 G10L  19/018       (2013.01)
FI G10L 19/018
請求項の数または発明の数 10
全頁数 22
出願番号 特願2011-196449 (P2011-196449)
出願日 平成23年9月8日(2011.9.8)
新規性喪失の例外の表示 特許法第30条第2項適用 一般社団法人情報処理学会、社団法人電子情報通信学会の発行によるDVD「第10回情報科学技術フォーラム 講演論文集」が平成23年8月22日に配布され、当該DVDに記録された情報のうち、第3分冊第89ページより第96ページに掲載されていた講演論文「蝸牛遅延に基づいた電子音響透かし法とそのブラインド検出の実現」が公開された。
審査請求日 平成26年8月29日(2014.8.29)
特許権者または実用新案権者 【識別番号】304024430
【氏名又は名称】国立大学法人北陸先端科学技術大学院大学
発明者または考案者 【氏名】鵜木 祐史
【氏名】宮内 良太
個別代理人の代理人 【識別番号】100125645、【弁理士】、【氏名又は名称】是枝 洋介
審査官 【審査官】五貫 昭一
参考文献・文献 特開2009-210828(JP,A)
調査した分野 G10L 19/018
特許請求の範囲 【請求項1】
蝸牛遅延特性を模擬する蝸牛遅延フィルタを用いて、デジタルデータである音響信号に位相変調を施し、前記位相変調が施された音響信号に電子透かしデータを埋め込む電子透かしデータ埋め込み装置によって、デジタルデータである音響信号に電子透かしデータが埋め込まれた場合に、前記電子透かしデータの埋め込みの際に用いられた蝸牛遅延フィルタの個数と当該蝸牛遅延フィルタのフィルタ係数とに基づいて、前記蝸牛遅延フィルタが模擬する蝸牛遅延特性を推定する蝸牛遅延特性推定手段と、
前記蝸牛遅延特性推定手段により推定された蝸牛遅延特性に基づいて、音響信号に埋め込まれた前記電子透かしデータを検出する電子透かし検出手段と
を備える、電子透かし検出装置。
【請求項2】
前記電子透かしデータ埋め込み装置が、複数の異なる蝸牛遅延フィルタを用いて音響信号に位相変調を施すことにより、複数の異なる位相変調された音響信号を生成し、電子透かしデータに応じて、前記複数の異なる位相変調された音響信号の中から一の音響信号を選択し、選択した音響信号同士を接合することにより、電子透かしデータを埋め込むように構成されており、
前記蝸牛遅延特性推定手段が、前記複数の異なる蝸牛遅延フィルタがそれぞれ模擬する複数の異なる蝸牛遅延特性を推定するように構成され、
前記電子透かし検出手段が、前記蝸牛遅延特性推定手段により推定された前記複数の異なる蝸牛遅延特性に基づいて、電子透かしデータが埋め込まれた音響信号が、前記複数の異なる蝸牛遅延フィルタのうちの何れの蝸牛遅延フィルタが適用されて位相変調が施されたかを判定することにより、電子透かしデータを検出するように構成されている、
請求項1に記載の電子透かし検出装置。
【請求項3】
前記蝸牛遅延特性推定手段が、前記蝸牛遅延フィルタの零点を推定することにより、蝸牛遅延特性を推定するように構成されている、
請求項1又は2に記載の電子透かし検出装置。
【請求項4】
前記蝸牛遅延特性推定手段が、チャープz変換を用いて、前記蝸牛遅延フィルタの零点を推定するように構成されている、
請求項3に記載の電子透かし検出装置。
【請求項5】
前記蝸牛遅延特性推定手段により推定された蝸牛遅延特性の逆特性を有するフィルタを電子透かしデータが埋め込まれた音響信号に施すことにより、電子透かしデータが埋め込まれる前の音響信号を取得する原信号取得手段をさらに備える、
請求項4に記載の電子透かし検出装置。
【請求項6】
電子透かしデータが埋め込まれた音響信号の位相変調に適用されたと前記電子透かし検出手段により判定された蝸牛遅延フィルタの逆フィルタを当該音響信号に施すことにより、電子透かしデータが埋め込まれる前の音響信号を取得する原信号取得手段をさらに備える、
請求項2に記載の電子透かし検出装置。
【請求項7】
蝸牛遅延特性を模擬する蝸牛遅延フィルタを用いて、デジタルデータである音響信号に位相変調を施し、前記位相変調が施された音響信号に電子透かしデータを埋め込む電子透かしデータ埋め込み装置によって、デジタルデータである音響信号に電子透かしデータが埋め込まれた場合に、前記電子透かしデータの埋め込みの際に用いられた蝸牛遅延フィルタの個数と当該蝸牛遅延フィルタのフィルタ係数とに基づいて、前記蝸牛遅延フィルタが模擬する蝸牛遅延特性を推定するステップ(a)と、
推定された蝸牛遅延特性に基づいて、音響信号に埋め込まれた前記電子透かしデータを検出するステップ(b)と
を有する、電子透かし検出方法。
【請求項8】
前記電子透かしデータ埋め込み装置が、複数の異なる蝸牛遅延フィルタを用いて音響信号に位相変調を施すことにより、複数の異なる位相変調された音響信号を生成し、電子透かしデータに応じて、前記複数の異なる位相変調された音響信号の中から一の音響信号を選択し、選択した音響信号同士を接合することにより、電子透かしデータを埋め込むように構成されており、
前記ステップ(a)において、前記複数の異なる蝸牛遅延フィルタがそれぞれ模擬する複数の異なる蝸牛遅延特性を推定し、
前記ステップ(b)において、前記ステップ(a)により推定された前記複数の異なる蝸牛遅延特性に基づいて、電子透かしデータが埋め込まれた音響信号が、前記複数の異なる蝸牛遅延フィルタのうちの何れの蝸牛遅延フィルタが適用されて位相変調が施されたかを判定することにより、電子透かしデータを検出する、
請求項7に記載の電子透かし検出方法。
【請求項9】
前記ステップ(a)において、前記蝸牛遅延フィルタの零点を推定することにより、蝸牛遅延特性を推定する、
請求項8に記載の電子透かし検出方法。
【請求項10】
前記ステップ(a)においてチャープz変換を用いて、前記蝸牛遅延フィルタの零点を推定する、
請求項9に記載の電子透かし検出方法。
発明の詳細な説明 【技術分野】
【0001】
本発明は、デジタルデータである音響信号(音声、音楽など)に埋め込まれた電子透かしデータを検出する電子透かし検出装置及び電子透かし検出方法に関する。
【背景技術】
【0002】
近年では、インターネット等の通信ネットワークの普及に伴い、デジタル音楽コンテンツの配信サービス等が提供されるようになっている。しかしながら、デジタル音楽コンテンツの場合、音質をほとんど劣化することなく複製することが可能であるため、違法コピーが横行し、社会問題となっている。そこで、デジタル音楽コンテンツの著作権を保護するための技術として、著作権情報またはシリアルナンバー等の付加情報(電子透かしデータ)を音響信号に埋め込むことにより、違法コピー等の防止及び追跡等を図ることができる電子音響透かし技術が注目されている。
【0003】
電子音響透かし技術としては、例えば、(1)LSB(Least Significant Bit replacement)法(非特許文献1を参照)のように符号化/量子化レベルで透かしを埋め込む方法、(2)DSS(Direct Spread Spectrum)法(非特許文献2)のように原信号の広範なスペクトルに情報を埋め込む方法がある。また、位相に係わる知覚特性に基づく方法として、(3)エコーハイディング法(以下「ECHO法」、非特許文献3を参照)、(4)周期的位相変調(PPM:Periodical Phase Modulation)法(非特許文献4及び特許文献1を参照)等が提案されている。
【0004】
ところで、人間の聴覚が備える特性の一つに、蝸牛遅延(Cochlear Delay:CD)特性と呼ばれるものがある。音信号が蝸牛内(前庭階及び鼓室階にある非圧縮性のリンパ液内)を伝搬するとき、それらの二つの階の間の圧力差によって生じる蝸牛の基底膜の振動(伝播)には、信号の周波数に依存して、多少の時間差がみられる。この現象が蝸牛遅延であり、音信号の周波数が低いほど遅延が長くなることが知られている。
【0005】
非特許文献5においては、上記の蝸牛遅延と音の同時性判断との間にどのような関係があるのかが検討されている。具体的には、(a)通常(蝸牛遅延操作なし)の調波複合音、(b)蝸牛の基底膜上において蝸牛遅延を打ち消すような群遅延を与えた調波複合音、(c)蝸牛遅延を増長するような群遅延を与えた調波複合音の三つの複合音を用いて聴覚心理物理実験を行い、その実験結果に基づいて、蝸牛遅延が音の同時性判断にどのような影響を与えるのかが検討されている。この非特許文献5では、複合音(b)よりも、複合音(c)を用いた場合の方が、複合音(a)と同等の同時性判断を示すことが明らかにされている。
【0006】
上記の蝸牛遅延特性に着目し、電子透かしとして埋め込む情報の2値データに対応する二種類の異なる蝸牛遅延に似た遅延パターンを原信号に付与することにより、電子音響透かしを実現する方法(以下、「CD法」という)が非特許文献6及び7で提案されている。
【先行技術文献】
【0007】

【特許文献1】特許第3627022号
【0008】

【非特許文献1】N. Cvejic and T. Seppanen, “Digital audio watermarking techniques and technologies,” IGI Global, 2007
【非特許文献2】Boney, L., Tewfik, H. H., and Hamdy, K. N., “Digital watermarks for audio signals,” Proc. ICMCS, 473-480, 1996
【非特許文献3】Daniel Gruhl, Anthony Lu Walter Bender, “Echo Hiding,”Proc. Information Hiding 1st Workshop, pp.295-315, Cambridge Univ., 1996
【非特許文献4】西村竜一、鈴木陽一、「周期的位相変調に基づく音響電子透かし」、日本音響学会誌、vol.60、no.5、pp.269-272、2004
【非特許文献5】E. Aiba, S. Tanaka, M. Tsuzaki, and M. Unoki, “Judgment of perceptual synchrony between two pulses and its relation to the cochlear delays,” Proc. Fechner day 2007, 211-214, 2007
【非特許文献6】Unoki, M. and Hamada, D. “Audio watermarking method based on the cochlear delay characteristics,”Proc. IIHMSP2008, 616-619, 2008
【非特許文献7】Unoki, M. and Hamada, D. “Method of digital-audio watermarking based on cochlear delay characteristics,”Int. J. Innv. Comp., Inf. Cont., 6(3(B)), 1325-1346, 2010
【発明の概要】
【発明が解決しようとする課題】
【0009】
一般に、電子音響透かし技術では、知覚不可能性(埋め込み情報が利用者に知覚されず、埋め込みによる原信号の知覚可能な歪みが生じないこと)、頑健性(通常の信号変換処理及び埋め込み情報を削除するといった悪意のある攻撃に対して影響を受けないこと)、及び秘匿性(情報が埋め込まれていることに気付かせないこと、気付かれてもその情報を容易に検出されないこと)が要求されている。
【0010】
上記(1)のLSB法は、振幅情報に大きく影響を与えない下位ビットに情報を埋め込むため、知覚不可能性を満たすが、ビット変化に敏感なため頑健性に問題がある。また、上記(2)のDSS法の場合、スペクトル全体に情報を埋め込むため、信号変形処理には頑健であるが、埋め込まれた情報を容易に知覚できるため知覚不可能性に問題がある。
【0011】
上記(3)のECHO法は、エコー時間及び1次反射音の振幅を調整することで歪みがなく、知覚不可能な埋め込みを実現できるが、自己相関法及びケプストラム処理を利用することで透かし情報を容易に検出・除去できるため、上記の従来の方法の中でもっとも頑健性・秘匿性に欠ける。また、上記(4)のPPM法は、周期的な位相変調が比較的知覚され難いという聴覚特性に基づいているが、位相変調が高い周波数成分の位相スペクトルをランダムに歪ませるため、知覚不可能性に問題がある。
【0012】
他方、上記のCD法の場合、知覚不可能性、秘匿性、及び頑健性を十分に満足するものの、埋め込まれた情報を検出するために原信号を参照することが必要となるため、応用範囲が限定されるという問題がある。
【0013】
本発明は斯かる事情に鑑みてなされたものであり、その主たる目的は、CD法により埋め込まれた情報を、原信号を参照することなく検出することができる電子透かし検出装置及び電子透かし検出方法を提供することにある。
【課題を解決するための手段】
【0014】
上述した課題を解決するために、本発明の一の態様の電子透かし検出装置は、蝸牛遅延特性を模擬する蝸牛遅延フィルタを用いて、デジタルデータである音響信号に位相変調を施し、前記位相変調が施された音響信号に電子透かしデータを埋め込む電子透かしデータ埋め込み装置によって、デジタルデータである音響信号に電子透かしデータが埋め込まれた場合に、前記電子透かしデータの埋め込みの際に用いられた蝸牛遅延フィルタの個数と当該蝸牛遅延フィルタのフィルタ係数とに基づいて、前記蝸牛遅延フィルタが模擬する蝸牛遅延特性を推定する蝸牛遅延特性推定手段と、 前記蝸牛遅延特性推定手段により推定された蝸牛遅延特性に基づいて、音響信号に埋め込まれた前記電子透かしデータを検出する電子透かし検出手段とを備える。
【0015】
この態様において、前記電子透かしデータ埋め込み装置が、複数の異なる蝸牛遅延フィルタを用いて音響信号に位相変調を施すことにより、複数の異なる位相変調された音響信号を生成し、電子透かしデータに応じて、前記複数の異なる位相変調された音響信号の中から一の音響信号を選択し、選択した音響信号同士を接合することにより、電子透かしデータを埋め込むように構成されており、前記蝸牛遅延特性推定手段が、前記複数の異なる蝸牛遅延フィルタがそれぞれ模擬する複数の異なる蝸牛遅延特性を推定するように構成され、前記電子透かし検出手段が、前記蝸牛遅延特性推定手段により推定された前記複数の異なる蝸牛遅延特性に基づいて、電子透かしデータが埋め込まれた音響信号が、前記複数の異なる蝸牛遅延フィルタのうちの何れの蝸牛遅延フィルタが適用されて位相変調が施されたかを判定することにより、電子透かしデータを検出するように構成されていてもよい。
【0016】
また、前記態様において、前記蝸牛遅延特性推定手段が、前記蝸牛遅延フィルタの零点を推定することにより、蝸牛遅延特性を推定するように構成されていてもよい。
【0017】
また、前記態様において、前記蝸牛遅延特性推定手段が、チャープz変換を用いて、前記蝸牛遅延フィルタの零点を推定するように構成されていてもよい。
【0018】
また、前記態様において、前記蝸牛遅延特性推定手段により推定された蝸牛遅延特性の逆特性を有するフィルタを電子透かしデータが埋め込まれた音響信号に施すことにより、電子透かしデータが埋め込まれる前の音響信号を取得する原信号取得手段をさらに備えていてもよい。
【0019】
また、前記態様において、電子透かしデータが埋め込まれた音響信号の位相変調に適用されたと前記電子透かし検出手段により判定された蝸牛遅延フィルタの逆フィルタを当該音響信号に施すことにより、電子透かしデータが埋め込まれる前の音響信号を取得する原信号取得手段をさらに備えていてもよい。
【0020】
本発明の一の態様の電子透かし検出方法は、蝸牛遅延特性を模擬する蝸牛遅延フィルタを用いて、デジタルデータである音響信号に位相変調を施し、前記位相変調が施された音響信号に電子透かしデータを埋め込む電子透かしデータ埋め込み装置によって、デジタルデータである音響信号に電子透かしデータが埋め込まれた場合に、前記電子透かしデータの埋め込みの際に用いられた蝸牛遅延フィルタの個数と当該蝸牛遅延フィルタのフィルタ係数とに基づいて、前記蝸牛遅延フィルタが模擬する蝸牛遅延特性を推定するステップ(a)と、推定された蝸牛遅延特性に基づいて、音響信号に埋め込まれた前記電子透かしデータを検出するステップ(b)とを有する。
【0021】
この態様において、前記電子透かしデータ埋め込み装置が、複数の異なる蝸牛遅延フィルタを用いて音響信号に位相変調を施すことにより、複数の異なる位相変調された音響信号を生成し、電子透かしデータに応じて、前記複数の異なる位相変調された音響信号の中から一の音響信号を選択し、選択した音響信号同士を接合することにより、電子透かしデータを埋め込むように構成されており、前記ステップ(a)において、前記複数の異なる蝸牛遅延フィルタがそれぞれ模擬する複数の異なる蝸牛遅延特性を推定し、前記ステップ(b)において、前記ステップ(a)により推定された前記複数の異なる蝸牛遅延特性に基づいて、電子透かしデータが埋め込まれた音響信号が、前記複数の異なる蝸牛遅延フィルタのうちの何れの蝸牛遅延フィルタが適用されて位相変調が施されたかを判定することにより、電子透かしデータを検出するようにしてもよい。
【0022】
また、前記態様において、前記ステップ(a)において、前記蝸牛遅延フィルタの零点を推定することにより、蝸牛遅延特性を推定するようにしてもよい。
【0023】
また、前記態様において、前記ステップ(a)においてチャープz変換を用いて、前記蝸牛遅延フィルタの零点を推定するようにしてもよい。
【発明の効果】
【0024】
本発明に係る電子透かし検出装置及び電子透かし検出方法によれば、原信号を参照することなく、CD法により埋め込まれた電子透かしデータを検出することができる。
【図面の簡単な説明】
【0025】
【図1】本発明の実施の形態に係る電子透かし埋込装置の構成を示すブロック図。
【図2】本発明の実施の形態に係る電子透かし埋込装置の構成を示す機能ブロック図。
【図3】本発明の実施の形態における電子透かし埋込装置が備える蝸牛遅延フィルタの特性を示すグラフ。
【図4】本発明の実施の形態に係る電子透かし検出装置の構成を示すブロック図。
【図5】本発明の実施の形態に係る電子透かし検出装置の構成を示す機能ブロック図。
【図6】蝸牛遅延フィルタの極及び零点を説明するためのグラフ。
【図7】チャープz変換による周波数分析の結果を示すグラフ。
【図8】本発明の実施の形態における電子透かし埋込装置が実行する電子透かし埋込処理の手順を示すフローチャート。
【図9】本発明の実施の形態における電子透かし検出装置が実行する電子透かし検出処理の手順を示すフローチャート。
【図10】客観評価実験の結果を示すグラフ。
【図11】本発明の実施の形態における電子透かし検出装置が実行する原信号取得処理の手順を示すフローチャート。
【図12】透かし入り音響信号についての客観評価実験の結果を示すグラフ。
【図13】本発明の実施の形態の原信号取得処理により電子透かしデータを削除する前及び削除した後における客観評価実験の結果を示すグラフ。
【発明を実施するための形態】
【0026】
以下、本発明の好ましい実施の形態を、図面を参照しながら説明する。なお、以下に示す各実施の形態は、本発明の技術的思想を具体化するための方法及び装置を例示するものであって、本発明の技術的思想は下記のものに限定されるわけではない。本発明の技術的思想は、特許請求の範囲に記載された技術的範囲内において種々の変更を加えることができる。

【0027】
本実施の形態に係る電子透かし検出装置は、原信号に埋め込まれた電子透かしデータをその原信号を参照することなく検出することができる装置である。このように原信号を参照することなく電子透かしデータを検出することを、本明細書では「ブラインド検出」と称する。以下、この電子透かし検出装置と、電子透かしデータを埋め込む電子透かし埋込装置について説明する。

【0028】
[電子透かし埋込装置の構成]
図1は、本発明の実施の形態に係る電子透かし埋込装置の構成を示すブロック図である。図1に示すように、電子透かし埋込装置1は、CPU11、ROM12、RAM13、信号入力部14、信号出力部15及びハードディスク16を備えており、これらのCPU11、ROM12、RAM13、信号入力部14、信号出力部15及びハードディスク16は、バス17によって接続されている。

【0029】
CPU11は、ROM12及びハードディスク16に記憶されているコンピュータプログラムを実行する。これにより、電子透かし埋込装置1は、後述するような動作を実行し、音響信号に対する電子透かしデータの埋め込みを実現する。

【0030】
ROM12は、マスクROM、PROM、EPROM、又はEEPROM等によって構成されており、CPU11によって実行されるコンピュータプログラム及びこれに用いられるデータ等を記憶している。

【0031】
RAM13は、SRAMまたはDRAM等によって構成されており、ハードディスク16に記憶されているプログラムの読み出しに用いられる。また、RAM13は、CPU11がコンピュータプログラムを実行するときに、CPU11の作業領域としても利用される。

【0032】
信号入力部14は、処理対象となる原信号である音響 信号及びその音響信号に埋め込まれる電子透かしデータの入力を、外部の装置から受け付ける。また、信号出力部15は、電子透かしデータが埋め込まれた音響信号(以下、「透かし入り音響信号」という)を外部の装置へ出力する。

【0033】
なお、本実施の形態においては、原信号である音響信号はデジタルデータである。しかし、当該音響信号がアナログデータであってもよく、その場合は、A/D変換機能を備えた信号入力部14が、入力された音響信号をA/D変換することによりデジタルデータに変換した上で、その後の処理を行うようにすればよい。

【0034】
ハードディスク16には、オペレーティングシステム及びアプリケーションプログラム等、並びにCPU11に実行させるための種々のコンピュータプログラムおよび当該コンピュータプログラムの実行に用いられるデータ等がインストールされている。このコンピュータプログラムには、電子透かしデータの埋め込みを行うための電子透かし埋込プログラム16Aが含まれる。

【0035】
ハードディスク16にインストールされる電子透かし埋込プログラム16Aは、フレキシブルディスクドライブ、CD-ROMドライブ、またはDVD-ROMドライブ等の外部記憶装置(図示せず)を介して、可搬型記録媒体から読み出される。

【0036】
なお、このように可搬型記録媒体によって提供されるのみならず、電気通信回線(有線、無線を問わない)を介して電子透かし埋込装置1と通信可能に接続された外部の装置から電子透かし埋込プログラム16Aを提供することも可能である。例えば、電子透かし埋込プログラム16Aがインターネット上のサーバコンピュータのハードディスク内に格納されている場合において、このサーバコンピュータに電子透かし埋込装置1がアクセスして、当該コンピュータプログラムをダウンロードし、これをハードディスク16にインストールすることも可能である。

【0037】
ハードディスク16には、例えば米マイクロソフト社が製造販売するWindows(登録商標)等のマルチタスクオペレーティングシステムがインストールされている。以下の説明において、本実施の形態に係る電子透かし埋込プログラム16Aは当該オペレーティングシステム上で動作するものとする。

【0038】
次に、上記の電子透かし埋込装置1の構成を、図2に示す機能ブロック図を参照しながら説明する。なお、以下において、nはサンプリング番号を、kは音響信号のフレーム番号をそれぞれ示している。
図2に示すように、電子透かし埋込装置1は、音響信号x(n)をフレーム化するフレーム処理部101と、2つの蝸牛遅延フィルタ102a及び102bと、電子透かしデータs(k)の値に応じて第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bの何れかを選択するフィルタ選択部103とを備えている。

【0039】
フィルタ選択部103は、電子透かしデータのビット値が“0”である場合に第1蝸牛遅延フィルタ102aを選択し、同じく“1”である場合に第2蝸牛遅延フィルタ102bを選択する。第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bでは、後述するようにして音響信号に群遅延を与える。このようにして群遅延が付与された音響信号が統合され、電子透かしデータが埋め込まれた音響信号である透かし入り音響信号y(n)が生成される。

【0040】
なお、本実施の形態において、これらのフレーム処理部101、第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102b、並びにフィルタ選択部103は、CPU11が電子透かし埋込プログラム16Aを実行することによって実現される。

【0041】
[蝸牛遅延フィルタ]
以下、第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bの詳細について説明する。これらの第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bは、人間の聴覚の蝸牛遅延特性を模擬したデジタルフィルタであり、具体的には、振幅成分にはまったく影響を与えず、位相特性のみを変化させる全域通過フィルタで構成される。

【0042】
本実施の形態において、蝸牛遅延フィルタ102a及び102bは、以下の式(1)の伝達関数H(z)により定義される1次の無限インパルス応答型全域通過フィルタで構成される。
【数1】
JP0005879075B2_000002t.gif
ここで、bはH(z)のフィルタ係数を表している。
このように、第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bを1次の無限インパルス応答型全域通過フィルタで構成することにより、高速な処理が可能になる。

【0043】
なお、無限インパルス応答型全域通過フィルタの群遅延特性が蝸牛遅延特性をより正確に表していれば、フィルタ次数は1次以上であってもよく、また、フィルタのカスケード段数は1段以上であってもよい。

【0044】
第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bにより与えられる群遅延γm(ω)は以下の式(2)により算出される。
【数2】
JP0005879075B2_000003t.gif

【0045】
図3は、本発明の実施の形態1における電子透かし埋込装置1が備える第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bの特性を示すグラフである。図3において、縦軸は群遅延を、横軸は音響信号の周波数をそれぞれ示している。

【0046】
図3において、細い実線は、人間の聴覚における蝸牛遅延を1/10倍に縮小した蝸牛遅延特性を示している。また、太い実線は、フィルタ係数b=0.795の場合に上記式1により定義される第1蝸牛遅延フィルタ102aの特性を示し、破線は、フィルタ係数b=0.865の場合に同じく定義される第2蝸牛遅延フィルタ102bの特性を示している。

【0047】
なお、図3において細い実線で示されている蝸牛遅延特性は、「T. Dau, O. Wegner, V. Mellert, and B. Kollmeier, “Auditory brainstem responses (ABR) with optimized chirp signals compensating basilar membrane dispersion,” J. Acoust. Soc. Am., 107, 1530-1540, 2000」を参考にして定めたものである。

【0048】
以上より、第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bを音響信号にかけると、実際の蝸牛遅延の1/10倍の蝸牛遅延を当該音響信号に付与することになる。したがって、人間の実際の蝸牛遅延特性を近似するためには、このような蝸牛遅延フィルタを10段カスケード接続する必要がある。しかし、実際と同様の蝸牛遅延量を音響信号に与えることにすると、その音響信号を知覚する際の群遅延量は実際の蝸牛遅延量の2倍になってしまうため、遅延が大きすぎると考えられる。そこで、本実施の形態においては、上記のように実際の蝸牛遅延の1/10倍の蝸牛遅延を音響信号に与えることにしている。

【0049】
本実施の形態において、第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bはそれぞれ、下記の式(3)及び式(4)にしたがって、原信号である音響信号x(n)に蝸牛遅延パターンを付与し、中間信号w(n)及びw(n)を得る。そして、フィルタ選択部103が、電子透かしデータのビット値に応じて、フレーム毎に中間信号w(n)及びw(n)を選択・統合することにより、下記の式(5)に示す透かし入り音響信号y(n)を取得する。
【数3】
JP0005879075B2_000004t.gif
ただし、(k-1)ΔW<n≦kΔWを満足する。ここで、ΔW(=fs/Nbit)はフレーム長であり、fsは原信号のサンプリング周波数を、Nbitは1秒あたりの情報埋込ビットレートをそれぞれ表している。

【0050】
[電子透かし検出装置の構成]
図4は、本発明の実施の形態に係る電子透かし検出装置の構成を示すブロック図である。図4に示すように、電子透かし検出装置2は、上記の 電子透かし埋込装置1と同様に、CPU21、ROM22、RAM23、信号入力部24、及びハードディスク25を備えており、これらのCPU21、ROM22、RAM23、信号入力部24及びハードディスク25は、バス26によって接続されている。

【0051】
CPU21、ROM22及びRAM23のそれぞれについては、電子透かし埋込装置1が備えるCPU11、ROM12及びRAM13と同様であるので、説明を省略する。

【0052】
信号入力部24は、透かし入り音響信号の入力を外部の装置から受け付ける。この透かし入り音響信号は、信号入力部24に対して電子透かし埋込装置1から直接入力されてもよく、他の装置及び/又は通信ネットワーク等を介して入力されてもよい。

【0053】
ハードディスク25には、電子透かし埋込装置1の場合と同様に、オペレーティングシステム及びCPU21に実行させるための種々のコンピュータプログラム等がインストールされている。このコンピュータプログラムには、電子透かしデータの検出を行うための電子透かし検出プログラム25Aが含まれる。

【0054】
電子透かし埋込プログラム16Aの場合と同様に、ハードディスク25にインストールされる電子透かし検出プログラム25Aは、可搬型記録媒体によって提供されてもよく、電気通信回線を介して提供されてもよい。また、この電子透かし検出プログラム25Aは、電子透かし埋込プログラム16Aの場合と同様に、ハードディスク25にインストールされているオペレーティングシステム上で動作するものとする。

【0055】
次に、上記の電子透かし検出装置2の構成を、図5に示す機能ブロック図を参照しながら説明する。
図5に示すように、電子透かし検出装置2は、電子透かし埋込装置1により生成された透かし入り音響信号y(n)をフレーム化するフレーム処理部201と、フレーム化された透かし入り音響信号y(n)に対して、チャープz変換を施す2つのチャープz変換部202a及び202bと、これらの第1チャープz変換部202a及び第2チャープz変換部202bによるチャープz変換の結果に基づいて、電子透かしデータのビット値を検出するビット値検出部203とを備えている。なお、本実施の形態において、これらのフレーム処理部201、第1チャープz変換部202a及び第2チャープz変換部202b、並びにビット値検出部203は、CPU21が電子透かし検出プログラム25Aを実行することによって実現される。

【0056】
[チャープz変換]
第1チャープz変換部202a及び第2チャープz変換部202bが実行するチャープz変換(CZT)は、周波数スペクトルのフレキシブルな分析を可能とする手法として知られ(例えば、「Wang, T. T. “The segmented chirp z-transform and its application in spectrum analysis,”IEEE Trans. Instrumentation and measurement, 39(2), 318-323, 1990」を参照)、高速フーリエ変換(FFT)の実装にも活用されている。このチャープz変換は、離散フーリエ変換(DFT)と比較して、周波数分解能及び周波数応答のダイナミックレンジを自由に変えられるという特徴を有している。また、z平面上で任意のM点でのz変換を効率良く求めることができるという特徴も有している。

【0057】
一般に、チャープz変換は、z=rexp(jω)でN点のDFTと結ばれる(大きさr=1で正規化周波数ω=2πn/Nのとき単位円周上のDFTと等価である)関係にある。ここで、チャープz変換は下記の式(6)により表される。
【数4】
JP0005879075B2_000005t.gif
ただし、A=Aexp(j2πθ)、W=Wexp(j2πφ)である。ここで、θ及びφは初期位相である。上述したように、A=1、M=N、W=exp(-j2π/N)のとき、CZTはDFTに一致する。

【0058】
[ブラインド検出の原理]
本実施の形態では、上記のチャープz変換を用いることにより、第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bを用いて音響信号に埋め込まれた電子透かしデータのブラインド検出を実現する。以下、このブラインド検出の原理について説明する。

【0059】
第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bの極及び零点は、図6に示すとおりに配置される。これらの蝸牛遅延フィルタ102a及び102bは、上述したように1次IIR型全域通過フィルタであり、その特徴として極(図6中の“×”)及び零点(図6中の“○”)は中心点から単位円に向かって垂線を描いたときに交差する半径及びその逆数(b及び1/b)の関係にある。一般に、bの値が減少するにしたがい、極は中心点に近付き、零点は単位円から外側に向かって離れていく。反対に、bの値が増加するにしたがい、極及び零点は互いに単位円に向かって近付いていく。この場合の群遅延量は、図3に示すように、bの値の増加とともに増加する。なお、図6において、太字の“○”及び“×”は第1蝸牛遅延フィルタ102aの曲及び零点をそれぞれ示し、細字の“○”及び“×”は第2蝸牛遅延フィルタ102bの曲及び零点をそれぞれ示している。

【0060】
透かし入り音響信号y(n)は、上述したような遅延情報が埋め込まれた信号として観測されることになる。そのため、y(n)から遅延情報、すなわち遅延情報の付与に利用された蝸牛遅延フィルタの極及び零点の位置を推定することにより、ブラインド検出を実現することができる。

【0061】
なお、原信号x(n)自体も数列の特性として極及び零点を持つため(音源が有界であるとして、その信号の減衰に関係する極など)、観測信号y(n)から仮に極及び零点の位置を推定できたとしても、それはIIR型全域通過フィルタ(蝸牛遅延フィルタ)によって付与されたものなのか、原信号そのものが持つものであるのかを見極める必要がある。

【0062】
チャープz変換を用いることにより、蝸牛遅延フィルタの極及び零点の位置を推定することができることを示すために、上記の式(1)の蝸牛遅延フィルタの零点r=1/bを通るようにrを選択して、原信号x(n)及び遅延情報を埋め込んだ信号y(n)をチャープz変換(A=r、M=N、W=exp(-j2π/N))することにより周波数分析を行う。

【0063】
以下、原信号である楽器音をx(n)とし、第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bを利用して“AIS-Lab.”の電子透かしデータを埋め込んだ信号をy(n)とする。ここでは、第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bはいずれも直流成分のところに極及び零点を配置しており、r=1/b又はr=1/bとしたチャープz変換の周波数分析を行う。なお、サンプリング周波数は44.1kHz、ビットレートはNbit=4bpsとして、1フレーム(250ms)に1ビット相当の遅延情報を埋め込むものとする。

【0064】
図7は、その分析結果を示すグラフである。図7(a)乃至(i)は、左から右にフレーム#1でのx(n)、フレーム#1でのy(n)、フレーム#2のy(n)の周波数スペクトルを、上から下にr=1、r=1/b、r=1/bでのチャープz変換により分析した結果をそれぞれ示している。図7(g)に示すように、x(n)に関する分析結果では、極及び零点配置の周波数付近でのスペクトルには特段変化がみられない。他方、フレーム#1のy(n)ではr=1/bでのチャープz変換の結果(図9(h))において、フレーム#2のy(n)ではr=1/bでのチャープz変換の結果(図9(f))において、最も低い周波数領域(直流成分から低周波数域までの範囲;例えば図3に示す遅延が見られる周波数帯)のところでスペクトル成分が劇的に減少していることがわかる(図中の矢印で示す箇所)。これは、零点の影響によるディップ(くぼみ)に対応しているため、原理的にはその大きさは-∞dBになる。それ以外の分析(r=1、r=1/b(フレーム#1の場合)、及びr=1/b(フレーム#2の場合))では、最も低い周波数のところでスペクトル成分の変化はほとんど見られない(すなわち、-∞dB(線形で0)に近付かない)。なお、この結果に関しては、他のフレーム及び他の対象信号でも同様のことが起こることが確認されている。

【0065】
以上より、対象信号に係わらず、蝸牛遅延フィルタの零点を交差するようにz平面上の軌跡に沿ってチャープz変換を行うことにより、y(n)から蝸牛遅延フィルタの零点の位置を推定することが可能であることが分かる。なお、原理的には、rを零点ではなく極の値にしてチャープz変換を行うことも可能である(極の場合は∞dBのスペクトルピークを得ることになる)が、計算機上でのダイナミックレンジ内のオーバーフローを検出しなければならないため、零点を用いる方が望ましい。零点を利用する場合は、ダイナミックレンジ内の0を探せばよいため、より容易な処理で足りることになる。

【0066】
本実施の形態では、第1チャープz変換部202aがr=1/bのz平面上の軌跡に沿ったチャープz変換を行い、第2チャープz変換部202bがr=1/bのz平面上の軌跡に沿ったチャープz変換を行う。これらのチャープz変換の結果を用いることにより、対象信号が、第1蝸牛遅延フィルタ102a(フィルタ係数b)及び第2蝸牛遅延フィルタ102b(フィルタ係数b)の何れにより群遅延が与えられたものであるのかを推定することが可能になる。

【0067】
[電子透かし埋込装置1及び電子透かし検出装置2の動作]
次に、上述したように構成された本実施の形態の電子透かし埋込装置1及び電子透かし検出装置2の動作について、図8及び図9に示すフローチャートと図2及び図5とを参照しながら説明する。

【0068】
[電子透かし埋込処理]
図8は、本発明の実施の形態における電子透かし埋込装置1が実行する電子透かし埋込処理の手順を示すフローチャートである。
電子透かし埋込装置1は、フレーム処理部101において、外部から入力された音響信号(原信号)を各フレームに分割する(S101)。次に、電子透かし埋込装置1は、フィルタ選択部103において、電子透かしデータのビット値に応じて適用する蝸牛遅延フィルタの選択を行う。具体的には、外部から入力され、2進数表現のデータに変換された電子透かしデータのビット値が“0”及び“1”の何れであるかを判定し(S102)、その判定結果に応じて第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bの何れかを選択する。なお、電子透かしデータとしては、例えば著作権者名等の著作権情報またはシリアルナンバー等が挙げられる。

【0069】
ステップS102において電子透かしデータのビット値が“0”であると判定した場合(S102で“0”)、電子透かし埋込装置1は、第1蝸牛遅延フィルタ102aを用いて、音響信号(原信号)に対して位相変調を施す(S103)。他方、電子透かしデータのビット値が“1”であると判定した場合(S102で“1”)、電子透かし埋込装置1は、第2蝸牛遅延フィルタ102bを用いて、音響信号(原信号)に対して位相変調を施す(S104)。これらのステップS103及びS104により、電子透かしデータが音響信号により埋め込まれることになる。

【0070】
次に、電子透かし埋込装置1は、当該フレームに埋め込む電子透かしデータのすべてのビットが処理されたか否かを判定する(S105)。ここでまだ処理されていないビットがあると判定した場合(S105でNO)、電子透かし埋込装置1は、ステップS102へ戻り、それ以降の処理を繰り返す。他方、すべてのビットが処理されたと判定した場合(S105でYES)、電子透かし埋込装置1は、ステップS103及びS104により電子透かしデータの各ビットが埋め込まれた音響信号を接合することにより、透かし入り音響信号を生成する(S106)。

【0071】
上記の電子透かし埋込処理をすべてのフレームについて行い、それらを接続することにより、透かし入り音響信号y(n)が生成される。なお、フレームの接続箇所に不連続点が生じることにより(スペクトル拡散の原因でもある)知覚不可能性に影響が出ることを防止するために、接続部前のフレームの後ろ数点(1ms程度)をスプライン(Spline)補間で滑らかにすることが望ましい。

【0072】
[電子透かし検出処理]
次に、上記のようにして電子透かしデータが埋め込まれた透かし入り音響信号から、当該電子透かしデータを検出する電子透かし検出処理について説明する。本実施の形態では、上述したように、原信号を参照しないブラインド検出を行う。なお、電子透かし検出装置2は、電子透かし埋込装置1により電子透かしデータが埋め込まれた際のビットレートを示す情報を記憶しており、当該情報に基づいて下記のセグメントの設定を行うものとする。

【0073】
図9は、本発明の実施の形態における電子透かし検出装置2が実行する電子透かし検出処理の手順を示すフローチャートである。
電子透かし検出装置2は、フレーム処理部201において、外部から入力された透かし入り音響信号を各フレームに分割する(S201)。次に、電子透かし検出装置2は、処理対象のセグメントを設定し(S202)、第1チャープz変換部202aにおいて、当該セグメントの音響信号に対してチャープz変換を行う(S203)。さらに、第2チャープz変換部202bにおいて、同じ音響信号に対してチャープz変換を行う(S204)。

【0074】
次に、電子透かし検出装置2は、ステップS203及びS204により得られた2つの周波数スペクトルのうちの何れが、最も低い周波数でのスペクトルの値が急激に減少しているか否かを判定し、その判定結果に基づき、当該音響信号に対して位相変調を施した蝸牛遅延フィルタの零点を推定する(S205)。本実施の形態の場合、上記のようにスペクトルの値が急激に減少しているのが第1チャープz変換部202aにより得られた周波数スペクトルである場合は当該零点が1/bであると推定され、同じく第2チャープz変換部202bにより得られた周波数スペクトルである場合は当該零点が1/bであると推定される。

【0075】
次に、電子透かし検出装置2は、ビット値検出部203において、ステップS205により推定された蝸牛遅延フィルタの零点が1/b及び1/bの何れであるかを判定すし(S206)、1/bと判定した場合(S206で1/b)はビット値“0”を検出する(S207)。他方、1/bと判定した場合(S206で1/b)はビット値“1”を検出する(S208)。

【0076】
その後、電子透かし検出装置2は、処理対象のフレームのすべてのセグメントについて処理を行ったか否かを判定する(S209)。ここで、まだ処理を行っていないセグメントがあると判定した場合(S209でNO)、電子透かし検出装置2は、ステップS202へ戻り、それ以降の処理を繰り返す。他方、すべてのセグメントについて処理を行ったと判定した場合(S209でYES)、電子透かし検出装置2は、ステップS207及びS208においてビット値検出部203により検出したビット値を接合することにより、電子透かしデータを復元する(S210)。

【0077】
以上のようにして、蝸牛遅延フィルタを用いて音響信号に埋め込まれた電子透かしデータをブラインド検出することができる。

【0078】
[他の手法との比較評価]
次に、上述した本実施の形態の電子透かし埋込処理により埋め込まれた電子透かしデータの知覚不可能性と、同じく電子透かし検出処理によるビット検出の正確性とについて、他の手法と比較評価する。

【0079】
本発明者等は、RWC音楽データベース(後藤、橋口、西村、岡、“RWC 研究用音楽データベース:音楽ジャンルデータベースと楽器音データベース,” 情処学研究報告、2002-MUS-45-4, 19-26, 2002)の全102曲を評価用の原信号(サンプリング周波数44.1kHz、16ビット量子化)として利用して、客観評価実験を行った。ここでは、冒頭10秒間を元曲として、8文字の情報(“AIS-Lab.”)を透かし情報として各原信号に埋め込んだ。また、Nbit=4bpsをベースとし、12条件のNbit(Nbit = 4,8,16,32,64,128,256,512,1024,2048,4096,819bps)で、電子透かしデータを原信号の両チャンネルに埋め込み、その特性評価を行った。音質評価に関しては、「Y. Lin and W. H. Abdulla, “Perceptual evaluation of audio watermarking using objective quality measure,” Proc. ICASSP2008, 1745-1748, 2008」に基づき、オーディオ信号に対する知覚評価尺度(PEAQ)(P. Kabal, “An examination and interpretation of ITU-R BS.1387: Perceptual evaluation of audio quality,”TSP Lab. Technical Report, Dept. Electrical & Computer Engineering, McGUniv. 2002)及び対数スペクトル歪尺度(LSD)を利用した。

【0080】
比較対象の手法としては、代表的な電子音響透かし法であるLSB法、DSS法、ECHO法、PPM法を利用した。なお、これらの手法は、PPM法を除き、何れもブラインド検出法である。また、発明者等により非特許文献6及び7にて提案されているCD法も比較対象とした。以下、この比較対象のCD法をCD(Non-Blind)法とし、本実施の形態の電子透かし検出方法をCD(Blind)法と表現する。

【0081】
図10は、上記の客観評価実験の結果を示すグラフであり、(a)乃至(c)はそれぞれPEAQ、LSD、ビット検出率についての実験結果を示している。なお、図10では、上記102曲についての平均値が示されている。

【0082】
まず、図10(a)に示す結果について検討する。PEAQのODG(Objective Difference Grade)値は0(知覚不可能)~-4(非常に耳障りである)であるため、ここでは-1(知覚される可能性があるが耳障りではない)を知覚不可能性の閾値と定めた。図10(a)に示されるように、DSS法が最も悪く、ECHO法もビットレートが8bps以降から先で急激に悪くなっている。また、PPM法は全般的にODGが-2程度となっている。他方、LSB法は、今回の全てのビットレートにおいて良好な結果が得られている。また、CD(Non-Blind)法では、ビットレートが4bpsでは全く問題がないが、128bpsあたりからODG値が減少し、1024bps程度以降で閾値-1を下回っている。これらに対し、本実施の形態のCD(Blind)法では、64bpsの時点で既に-1.0付近となり、bpsの増加とともに-3.0付近まで低下している。

【0083】
次に、図10(b)に示す結果について検討する。一般にLSDは1dB内の歪みであれば音質がよいといわれているため、ここでは、LSDの閾値を1dBに設定した。図10(b)に示すように、LSB法は、ビットレートを変えても埋め込みによる歪みの影響を受けておらず、良好な結果が得られている。他方、DSS法の場合、ビットレートの増加にかかわらず評価閾値の上にあり、音質評価では問題があることが分かる。ECHO法及びPPM法は、いずれも評価閾値内にあり、特に音質に関して問題があるとはいえない。また、CD(Non-Blind)法は、すべてのビットレートで閾値内にあり、256bpsまでは0.5dB以内を維持するという良好な結果となっている。これらに対し、CD(Blind)法は、ビットレートの増加に対して単調増加しており、Nbit<1024bpsまでは閾値以下(-1dB)にあるものの、CD(Non-Blind)法と比較すると若干大きな値となっている。しかし、4~64bpsの付近では、CD(Blind)法でのLSDがCD(Non-Blind)法のものよりも若干小さい値になっている。なお、CD(Blind)法及びCD(Non-Blind)法のLSDでの差は、図10(a)に示すPEAQの場合ほど大きくはなっていない。これは、単純なスペクトル歪みでみる場合と比べると、聴覚的な印象に基づく尺度では両者により違いが現れるためであると考えられる。

【0084】
最後に、図10(c)に示す結果について検討する。ここでは、ビット検出率の閾値を75%とした。図10(c)に示すように、LSB法を除き、いずれの手法ともビットレートの増加に伴いビット検出率の低下が見られる。CD(Non-Blind)法は、Nbit=1024bps程度で閾値を切るが、他の従来手法ではもっと低いビットレートで閾値を切っている。他方、本実施の形態のCD(Blind)法では、ビット検出率の低下はほとんど見られず、CD(Non-Blind)法と比べても良好な結果が得られている。具体的には、Nbit<512まではほぼ100%であり、1024bpsに至って98%となっている。

【0085】
なお、上記の客観評価実験では、LSB法が最も良い結果を出しているが、LSB法の場合、埋め込みされた信号が少しでも改変された場合に検出できないため、頑健性に大きな問題があることが非特許文献6及び7等で指摘されている。これに対し、CD(Non-Blind)法の場合、「Unoki, M., Imabeppu, K., Hamada, D., Haniu, A., and Miyauchi, R. “Embedding limitations with digital-audio watermarking method based on cochlear delay characteristics,” J. Information Hiding and Multimedia Signal Processing, 2(1), 1-23, 2011」等に示されるように、十分な頑健性を備えている。しかしながら、CD(Non-Blind)法ではブラインド検出ができないという問題があり、本実施の形態のCD(Blind)法では、この問題を解消しつつ、優れた知覚不可能性及び頑健性を得ることが可能である。

【0086】
[原信号取得処理]
従来の多くの電子音響透かし技術では、電子透かしデータを原信号に埋め込んだ後、それを検出することのみが考慮され、検出後にその電子透かしデータを取り除くことまでは検討されていない。そのため、埋め込まれた電子透かしデータを取り除くための工夫はなされず、除去が困難な態様で電子透かしデータの埋め込みを行っている。このことから、従来の多くの技術は、非可逆的な電子音響透かし技術であるといえる。これに対し、本実施の形態では、原信号に対して蝸牛遅延フィルタにより位相変調を施すという比較的単純な処理で電子透かしデータの埋め込みを行っており、その後検出された電子透かしデータを利用することにより、簡易な方法で当該電子透かしデータを取り除いて原信号を取得することができる。このように、本実施の形態では、可逆型の電子音響透かし技術を実現することができる。以下、この原信号を取得するための処理について説明する。

【0087】
図11は、本発明の実施の形態における電子透かし検出装置2が実行する原信号取得処理の手順を示すフローチャートである。なお、以下では、電子透かし検出装置2が、電子透かし埋込装置1が備える第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bの逆フィルタ、すなわち第1蝸牛遅延フィルタ102a及び第2蝸牛遅延フィルタ102bが模擬する蝸牛遅延特性の逆特性を有するフィルタを備えているものとする。

【0088】
電子透かし検出装置2は、フレーム処理部201において、外部から入力された透かし入り音響信号を各フレームに分割する(S301)。次に、電子透かし検出装置2は、上記の電子透かし検出処理により検出された電子透かしデータを参照し(S302)、その電子透かしデータのビット値が“0”及び“1”の何れであるかを判定する(S303)。

【0089】
ステップS303において電子透かしデータのビット値が“0”であると判定した場合(S303で“0”)、電子透かし検出装置2は、第1蝸牛遅延フィルタ102aの逆フィルタを用いて、透かし入り音響信号に対して位相変調を施す(S304)。他方、電子透かしデータのビット値が“1”であると判定した場合(S303で“1”)、電子透かし検出装置2は、第2蝸牛遅延フィルタ102bの逆フィルタを用いて、透かし入り音響信号に対して位相変調を施す(S305)。

【0090】
次に、電子透かし埋込装置1は、当該フレームに埋め込まれている電子透かしデータのすべてのビットについて処理がなされたか否かを判定する(S306)。ここでまだ処理がなされていないビットがあると判定した場合(S306でNO)、電子透かし検出装置2は、ステップS303へ戻り、それ以降の処理を繰り返す。他方、すべてのビットについて処理がなされたと判定した場合(S306でYES)、電子透かし検出装置2は、ステップS304及びS305により位相変調が施された音響信号を接合することにより、原信号を復元する(S307)。

【0091】
上記の原信号取得処理をすべてのフレームについて行い、それらを接続することにより、原信号が取得されることになる。なお、電子透かし埋込処理の場合と同様に、フレームの接続箇所に不連続点が生じることにより知覚不可能性に影響が出ることを防止するために、接続部前のフレームの後ろ数点(1ms程度)をスプライン補間で滑らかにすることが望ましい。

【0092】
[原信号取得処理の評価]
上述した原信号取得処理により取得された信号が実際の原信号と一致しているか等の点について確認するために、上記の客観評価実験と同様の実験を行った。以下、この結果について検討する。

【0093】
図12は、CD(Non-Blind)法及びCD(Blind)法における電子透かし埋込処理により生成された透かし入り音響信号についての上記客観評価実験の結果を示すグラフであり、(a)乃至(c)はそれぞれPEAQ、LSD、ビット検出率についての実験結果を示している。なお、図12には、上記102曲についての平均値が示されている。

【0094】
図12において、CD(Blind)法の結果は、上述したスプライン補間を行った場合(Blind(Splineあり))と行っていない場合(Blind(Splineなし))とに分けて示されている。図12を参照すると、スプライン補間を行っている方が、PEAQ、LSD、ビット検出率の何れについても良い結果が出ていることが分かる。ただし、ビット検出率についてはほとんど違いがない。

【0095】
他方、図13は、本実施の形態の原信号取得処理により電子透かしデータを削除する前及び削除した後における上記の客観評価実験の結果を示すグラフであり、(a)乃至(c)はそれぞれPEAQ、LSD、SNR(Signal-Noise Ratio)についての実験結果を示している。このSNRにおいて、Sは原信号、Nは原信号と回復信号(上記の原信号取得処理により得られた信号)との差を意味している。なお、ここでも、上記102曲についての平均値が示されている。

【0096】
図13を参照すると、電子透かしデータを削除する前よりも、削除した後の方が全般的に良好な結果となっていることが分かる。特に、図13(c)に示すSNRではそのことが顕著となっている。回復信号が原音に近付くほどSNRは高い値になるため、図13(c)に示す結果は、本実施の形態の原信号取得処理により取得された信号が原信号に近いこと、換言すると透かし入り音響信号から埋め込まれた電子透かしデータを効果的に削除することができたことを表しているといえる。

【0097】
このように、本実施の形態では、蝸牛遅延フィルタの逆フィルタを用いて位相変調を行うという簡易な処理で、透かし入り音響信号から電子透かしデータを除去して原信号を取得することができる。このように、原信号を取得することができるため、その原信号に新たな電子透かしデータを埋め込み、これを流通させるようなことも可能となる。これにより、埋め込み情報(例えば、著作権情報、シリアルナンバー等)の内容を更新することができる電子音響透かし技術を実現することができる。

【0098】
(その他の実施の形態)
上記の各実施の形態においては、電子透かしデータの埋め込み処理及び検出処理がソフトウェアにより実現されているが、本発明はこれに限定されるわけではない。例えば、これらの処理の全部又は一部が、DSP(Digital Signal Processor)等の専用のハードウェア回路によって実現されてもよい。

【0099】
また、上記の各実施の形態においては、原信号であるモノラル音楽信号に対して電子透かしデータを埋め込んでいるが、本発明はこれに限られるわけではなく、ステレオ音楽信号の両チャンネルに対して電子透かしデータを埋め込むことも可能である。
【産業上の利用可能性】
【0100】
本発明の電子透かし検出装置及び電子透かし検出方法はそれぞれ、種々の音楽ジャンルの音響信号に電子透かしデータが埋め込まれている場合に当該電子透かしデータを検出する電子透かし検出装置及び電子透かし検出方法等として有用である。
【符号の説明】
【0101】
1 電子透かし埋込装置
11 CPU
12 ROM
13 RAM
14 信号入力部
15 信号出力部
16 ハードディスク
16A 電子透かし埋込プログラム
17 バス
101 フレーム処理部
102a 第1蝸牛遅延フィルタ
102b 第2蝸牛遅延フィルタ
103 フィルタ選択部
2 電子透かし検出装置
21 CPU
22 ROM
23 RAM
24 信号入力部
25 ハードディスク
25A 電子透かし検出プログラム
26 バス
201 フレーム処理部
202a、202b 変換部
202a 第1チャープz変換部
202b 第2チャープz変換部
203 ビット値検出部
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9
【図11】
10
【図12】
11
【図13】
12