TOP > 国内特許検索 > オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法 > 明細書

明細書 :オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第5224219号 (P5224219)
登録日 平成25年3月22日(2013.3.22)
発行日 平成25年7月3日(2013.7.3)
発明の名称または考案の名称 オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法
国際特許分類 G10L  19/00        (2013.01)
G10L  19/02        (2013.01)
FI G10L 19/00 220Z
G10L 19/02 150
請求項の数または発明の数 21
全頁数 36
出願番号 特願2010-517838 (P2010-517838)
出願日 平成21年6月3日(2009.6.3)
国際出願番号 PCT/JP2009/060110
国際公開番号 WO2009/157280
国際公開日 平成21年12月30日(2009.12.30)
優先権出願番号 2008167143
2008167144
2008167145
優先日 平成20年6月26日(2008.6.26)
平成20年6月26日(2008.6.26)
平成20年6月26日(2008.6.26)
優先権主張国 日本国(JP)
日本国(JP)
日本国(JP)
審査請求日 平成22年9月28日(2010.9.28)
特許権者または実用新案権者 【識別番号】503360115
【氏名又は名称】独立行政法人科学技術振興機構
発明者または考案者 【氏名】寅市 和男
【氏名】中村 光晃
【氏名】諸岡 泰男
個別代理人の代理人 【識別番号】100122884、【弁理士】、【氏名又は名称】角田 芳末
【識別番号】100133824、【弁理士】、【氏名又は名称】伊藤 仁恭
審査官 【審査官】井上 健一
参考文献・文献 特開2005-057439(JP,A)
特表2001-521648(JP,A)
特開2007-249009(JP,A)
調査した分野 G10L 19/00-19/14
特許請求の範囲 【請求項1】
デジタルオーディオ信号を、複数の周波数帯域に分割する帯域分割手段と、
前記帯域分割手段で各帯域に分割されたデジタルオーディオ信号の所定の区間を、n次多項式(nは2以上の整数)を用いて関数近似する、前記分割された帯域ごとに用意される関数近似手段と、
前記関数近似手段で関数近似した前記n次多項式の係数値であるパラメータを符号化する符号化手段と、
を備えたオーディオ信号圧縮装置。
【請求項2】
前記所定の区間は、前記複数の周波数帯域の中の最小の周波数帯域での極大値と極小値の間、あるいは、極大値または極小値と変曲点との間のいずれかである、請求項1に記載のオーディオ信号圧縮装置。
【請求項3】
前記n次多項式は、微分可能回数で分類される標本化関数の線形結合式で表わされる、請求項1または2に記載のオーディオ信号圧縮装置。
【請求項4】
前記関数近似手段で用いられる標本化関数は、基本項と制御項とに分離して示される関数であり、前記制御項の係数値の設定で、前記標本化関数の特性を変化させる、
請求項3に記載のオーディオ信号圧縮装置。
【請求項5】
前記帯域分割手段で各帯域に分割されたデジタルオーディオ信号のサンプリング周期を間引くダウンサンプリング手段を、更に備え、
前記関数近似手段は、前記ダウンサンプリング手段でサンプリング周期が間引かれたデジタルオーディオ信号を関数近似する、
請求項1~4のいずれかに記載のオーディオ信号圧縮装置。
【請求項6】
前記帯域分割手段は、
i番目(i=1~n)の周波数帯域の信号を分離するi番目の帯域分離フィルタの出力信号を、入力されるデジタルオーディオ信号から減算するi番目の減算手段を備え、その減算出力を(i+1)番目の帯域分離フィルタの入力信号として(i+1)番目の周波数帯域の信号を分離出力し、n番目の減算手段の減算出力から、最後のn番目の周波数帯域の信号を分離出力する、
請求項1~5のいずれかに記載のオーディオ信号圧縮装置。
【請求項7】
前記帯域分割手段は、
入力されるデジタルオーディオ信号から第1の周波数帯域となる低音域信号を分離する第1の帯域分離フィルタと、
前記入力されるデジタルオーディオ信号から第3の周波数帯域となる高音域信号を分離する第3の帯域分離フィルタと、
前記第1の帯域分離フィルタで分離された第1の周波数帯域の低音域の信号と、前記第3の帯域分離フィルタで分離された第3の周波数帯域の高音域の信号を加算する加算手段と、
前記入力されるデジタルオーディオ信号から、前記加算手段で加算された第1の周波数帯域の低音域信号と第3の周波数帯域の高音域信号の加算信号を減算する減算手段と、を備え、
前記減算手段の減算出力から第2の周波数帯域である中音域信号を分離する、請求項1~5のいずれかに記載のオーディオ信号圧縮装置。
【請求項8】
前記帯域分割手段は、
入力されるデジタルオーディオ信号の第1の周波数帯域の信号を分離する第1の帯域分離フィルタと、
前記第1の帯域分離フィルタで分離された第1の周波数帯域の信号を前記関数近似手段で関数近似した後に更に関数補間した信号を、前記入力されるデジタルオーディオ信号から減算する第1の減算手段と、
前記第1の減算手段の出力から第2の周波数帯域の信号を分離する第2の帯域分離フィルタと、
前記第2の帯域分離フィルタで分離された第2の周波数帯域の信号を前記関数近似手段で関数近似した後に更に関数補間した信号を、前記第1の減算手段の出力信号から減算する第2の減算手段と、を備え、
前記第2の減算手段の出力から第3の周波数帯域の信号を分離する、請求項1~5のいずれかに記載のオーディオ信号圧縮装置。
【請求項9】
前記帯域分割手段は、
入力されるデジタルオーディオ信号の第1の周波数帯域の信号を分離する第1の帯域分離フィルタと、
前記入力されるデジタルオーディオ信号の第2の周波数帯域の信号を分離する第2の帯域分離フィルタと、
前記第1の帯域分離フィルタで分離された第1の周波数帯域の信号を関数近似した後に更に関数補間した信号と、前記第2の帯域分離フィルタで分離された第2の周波数帯域の信号を関数近似した後に更に関数補間した信号とを加算する加算手段と、
前記入力されるデジタルオーディオ信号から前記加算手段の出力を減算する減算手段とを、備え、
前記減算手段の出力から第3の周波数帯域の信号を分離する、請求項1~5のいずれかに記載のオーディオ信号圧縮装置。
【請求項10】
前記帯域分割手段は、
オクターブの周波数帯域ごとに分離する複数のオクターブ分離フィルタと、
前記複数のオクターブ分離フィルタで分離されたそれぞれの1オクターブ帯域のデジタルオーディオ信号を、12音階に相当する12の音階周波数単位に分離する音階成分分離フィルタと、を備え、
前記音階周波数単位にデジタルオーディオ信号を分離する、請求項1~5のいずれかに記載のオーディオ信号圧縮装置。
【請求項11】
前記オクターブ分離フィルタは、中心周波数を所定の1オクターブ音階の中心の音階周波数とし、その中心音階周波数の1/√2倍の周波数を最小帯域周波数、√2倍の周波数を最高帯域周波数とする帯域幅を持つ帯域通過型フィルタとすることを特徴とする請求項10に記載のオーディオ信号圧縮装置。
【請求項12】
前記音階成分分離フィルタは、所定の1オクターブ音階の最小帯域周波数の2の(k/12)乗倍(k=0~11)の周波数に分離することを特徴とする請求項10または11に記載のオーディオ信号圧縮装置。
【請求項13】
前記音階成分分離フィルタで分離された前記12の音階周波数単位の信号を入力し、前記12の音階周波数単位の同一音階を、前記オクターブ分離フィルタで分離された複数のオクターブから集めて、前記同一音階の対応帯域の集合を得ると共に、前記各同一音階の対応帯域の集合を、n次多項式(nは2以上の整数)により関数近似する複数の関数近似手段と、
前記複数の関数近似手段からの信号を圧縮符号化する圧縮符号化手段と、
を備えた請求項10~12のいずれかに記載のオーディオ信号圧縮装置。
【請求項14】
入力されるデジタルオーディオ信号を、帯域分割フィルタを用いて複数の周波数帯域に分割するステップと、
前記複数の周波数帯域に分割されたデジタルオーディオ信号の任意の区間を、n次多項式(nは2以上の整数)を用いて前記分割された帯域ごとに関数近似するステップと、
前記各帯域ごとに関数近似した関数のパラメータを符号化する符号化ステップ、
を含むオーディオ信号圧縮方法。
【請求項15】
前記各帯域に分割されたデジタルオーディオ信号のサンプリング周期を間引くダウンサンプリング処理を行うステップを含み、
前記関数近似は、前記ダウンサンプリングによりサンプリング周期が間引かれたデジタルオーディオ信号に対して行われる、
請求項14に記載のオーディオ信号圧縮方法。
【請求項16】
前記帯域分割フィルタを用いて複数の周波数帯域に分割するステップは、
前記入力されるデジタルオーディオ信号から第1の周波数帯域の信号を分離する第1の帯域分離処理ステップと、
前記入力されるデジタルオーディオ信号から前記第1の帯域分離処理で分離された第1の周波数帯域のデジタルオーディオ信号を減算する第1の減算処理ステップと、
前記第1の減算処理で得た信号から第2の周波数帯域の信号を分離する第2の帯域分離処理ステップと、
前記入力されるデジタルオーディオ信号から、前記第2の帯域分離処理で分離された第2の周波数帯域のデジタルオーディオ信号を減算する第2の減算処理ステップと、を含み、
前記第2の減算処理により、前記第1及び第2の周波数帯域とは別の第3の周波数帯域のデジタルオーディオ信号を帯域分離する、
請求項14または15に記載のオーディオ信号圧縮方法。
【請求項17】
前記帯域分割フィルタを用いて複数の周波数帯域に分割するステップは、
前記入力されるデジタルオーディオ信号から第1の周波数帯域となる低音域信号を分離する第1の帯域分離処理ステップと、
前記入力されるデジタルオーディオ信号から第3の周波数帯域となる高音域信号を分離する第2の帯域分離処理ステップと、
前記第1の帯域分離処理で分離された第1の周波数帯域である低音域の信号と、前記第2の帯域分離処理で分離された第3の周波数帯域である高音域の信号を加算する加算ステップと、
前記入力されるデジタルオーディオ信号から、前記加算された第1の周波数帯域の低音域信号と第3の周波数帯域の高音域信号の加算信号を減算する減算処理ステップと、を含み、
前記減算処理により前記入力されるデジタルオーディオ信号の第2の周波数帯域である中音域信号を分離する、請求項14または15に記載のオーディオ信号圧縮方法。
【請求項18】
前記帯域分割フィルタを用いて複数の周波数帯域に分割するステップは、
前記入力されるデジタルオーディオ信号の第1の周波数帯域の信号を分離する第1の帯域分離処理ステップと、
前記第1の帯域分離処理で分離された第1の周波数帯域の信号を前記関数近似するステップで関数近似した後に更に関数補間した信号を、前記入力されるデジタルオーディオ信号から減算する第1の減算処理ステップと、
前記第1の減算処理により得られる出力から第2の周波数帯域の信号を分離する第2の帯域分離処理ステップと、
前記第2の帯域分離処理で分離された第2の周波数帯域の信号を関数近似した後に更に関数補間した信号を、前記第1の減算処理により得られる信号から減算する第2の減算処理ステップと、を含み、
前記第2の減算処理により、前記第1及び第2の周波数帯域とは別の第3の周波数帯域の信号を分離する、請求項14または15に記載のオーディオ信号圧縮方法。
【請求項19】
前記帯域分割フィルタを用いて複数の周波数帯域に分割するステップは、
前記入力されるデジタルオーディオ信号の第1の周波数帯域の信号を分離する第1の帯域分離処理ステップと、
前記入力されるデジタルオーディオ信号の第2の周波数帯域の信号を分離する第2の帯域分離処理ステップと、
前記第1の帯域分離処理で分離された第1の周波数帯域の信号を関数近似した後に更に関数補間した信号と、前記第2の帯域分離処理で分離された第2の周波数帯域の信号を関数近似した後に更に関数補間した信号とを加算する加算処理ステップと、
前記入力されるデジタルオーディオ信号から前記加算処理によって加算された出力信号を減算する減算処理ステップとを、含み、
前記減算処理により、前記第1及び第2の周波数帯域とは別の出力から第3の周波数帯域の信号を分離する、請求項14または15に記載のオーディオ信号圧縮方法。
【請求項20】
複数の周波数帯域に分割されたデジタルオーディオ信号の所定の区間を、n次多項式(nは2以上の整数)を用いて関数近似された後、前記n次多項式の係数値であるパラメータが符号化され圧縮されたデジタルオーディオ信号に相当する、前記分割された帯域ごとの関数のパタメータを復号する復号化手段と、
前記復号化手段で復号化された帯域ごとの関数のパタメータに基づいて、圧縮されたデジタルオーディオ信号を関数補間して、前記分割された帯域ごとのサンプリング値を復元する関数補間手段と、
前記関数補間手段で復元されたサンプリング値を帯域合成する帯域合成手段と、
を備えたオーディオ信号復号装置。
【請求項21】
複数の周波数帯域に分割されたデジタルオーディオ信号の所定の区間を、n次多項式(nは2以上の整数)を用いて関数近似された後、前記n次多項式の係数値であるパラメータが符号化され圧縮された圧縮デジタルオーディオ信号に相当する、前記分割された帯域ごとの関数のパタメータを復号するステップと、
復号化された帯域ごとの関数のパタメータに基づいて前記圧縮されたデジタルオーディオ信号を関数補間して、前記分割された帯域ごとのサンプリング値を復元するステップと、
前記関数補間により復元されたサンプリング値を帯域合成するステップを、
含むオーディオ信号復号方法。
発明の詳細な説明 【技術分野】
【0001】
本発明は、オーディオ信号を高能率に圧縮するオーディオ信号圧縮装置及びオーディオ信号圧縮方法と、圧縮されたオーディオ信号を復号するオーディオ信号復号装置及びオーディオ信号復号方法に関する。
【背景技術】
【0002】
従来、デジタルオーディオ信号を圧縮符号化する符号化方式として、各種方式のものが実用化されている。すなわち、アナログオーディオ信号をデジタル信号に変換する際には、通常、一定のサンプリング周期ごとに、所定のビット数でサンプリングして、デジタルオーディオ信号とする。そして、このオーディオ信号に適した各種圧縮手法で、一定のサンプリング周期ごとに所定のビット数のデータを圧縮符号化するようにする。
【0003】
例えば、20Hzから20kHzまでの可聴帯域のアナログオーディオ信号をサンプリングして得たデジタルオーディオ信号を、所定帯域ごとに帯域分割し、その分割された帯域ごとに、離散コサイン変換などのデータ量を減らすための各種演算処理を行って符号化するものがある。このような処理は、例えばMP3(MPEG Audio Layer-3)方式などの圧縮音声フォーマットとして実用化されている。
【0004】
特許文献1には、この種のオーディオ信号の符号化処理の一例が記載されている。

【特許文献1】国際公開2005/004113号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、デジタルオーディオ信号を高能率に圧縮符号化する場合には、上述したように、オーディオ信号を複数の帯域に分割する処理を行うものがあるが、この複数の帯域に分割する処理としては、該当する周波数帯域の信号成分を抽出するデジタルフィルタを使うのが一般的であった。
例えば、図24に示すように、低い周波数から順に第1帯域B1,第2帯域B2,第3帯域B3・・・と順に帯域分割したとする。このとき、従来のフィルタ処理では、フィルタの減衰域の幅が大きくなり、図24に示すように、隣接した帯域の間で、信号の重なり部分が発生してしまうという問題があった。つまり、第1帯域B1の最も高い周波数の信号成分と、第2帯域B2の最も低い周波数の信号成分とで、同じ信号成分が含まれることになる。他の隣接した帯域間についても同様である。このような帯域間の重なりがあると、復調して合成した信号を再生することで、その信号成分の重なりが再生音質の劣化につながるという問題があった。
【0006】
また、オーディオ信号をMP3方式などの比較的高い圧縮率の方式で圧縮符号化した場合、その符号化方式にかかわらず、その復号化したときの音質が悪くなるという問題がある。この音質悪化の問題は、圧縮時と復号時とで、可逆性が保たれない限りは、必ず存在する問題であり、圧縮率が高ければ高いほど再生した音質が悪化する。これは、圧縮率が高いと符号化時に間引かれる音のデータが増えるので、再生した音質がより悪化するからである。
【0007】
特に、従来の圧縮符号化方式では、符号化するオーディオ信号の帯域として、高音域側の上限周波数をある程度の帯域で制限することにより、データ量を制限している。しかし、このような高音域の信号成分を制限することが、音質の悪化を増長させているということもできる。
近年、圧縮されていない(或いは圧縮率が低い)デジタルオーディオ信号として、例えば高音域として20kHzを大きく越えた数十kHzから100kHz程度の高域まで記録させた信号方式が存在している。このような信号方式は、一般的な再生方式に従うならば、再生音質の向上に貢献しているのであるが、上述したMP3などの圧縮率が高いオーディオ信号の圧縮符号化では、このような高域音は完全に除去されているため、音質の向上には貢献していない。
【0008】
本発明はかかる点に鑑みてなされたものであり、本発明の目的は、高音域の信号成分を残すような効率的な符号化とその符号化に対応した復号化を行うことにより、復号化した信号の音質劣化を大幅に低減することである。
また、本発明の他の目的は、オーディオ信号を帯域分割して圧縮符号化する際の、帯域間の信号の重なりによる音質劣化を防ぐことにある。
【課題を解決するための手段】
【0009】
本発明のオーディオ信号圧縮装置は、デジタルオーディオ信号を、複数の周波数帯域に分割する帯域分割手段と、この帯域分割手段で各帯域に分割されたデジタルオーディオ信号の所定の区間を、n次多項式(nは2以上の整数)を用いて関数近似する、各帯域ごとに用意された関数近似手段と、この関数近似手段で関数近似したn次多項式の係数値であるパラメータを符号化する符号化手段と、を備えている。
【0010】
また、本発明の好ましい形態のオーディオ信号圧縮装置では、帯域分割手段で各帯域に分割されたデジタルオーディオ信号のサンプリング周期を間引くダウンサンプリング手段を、更に備え、関数近似手段は、ダウンサンプリング手段でサンプリング周期の信号が間引かれたデジタルオーディオ信号を関数近似することを特徴としている。
【0011】
また、本発明のオーディオ信号圧縮装置に用いられる帯域分割手段の好ましい一例としては、入力されるデジタルオーディオ信号から第1の周波数帯域の信号を分離する第1の帯域分離フィルタと、該入力されるデジタルオーディオ信号から第1の帯域分離フィルタで分離された第1の周波数帯域のデジタルオーディオ信号を減算する第1の減算手段を備えている。そして、この第1の減算手段の減算出力から第2の周波数帯域の信号を分離する第2の帯域分離フィルタと、入力されるデジタルオーディオ信号から第2の帯域分離フィルタで分離された第2の周波数帯域のデジタルオーディオ信号を減算する第2の減算手段と、を備え、この第2の減算手段の減算出力から第3の周波数帯域の信号を分離するようにしている。なお、ここで、第1~第3の帯域分離フィルタとして説明しているが、デジタルオーディオ信号をn個の周波数帯域に分割する場合には、i番目の帯域分離フィルタ及びi番目の減算手段とを順次用いることにより、n個の周波数帯域に分離可能である。
【0012】
また、本発明のオーディオ信号圧縮装置の例として、入力されるデジタルオーディオ信号を、オクターブの周波数帯域ごとに分離する複数のオクターブ分離フィルタと、この複数のオクターブ分離フィルタで分離されたそれぞれの1オクターブ帯域のデジタルオーディオ信号を、12音階に相当する12の音階対応帯域に分離する音階成分分離フィルタと、を備えたものがある。そして、この音階成分分離フィルタで分離された12の音階対応帯域の同一音階を、オクターブ分離フィルタで分離された複数のオクターブから集めて、同一音階の対応帯域の集合を得ると共に、各同一音階対応帯域の集合を、n次多項式(nは2以上の整数)により関数近似する複数の関数近似手段と、この複数の関数近似手段からの信号を圧縮符号化する圧縮符号化手段と、を備えている。
【0013】
更に、本発明は、これらのオーディオ信号圧縮装置に対応したオーディオ信号復号装置も含んでいる。すなわち、本発明のオーディオ信号復号装置は、複数の周波数帯域に分割されたデジタルオーディオ信号の所定の区間を、n次多項式(nは2以上の整数)を用いて関数近似された後、このn次多項式の係数値であるパラメータが符号化され圧縮されたデジタルオーディオ信号に相当する、各帯域ごとの関数のパタメータを復号する復号化手段を備えている。また、この復号化手段で復号化された各帯域ごとの関数のパタメータに基づいて、圧縮されたデジタルオーディオ信号を関数補間して、各帯域ごとのサンプリング値を復元する関数補間手段と、この関数補間手段で復元されたサンプリング値を帯域合成する帯域合成手段と、を備えている。
【発明の効果】
【0015】
本発明によると、帯域分割された各帯域ごとの信号を関数近似して、その関数のパラメータを符号化することで、効率のよい圧縮符号化を行うことができる。また、この場合、各帯域を関数近似する際の関数式の設定を適正に行うことにより、高域成分を残した符号化を行うことができ、非常に音質のよい再生が可能な圧縮符号化を実現することができる。
【図面の簡単な説明】
【0016】
【図1】本発明の第1の実施の形態例に用いられる符号化のための回路構成を示すブロック図である。
【図2】本発明の第1の実施の形態例に用いられる音響信号を低音域、中音域、高音域に分けたときの波形例である。
【図3】本発明の第1の実施の形態例に用いられるビットストリームのフォーマット構造を示す図である。
【図4】本発明の第1の実施の形態例の説明に用いられる信号波形例を示す図である。
【図5】本発明の第1の実施の形態例が備える帯域フィルタの構成を示すブロック図である。
【図6】本発明の第1の実施の形態例の説明に用いられる標本化関数の例を示す特性図である。
【図7】本発明の第1の実施の形態例の説明に用いられる関数近似の例を示す特性図である。
【図8】本発明の第1の実施の形態例の説明に用いられる多項式近似の例を示す図である。
【図9】本発明の第1の実施の形態例に用いられる標本化関数の基本項と制御項の時間変化を示す図である。
【図10】本発明の第1の実施の形態例に用いられる標本化関数の制御項の係数を変化させたときの時間変化を示す図である。
【図11】本発明の第1の実施の形態例に用いられる標本化関数の周波数特性例を説明するための図である。
【図12】本発明の第1の実施の形態例に用いられる標本化関数で関数近似した例を示す図である。
【図13】本発明の第1の実施の形態例に用いられる標本化関数で関数近似した場合の信号列を示す図である。
【図14】本発明の第1の実施の形態例を用いて符号化したオーディオ信号を復号化するためのブロック構成例を示す図である。
【図15】本発明の第2の実施形態例に用いられる符号化装置の構成を示すブロック図である。
【図16】本発明の第2の実施形態例に用いられる帯域分離フィルタの第1の変形例を示す図である。
【図17】本発明の第2の実施形態例に用いられる帯域分離フィルタの第2の変形例を示す図である。
【図18】本発明の第2の実施形態例に用いられる帯域分離フィルタの第3の変形例を示す図である。
【図19】本発明の第2の実施形態例に用いられる帯域分離フィルタの第4の変形例を示す図である。
【図20】本発明の第3の実施形態例である、オーディオ信号の帯域をオクターブ単位で分割して符号化する符号化装置を示すブロック構成図である。
【図21】本発明の第3の実施形態例を説明するための、12音階データとオクターブ帯域(倍率)の関係を示した図である。
【図22】本発明の第3の実施形態例に用いられる帯域分離フィルタを、オクターブ周波数区間毎に分割構成した、音階周波数域と振幅の関係(周波数特性)を示した図である。
【図23】図20で示す符号化装置で符号化された信号を復号化する復号化装置の構成を示すブロック図である。
【図24】従来の帯域分割を説明するための図である。
【発明を実施するための形態】
【0017】
<第1の実施の形態例の説明>
以下、本発明の第1の実施の形態例(以下、「本例」ということもある。)を、図1~図12を参照して説明する。
まず、本発明の第1の実施の形態例においては、オーディオ信号を高能率圧縮して符号化する。そして、その符号化されたオーディオ信号を、復号化する。

【0018】
[符号化の全体構成例の説明]
まず、図1を参照して、本例において用いられる符号化装置の全体構成例について説明する。
図1に示すように、オーディオ信号源1からアナログオーディオ信号が出力されている。このアナログオーディオ信号は、アナログ/デジタル変換器2に供給され、このアナログ/デジタル変換器2で、一定のサンプリング周期ごとに所定ビット数にサンプリングされてデジタルオーディオ信号とされる。
なお、このアナログ/デジタル変換器2で変換されたデジタルオーディオ信号は、圧縮されていないデジタルオーディオ信号である。

【0019】
そして、デジタル・アナログ変換器2から出力されるデジタルオーディオ信号は、図1に示すフィルタバンク10で圧縮符号化される。なお、図1の例では、アナログオーディオ信号をデジタル変換する例を示したが、既にデジタル化されたオーディオ信号を用意して、これから説明する処理系に供給してもよい。

【0020】
次に、圧縮符号化するフィルタバンク10の構成について説明する。このフィルタバンク10は、オーディオ信号を複数の帯域の信号成分に分割するものである。
すなわち、フィルタバンク10は、周波数帯域を分割する分割数に対応した数の帯域フィルタ11a~11m(mは任意の整数:ここでは分割数に対応した数)を有している。それぞれの帯域フィルタ11a~11mは、例えば、区分多項式で表される標本化関数ψ(k)をインパルス応答関数として、帯域分割するための基本フィルタを構成する。なお、この各帯域フィルタ11a~11mで、それぞれに割り当てられた周波数帯域の信号を抽出する具体的な処理例については後述する。

【0021】
それぞれの帯域フィルタ11a~11mで帯域分割された信号は、それぞれの帯域の信号ごとに、個別のダウンサンプリング部12a~12mに供給され、サンプリング数を間引くダウンサンプリング処理がなされる。それぞれのダウンサンプリング部12a~12mでは、帯域フィルタ11a~11mから供給される帯域分割された信号を数分の1に間引く処理が行われる。

【0022】
各分割帯域のダウンサンプリング部12a~12mでダウンサンプリングされた信号は、関数近似部20に供給される。この関数近似部20は、分割された帯域ごとに、関数近似部21a~21mを備えている。そして、それぞれの関数近似部21a~21mで、帯域分割された各信号の関数近似処理が行われ。その関数近似処理に用いられたパラメータが出力される。なお、関数近似の具体的な処理例については、図7~図13に基づいて後述する。

【0023】
それぞれの帯域で関数近似して得られるパラメータ(後述)は、帯域ごとに個別に用意された量子化ビット割当て部31a~31mに供給され、それぞれのパラメータの値に応じた量子化ビット数の割当てがなされる。

【0024】
ここで、量子化ビットの割当てについて、詳しく説明しておく。言うまでもなく、量子化とは、アナログ信号値をデジタル値に変換することである。一般に、オーディオ(音響)信号の場合、アナログ信号の実数値(小数点以下の数値あり)を±0~65535(16ビット)の整数値に変換する。
本発明においては、音響信号値の代わりに関数近似した係数値が、上記アナログ信号値に相当する実数値となる。つまり、この係数値を16ビットのデジタル値に変換することが本発明における量子化を意味している。このとき係数値は、例えば図2Aに示す低音域信号に対して多項式近似を行った場合、数1式のような近似式で近似される。

【0025】
【数1】
JP0005224219B2_000002t.gif
ここでxはサンプリング番号であり、サンプリング周波数が44.1kHzであるから、サンプリング番号xを時間tに変換すると、x=t/(22.7μs)となる。したがって、数1式を時間tの関数として数2式のように書き換えることができる。

【0026】
【数2】
JP0005224219B2_000003t.gif
この式は、図2Bに示す低音域信号の近似多項式曲線を示す式であり、数2式からわかるように、この式の係数値の範囲は102(2)~1013(240)に及ぶ極めて広範囲なものとなる。したがって、例えば4次および3次の係数は10-8/4(2-32)倍、2次及び1次の係数は(2-16)倍、0次の係数は1倍にスケール変換を行うと、この変換により上式は、数3式に示すように変換される。

【0027】
【数3】
JP0005224219B2_000004t.gif
この数3式からわかるように、
4次の係数:(17532)10=(447C) → 32ビットシフト
3次の係数:(79.6)10=(50) → 32ビットシフト
2次の係数:(672.9)10=(2A1) → 16ビットシフト
1次の係数:(14.7)10=(F) → 16ビットシフト
0次の係数:(318.02)10=(13E) → 0ビットシフト(シフトなし)
となり、全ての係数値を16ビットの値で表すことができる。なお、下付文字「10」は10進数を表し、「H」は16進数を表している。
この結果、4次の係数(447C)は16ビット、3次の係数(50)は8ビット、2次の係数(2A1)は12ビット、1次の係数(F)は4ビット、0次の係数(13E)は12ビットの割り当てとなる。この割当てを行うのが、図1の量子化ビット数の割当て部31a~31mである。

【0028】
量子化ビット割当て部31a~31mで量子化ビットが割り当てられた信号は、符号化部3に送られ、符号化部3で全ての帯域の信号に対して符号化される。そして、この符号化されたデータは、ビットストリーム形成部4に供給され、決められた形式のビットストリームデータとして出力される。ビットストリーム形成部4は、後述するように、必要に応じて、サイド情報符号化部5で符号化されたサイド情報が付加されたビットストリームを形成する。

【0029】
サイド情報符号化部5で符号化されるサイド情報は、例えばフィルタバンク10で分割させた各帯域の周波数帯域に関する情報や、量子化ビット割当て部31a~31mで割り当てたビット数の情報など、符号化に関連した各種情報が含まれる。ここで、フィルタバンク10からサイド情報符号化部5に与えられる情報は、帯域分離した帯域を示す番号(図3で示すバンク番号)であり、関数近似部20からサイド情報符号化部5に与えられる情報は、関数形式と関数の次数に関する情報である。また、量子化ビット割り当て部31a~31mからは、上述した係数値のスケール変換におけるシフト量、係数のビット幅、係数データが与えられる。このような、サイド情報が付加されて形成されたビットストリームデータは、例えば図3に示されるようなものとなる。

【0030】
図3に示されるように、ビットストリームデータは、帯域番号を示すバンク番号(6ビット)、標本化関数近似か多項式関数近似かを示す関数形式(1ビット)、標本化関数の微分可能回数(m-1)の最大値を示す次数(3ビット)、シフトする量が0ビット、8ビット、16ビット、32ビットのいずれであるかを示すシフト量(2ビット)、ビット幅が0、1、2、3のいずれであるかを示すビット数(2ビット)及び、係数値(ビット数0~16)からなるデータ構造を持っている。

【0031】
また、必要により誤り検出符号や誤り訂正符号をビットストリーム形成部4内で生成させて、その生成された誤り検出符号又は誤り訂正符号を、ビットストリームに付加する。
このようにしてビットストリーム形成部4から出力されたビットストリームデータ(図3参照)は、例えば各種伝送路を経由して受信側に伝送されるか、各種記憶媒体に記憶される。また、ここでビットストリームデータを記憶する記憶媒体としては、符号化装置が備える記憶手段以外にも、外部の何らかのデータベースなどを利用するようにしてもよい。

【0032】
[符号化される信号の波形例の説明]
図4は、図1に示される符号化装置で処理されるオーディオ信号の例を示した図である。
図4A~図4Dは、それぞれ横軸を時間(秒)とし、縦軸をレベルで示してある。
まず、図4Aに示すような元のアナログオーディオ信号(原信号)がアナログデジタル変換回路2に供給される。アナログデジタル変換回路2は、この与えられたアナログオーディオ信号を所定周期でサンプリングすることにより、図4Bに示すサンプリング信号を出力する。なお、図4Bに示したサンプリング信号は、図4Aに示したアナログオーディオ信号波形と同じ波形を点線で示しているが、これは、非常に短いサンプリング周期でサンプリングしたサンプリング点の集合を意味している。

【0033】
この図4Bに示したサンプリング信号は、フィルタバンク10の帯域フィルタ11a~11mで帯域分離されて、図4Cに示すような周波数分離信号となる。この周波数分離信号は、それぞれの帯域フィルタ11a~11mの周波数帯域ごとの信号であり、図4Cの例では、3つの周波数成分(すなわち、m=3)に分離した例が示されている。
図4Cに示す3つの周波数成分の信号は、フィルタバンク10のダウンサンプリング部12a~12mでダウンサンプリングされて、図4Dに示すように、それぞれの周波数成分ごとに間引かれたサンプリング値となる。そして、この周波数成分ごとにダウンサンプリングされたサンプリング値が、関数近似部20で関数近似される。

【0034】
[帯域分割の処理例の説明]
次に、図1に示したフィルタバンク10の帯域フィルタ11a~11mにおける帯域分割処理の例について説明する。
本例においては、区分多項式で表される標本化関数ψ(k)をインパルス応答関数として基本フィルタを形成する。そして、この基本フィルタを、例えば後述するような従来から知られた余弦変調をすることによって、周波数帯域が所定周波数だけシフトされた帯域フィルタ11a~11mを得る。ここで、この区分多項式で表される標本化関数ψ(k)は、本発明者らによる研究で得られたフルーエンシ情報理論を利用したものである。

【0035】
図5は、フィルタバンク10の中の帯域フィルタ11a~11mの構成例を示した図である。まず、入力オーディオ信号を、遅延素子81a,81b,81c,・・・,81nで順次遅延させる。例えば、帯域1の信号を抽出するための帯域フィルタ11aでは、図5に示すように、遅延素子81a~81nからの各遅延位置の信号を取り出し、これを異なる係数乗算器91a~91nに供給する。そして、係数乗算器91a~91nで係数が乗算された各遅延位置の信号が加算器92で加算され、この加算器92の出力が帯域1の信号として出力される。
また、帯域2の信号を抽出する帯域フィルタ11bから帯域M(ここではM個の帯域に分割するものとする)の信号を抽出する帯域フィルタ11mも、帯域フィルタ11aと同様に構成され、それぞれの帯域フィルタから帯域2~帯域Mの信号が得られる。

【0036】
ここで、具体的な余弦変調の例を示すと、この余弦変調では、全周波数をM等分して、i番目の周波数帯域を抽出する場合、その係数は、下記の数4式で与えられる。

【0037】
【数4】
JP0005224219B2_000005t.gif

【0038】
ここで、ψ(k)は、図6に示すフルーエンシ標本化関数のk番目の節点の値である。図6の横軸は時間(t)であり、各節点及び節点間の値は次式で定義される。

【0039】
【数5】
JP0005224219B2_000006t.gif

【0040】
[関数近似の処理例の説明]
次に、図1の関数近似部20で関数近似を行う処理例を、図7、図8を参照して説明する。
本例においては、まず、図1に示すダウンサンプリング部12a~12mでダウンサンプリングされた信号に対して、関数近似を行い、その関数のパラメータを圧縮信号値としている。但し、ここで行われるダウンサンプリングは、本例のオーディオ信号圧縮方法を実現する上で、必ず必要とされるものではない。したがって、ダウンサンプリングと関数近似とは、密接不可分の関係するわけではなく、ダウンサンプリングしていない信号に対して、関数近似するようにしてもよい。勿論、元の信号を1/Mにダウンサンプリングすることで、信号量を1/Mに削減できるので、データ量を削減する上では、ダウンサンプリングをすることが好ましいといえる。

【0041】
また、本例では、帯域分割された信号列を関数近似する場合、例えば、帯域分割された信号の任意の区間を、それぞれの周波数帯域ごとにn次多項式で近似している。ここで、任意の区間とは、図4Dで説明すると、例えば最小周波数の極値間、つまり極大値から極小値までの1/2周期に当たる期間であり、本例では、この区間(極値間)を、周波数帯域ごとに異なるn次多項式で近似するのである。なお、極大値または極小値に代えて変曲点をとって、極大値と変曲点間あるいは変曲点と極小値間を、周波数帯域ごとに、異なるn次多項式で近似するようにしてもよい。

【0042】
図7は、それぞれの周波数帯域ごとにn次多項式で近似した例を示したものである。つまり、図7は、図4Dに示した3つの帯域のダウンサンプリングされた信号の先頭部分(区間0から区間0.12までの区間)の信号に対して、2次及び3次の多項式で近似した例を示している。図7の◇印は、最も低い帯域(帯域1)を表し、□印は二番目に低い帯域(帯域2)を表し、△印は、3番目に低い帯域(帯域3)を表している。これらのグラフを定式化すると数6式のようになる。

【0043】
【数6】
JP0005224219B2_000007t.gif

【0044】
なお、この多項式近似は、数7式で示されるような、微分可能回数(m-1)で分類されるフルーエンシ標本化関数ψ(t)の線形結合式で表される。

【0045】
【数7】
JP0005224219B2_000008t.gif

【0046】
この数7式の多項式の係数a,b,c,d,・・・は、ビットストリーム全体を多項式で示したときの係数値であり、図1の関数近似部21a~21mにおいて生成される。そして、この関数近似部21a~21mにおいて生成されたデータに対して、上述したように、量子化ビット数割当部31a~31mで量子化ビット数が割り当てられ、符号化部3で符号化が行われる。図8A~図8Dは、単一の標本化関数ψ(t)でデータ間の関数近似を示した図である。

【0047】
すなわち、図8Aに示すψ(t)(m=0)は、定数であり、微分できない関数である。つまり、微分可能回数(m-1)を計算すると「-1」となり意味を成さない数字となってしまう。実際に、この標本化関数ψ(t)は、矩形パルスとなり、各サンプル値のレベルが、そのまま次のサンプル値の直前まで引き継がれる。
また、図8Bに示すψ(t)(m=1)は、微分可能回数(m-1)=0となる関数であり、これは図から判るように、サンプル値で微分不可となる関数となる。つまり、標本化関数ψ(t)は三角波形状となり、2つの直線の接合点(各三角波の頂点に対応するサンプル点)では、微分できない。この標本化関数ψ(t)は、図8Bに示されるように、各サンプル値間を直線近似する関数である。

【0048】
図8Cに示すψ(t)(m=2)は、(m-1)=1となる1回微分可能な2次関数であり、各サンプル値間が2次曲線で近似される。以下同様に次数が増えるごとに、各サンプル値の間の値を補間するための曲線が変形していき、図8Dに示すように、ψ(t)での値が示されることになる。なお、次数が増えるにしたがって、補間値がより正確になることは言うまでもない。

【0049】
このように、数7式による関数近似を、所定の次数まで行い、各標本化関数ψ(t)の係数値であるa、b、c、d、・・・(「圧縮信号のパラメータ」ともいう。)を、図1に示した関数近似部20から取出し、上述したように符号化部3で符号化する。
なお、その他の圧縮信号のパラメータとしては、図1のサイド情報符号化部5に与えられる「サイド情報」が考えられる。図3にビットストリームデータのデータ構造を示したが、このビットストリームデータには、極値点間の時間(例えば曲のオーディオ信号の開始からの相対時間)やサンプリング点番号を含めていない。しかし、不均等間隔のデータを圧縮する場合は、このようなサイド情報を、図3のビットストリームデータに追加することにより実現可能となる。

【0050】
[異なる関数近似の処理例の説明]
次に、図6~図8で説明した関数近似とは異なる関数近似の例を、図9~図13を参照して説明する。この場合、図1の関数近似部20に供給される帯域ごとに分割された信号の処理が異なるだけであり、他の構成部分の処理は変わらない。

【0051】
この例では、2次の標本化関数ψ(t)を変形した、標本化関数ψ(t)を用いるとする。この標本化関数ψ(t)は、数8式で定義される。
【数8】
JP0005224219B2_000009t.gif
この数8式において、f(t)は基本項であり、c(t)は制御項である。図9は、この基本項f(t)と制御項c(t)との関係を示した図である。この標本化関数は、図9に示すような基本波形である基本項f(t)の波形と、制御項c(t)の波形との加算信号として、それぞれのサンプル点の値が示される。ここで、制御項c(t)は、図9に示されるように、t=0、±1、±2で値が「0」となってレベルが上下する関数である。

【0052】
ここで、基本項f (t)は、微分可能性に着目した有限台の区分多項式関数であり、例えば全域において1回だけ微分可能な関数である。つまり、横軸に沿った標本位置tが-1から+1 (区間[-1、1])にあるときに、0以外の有限な値を有し、他の区間では恒常的に0で表される関数である。なお、「有限台」の関数とは、関数値が局所的な領域(標本位置を除く)の全部あるいは一部において0以外の有限の値を有し、それ以外の領域では0となる関数をいう。

【0053】
すなわち、基本項f(t)は、区間[-1,1]内を2以上に区分した各区間において、それぞれn次多項式関数で表され、各小区間の境界で連続(値と傾きのそれぞれが連続)な関数となっている。この基本項f(t)は、全範囲で(m-1)回(mは2以上の整数)だけ微分可能な凸形状の波形形状を示している。そして、t=0の標本位置でのみ「1」になり、t=±1に向けて「0」に収束し、t=±1からt=±2の標本位置までは、「0」値を維持するという特徴を有している。なお、この基本項f(t)は、有限台のインパルス応答波形の関数でもよく、あるいは、標本位置区間の任意の位置で少なくとも1回微分可能で連続なn次の区分多項式関数でもよい。例えば、1具体例であるが、2次の区分多項式関数で表した基本標本化関数f(t)は、数9式で表される。

【0054】
【数9】
JP0005224219B2_000010t.gif

【0055】
次に、制御項c(t)について説明する。制御項c(t)は、図9に示されるように、c(t)=c(t)+c(-t)で表される。このc(t)を例えば2次の区分多項式で表すと、数10式のようになる。

【0056】
【数10】
JP0005224219B2_000011t.gif

【0057】
この制御項c。(t)=c(t)+c(-t)を用いて各離散データに基づく重ね合わせを行うことにより、離散データ間の値を仮補間することができる。このようにして、基本項f(t)に基づいて算出した仮の補間値と、制御項c。(t)に基づいて算出した仮の補間値を線形加算することにより、離散データ間の任意の点における値を補間することができる。

【0058】
図10は、標本化関数ψ(t)の制御項c(t)にかかる係数αを変えたときの、標本化関数ψ(t)の時間特性の変化を示した図である。このように、制御項c(t)に乗算する係数αをどのように設定するかにより、最終的に得られる標本化関数の時間特性を制御することができる。
図10では、係数α=-1.5、係数α=-0.25、係数α=1.5の3つの例を示してある。図10に示されるように、係数αを変化させると標本化関数ψ(t)が大きく変化することが判る。

【0059】
例えば、可変パラメータαを-1.5、-0.25、1.5の順に変化させてゆくと、-2≦t≦-1の領域と、1≦t≦2の領域では、標本化関数ψ(t)の関数値が次第に増加し、波形の極性が反転することが判る。一方、-1≦t≦0の領域と、0≦t≦1の領域では、標本化関数ψ(t)の関数値が次第減少し、波形の極性が反転している。

【0060】
図11は、制御項c(t)の係数αの違いによる標本化関数ψ(t)の周波数特性を示したものである。図11の横軸は周波数、縦軸はゲイン[dB]である。
このように、標本化関数ψ(t)を基本項f(t)と制御項c(t)とに分離した構成として示し、制御項c(t)の係数αを調整することにより、標本化関数の特性を変化させることが可能である。

【0061】
図11は、例えばCDに記録された音楽を再生する場合の標本化関数ψE(t)の周波数特性を示している。図11から判るように、α=-0.25のときの基準となる特性は、CDのサンプリング周波数44.1kHzまで緩やかに減少する特性となっているが、αを1.5あるいは-1.5と変化させると、高周波で増幅され、全周波数領域でフラットな周波数特性を持っている。また、低周波域においてα=-0.25の場合に比べ、α=1.5の場合は増幅度が減少し、α=-1.5の場合は増幅度が増加している。このことは、音楽において低音域を絞る場合、あるいは低音域を強調したい場合に有効な特性と言える。このように、α値を変更することで高周波域の特性を増幅し、全領域フラットな特性とすることができるとともに、αを+、-に設定することで、低音域の増幅度(ゲイン)の増減(すなわち低音を利かせるか、高音を利かせるか)の調整が可能となり、ユーザの好みに合った特性とすることが可能となる。

【0062】
図12A~図12Bは、サンプル値毎に制御項c(t)の係数値αが異なる標本化関数ψ(t)(α~αの4つの係数値)を用いて、オーディオ信号の任意の信号区間、例えば極値間(サンプル値x~x(時間t~t)の期間)を補間する方法を説明するための図である。このように、それぞれの標本化関数でサンプル値x~x(時間t~t)の期間の波形を関数近似して、これを加算した値が、元のオーディオ信号波形を近似したものとなる。

【0063】
すなわち、図12Aに示すように、時間t,t,t,t,t,tでそれぞれサンプル値x,x,x,x,x,xが得られたとする。ここでは時間tから時間tまでの信号波形が、ほぼ正確に近似されることを示す。図12の例では、時間tでの標本化関数ψ(t)の制御項c(t)の係数をα、時間tでの制御項c(t)の係数をα、時間tでの制御項c(t)の係数をα、時間tでの制御項c(t)の係数をαとしている。

【0064】
このとき、時間tから時間tまでの信号波形は、この4つの信号の時間tから時間tまでの区間の波形を加算したものとなる。他の2つのサンプル点間の信号波形についても、それぞれ対応した4つの標本化関数ψ(t)の加算値となる。
この加算信号は、数11式で示されるようになる。
【数11】
JP0005224219B2_000012t.gif
このように、各サンプル値間(区間)の信号y(t)は、標本化関数ψ(t)を加算することによって正確に示すことができる、良好に圧縮された信号とすることができる。

【0065】
ここで、標本化関数ψ(t)の制御項c(t)の係数αは、それぞれ適切な値を選定する必要があるが、リアルタイムに入力されるオーディオ信号の先頭位置で正確な係数αを算出するのは困難であるため、先頭位置の係数αについては、固定値αとするようにしてもよい。

【0066】
図13は、入力された一般的なデジタル信号列を示した図である。図13に示すように、上記信号列において、極値は、縦の太線で示すように、t=[0,0.06,0.16,0.26,0.34,0.44]に存在しているとする。
信号列の開始時点、すなわちt=0においては、係数αは固定値α(例えば均等間隔の信号再生に最適な標本化関数に一致する係数値α=-0.25)とし初期化しておく。

【0067】
ここで、数8式で示す標本化函数ψ(t)を時間τだけシフトしたψ(t—τ)は、t=τのとき標本化関数値がψ(0)と同じ値となり、標本値との畳み込み演算が可能となる。以下、この畳み込み演算について説明する。ここでは、時間区間[τ、τk+1]における入力信号値y(t)を標本化関数ψ(t)で補間する場合を考える。この時、本発明者らが提唱したフルーエンシ理論では区間端の2点の標本値y)、yk+1)と区間前後の2点の標本値yk-1)、yk+2)の4点の標本値を用いて、数12式により入力信号を近似する。

【0068】
【数12】
JP0005224219B2_000013t.gif

【0069】
この数12式において、第4項のψ(t-τk+2)yk+2)は、区間[τ、τk+1]における信号y(t)への影響が小さいため、これを省略し、数13式に示すような逐次演算可能な形の近似式とする。

【0070】
【数13】
JP0005224219B2_000014t.gif

【0071】
この数13式において、未知標本化函数(αが未知)は、第3項のψ(t-τk+1)にある。すなわち、区間[τ、τk+1]の入力信号を、数13式の値で近似して同定しようとする考え方である。
ψ(t-τk-1)、ψ(t-τ)が、予め求められていれば、数13式から、数14式を求めることができる。すなわち、時間tにおける実際の標本値y(t)とすると、t=τk-1の標本値yk-1)とt=τの標本値y)を用いて、数13式は数14式のように変換することができる。数14式のΔy(t)が、ここで求めたいψ(t-τk+1)yk+1)となる。

【0072】
【数14】
JP0005224219B2_000015t.gif

【0073】
ここで、数8式を用いて、標本化関数ψ(t-τk+1)=f(t-τk+1)+αk+1c(t-τk+1)と置くと(αk+1は未知数)、数15式が得られる。
【数15】
JP0005224219B2_000016t.gif
この数15式において、f(t-τk+1)は基本項成分で既知関数であるから、Δy(t)から差し引いた値である制御項成分をΔx(t)とすると、Δx(t)は数16式で表される。
【数16】
JP0005224219B2_000017t.gif

【0074】
そこで、数16式の近似誤差をε(t)とすると、下記数17式が成立する。
【数17】
JP0005224219B2_000018t.gif

この数17式から、区間[τ、τk+1]の近似誤差ε(t)を全ての入力点に対して求め、この区間[τ、τk+1]内のn点(全点が望ましい)について作り、数18式によりn個のε(ti)の2乗和Εを求める。
【数18】
JP0005224219B2_000019t.gif

このEを最小にするαk+1が最少二乗誤差近似の曲線に対するαk+1となる。すなわち、Eを最小とするαk+1は、数19式が成立するときであり、数20式で求められる。
【数19】
JP0005224219B2_000020t.gif
【数20】
JP0005224219B2_000021t.gif

【0075】
上記数20式により制御項の係数であるαk+1が決定されると、こんどは数21式を用いて、区間[τ、τk+1]の信号をt=τk+1の時に最少近似誤差で再生することができる。
【数21】
JP0005224219B2_000022t.gif

【0076】
次に、区間[τ、τk+1]が、[0、0.06](図13のt=0の標本点とt=0.06の標本点の間、つまりτ=0、τk+1=0.06)であるとして、その間の標本値y(t)を計算する。
なお、この区間[0、0.06]を対象とした場合には、τk-1は存在しないので、ya(τk-1)=0とする。ここで数20式において、i=1,2,3の3点が対象になる。

【0077】
数20式のΔy(t)に、t=0の時の入力信号y(0)を代入すると、Δy(t)は、入力信号ya(t)から(f(t)+α*c(t))*y(0)を引いた値となる。
一方、制御項であるΔx(t)は、τk+1=0.06であるから、数16式から、
Δx(t)=Δy(t)-f(t-0.06)*y(0.06)
と計算され、Δy(t)は、数15式から
Δy(t)={f(t-0.06)+α(t-0.06)}*y(0.06)
となる。
このΔy(t)をΔx(t)の式に代入すると、
Δx(t)=Δy(t)-f(t‐0.06)*y(0.06)
=α*c(t-0.06)*y(0.06)
となり、上記関係をt=t(i=1、2、3)に当てはめて、誤差函数ε(t)の2乗和を最小にするαの方程式を作ることができる。ここで、未知数はαのみなので、数20式からαを求めることができる。
同様にして、t=0.16の時のデータが入力されたとき、区間[0.06、0.16]のデータから、次の係数αを決定することができ、順次、係数αを求めていくことができる。係数αが求まれば、その対象となった時間区間のデータが、関数近似されたことになる。

【0078】
一般に、特性可変な未知パラメータを持つ標本化関数Ψ(t)(本発明ではΨ(t)=ψ(t))が与えられた時、時間tが区間[τ、τk+1]における入力信号y(t)に対して、
【数22】
JP0005224219B2_000023t.gif
として近似式を与え、上式が最少二乗誤差で近似されるようにΨ(t-τk+1)の未知パラメータを同定することが可能である。本発明のようにΨ(t)=f(t)+αc(t)の形式で表される標本化関数の場合は、数23式により未知パラメータαを同定する。この23式は上述した数20式と同じものである。
【数23】
JP0005224219B2_000024t.gif
これにより、圧縮データとしては、[y(k),α、τ]を、1つの区間のデータとすることが可能となり、元のサンプルデータ数よりも非常に少ないデータとすることができる。

【0079】
また、このように符号化された信号を再生する場合には、[y(k),α、τ]の圧縮データから関数演算により、時間tが区間[τ、τk+1]において、数24式により、関数補間することができる。
【数24】
JP0005224219B2_000025t.gif
すなわち、信号y(t)が原信号y(t)に対して最少二乗誤差で近似され、高精度に復元補間された再生信号として出力することができる。

【0080】
[復号化処理のためのブロック構成図の説明]
図14は、図1に示す符号化装置において処理され、符号化された信号を復号化するための復号化装置のブロック構成図である。
図14に示すように、図1のビットストリーム形成部4で符号化されたビットストリームは、ビットストリーム入力部51に供給され、ビットストリームに付加された誤り検出符号又は誤り訂正符号を使用した誤り検出処理又は誤り訂正処理が行われる。

【0081】
そして、入力されたビットストリームから、圧縮関数のパラメータ(各標本化関数ψ(t)の係数値であるa、b、c、d、・・・)の符号化データが、復号化部52に供給され、各帯域ごとのパラメータが復号化される。このパラメータの復号化の際には、サイド情報複合部55からのサイド情報が参照されるが、このサイド情報は、前述のように、図1のフィルタバンク10からサイド情報符号化部5に与えられる情報である。つまり、帯域分離した帯域を示す番号(図3で示すバンク番号)や、関数近似部20からの関数形式と関数の次数に関する情報などである。このサイド情報は、ビットストリーム入力部51で分離され、サイド情報復号部55に供給され、復号化される。

【0082】
この復号化部52で復号化された各帯域のパラメータは、逆量子化部53a~53mに供給されて、それぞれ逆量子化が行われる。そして、逆量子化部53a~53mで逆量子化された各パラメータが、関数補間部54a~54mに供給され、この関数補間部54a~54mで、各帯域のサンプル点の値が復元される。ここで、関数補間部54a~54mの処理は、図1に示した符号化装置側の関数近似部21a~21mでの近似処理と逆の処理となる。

【0083】
更に、各関数補間部54a~54mの出力は、フィルタバンク60内のアップサンプリング部61a~61mに供給され、このアップサンプリング部61a~61mで、図1に示した符号化装置側のダウンサンプリング部12a~12mでの処理とは、逆の処理が行われる。このアップサンプリングされた各帯域の出力は、サブバンド合成フィルタ62に供給されて、1系統のデジタルオーディオ信号に合成される。そして、得られたデジタルオーディオ信号がデジタル/アナログ変換器56に供給され、デジタル/アナログ変換器56で変換されたアナログオーディオ信号が、出力端子57から出力される。
このようにして、符号化時と逆の復号化処理を行うことで、良好に元のオーディオ信号を復元することができる。

【0084】
<第2の実施形態例の説明>
次に、図15に基づいて、本発明の第2の実施形態例について説明する。図1と異なるところは、フィルタバンク10の部分だけであり、それ以外の関数近似部20、量子化ビット割当て部31a~31m、符号化部3、ビットストリーム形成部4、サイド情報符号化部5は、図1に示した第1の実施形態例と同じであるので、同一符号を付して、説明は省略する。

【0085】
まず、図15を参照して、本発明の第2の実施形態例における符号化装置の全体構成例について説明する。図15に示すように、オーディオ信号源1からのアナログオーディオ信号は、アナログ/デジタル変換器2に供給されている。これは、図1の実施形態例と同様である。デジタル・アナログ変換器2から出力されるデジタルオーディオ信号は、フィルタバンク10に供給される。このフィルタバンク10は、デジタルオーディオ信号を複数の帯域の信号成分に分割するものであるが、この分割の仕方が図1に示した第1の実施形態例とは異なっている。

【0086】
第2の実施形態例である図15に示すフィルタバンク10も、図1と同様に周波数帯域を分割する分割数に対応した数の帯域フィルタ11a~11m(mは任意の整数:ここでは分割数に対応した数)を備える。そして、それぞれの帯域フィルタ11a~11mは、例えば、区分多項式で表される標本化関数ψ(k)をインパルス応答関数として、基本フィルタを構成して、帯域分割するものである。

【0087】
まず、第2の実施形態例では、第1の周波数帯域の信号が帯域フィルタ11aで分離される。そして、この帯域フィルタ11aで分離された信号とアナログ/デジタル変換器2から供給された元のオーディオ信号が減算器13aに供給され、減算器13aで元のオーディオ信号から帯域フィルタ11aで分離された信号が減算される。そして、減算器13aからの信号が、帯域フィルタ11bに送られ、第2の周波数帯域の信号が分離される。

【0088】
以下、同様に、各帯域フィルタ11b,11c・・・の出力を、次の帯域の帯域フィルタの前段の減算器13b,13c・・・に供給して、アナログ/デジタル変換器2から供給されたデジタルオーディオ信号から減算し、その減算信号を帯域フィルタに供給する構成とする。なお、この減算器の接続構成はあくまでも一例であり、後述する図16~図19に示すように他の構成により減算処理を行うようにしてもよい。

【0089】
それぞれの帯域フィルタ11a~11mで帯域分割された信号は、それぞれの帯域の信号ごとに個別のダウンサンプリング部12a~12mに供給されて、サンプリング数を例えば数分の1に間引くダウンサンプリング処理がなされる。
各分割帯域のダウンサンプリング部12a~12mでダウンサンプリングされた信号は、関数近似部20に供給され、図1と同様に、分割帯域ごとに関数近似部21a~21mで、関数近似処理が行われる。以下、図1の説明と同じであるから、その説明は割愛する。

【0090】
次に、図16に基づいて、第2の実施形態例に用いられる帯域分離フィルタの第1の変形例の構成について説明する。
図16に示すように、端子10aには、図1に示したアナログ/デジタル変換器2が出力するデジタルオーディオ信号、又は外部から入力されたデジタルオーディオ信号が入力される。
この端子10aに入力されるデジタルオーディオ信号は、第1帯域分離フィルタ11aに供給されて、第1帯域の信号成分が抽出される。この第1帯域の信号は、ダウンサンプリング部12aによりダウンサンプリングされる。そして、ダウンサンプリングされた第1帯域の信号が、関数近似部20内の関数近似部21aに供給されて、関数近似される。

【0091】
また、第1帯域分離フィルタ11aが出力する第1帯域のデジタルオーディオ信号は、減算器13aに供給される。減算器13aは、端子10aに入力されるデジタルオーディオ信号から、第1帯域分離フィルタ11aが出力するデジタルオーディオ信号を減算して、これを第2帯域分離フィルタ11bに供給する。そして、第2帯域分離フィルタ11bにおいて抽出された第2帯域の信号成分がダウンサンプリング部12bでダウンサンプリングされた後、関数近似部21bに供給され、関数近似される。

【0092】
同様に、減算器13bには、減算器13aからの差分信号と、第2帯域分離フィルタ11bから出力される第2帯域のデジタルオーディオ信号が供給され、減算器13bから、減算器13aの出力から第2帯域分離フィルタ11bからの第2帯域の信号が減算された信号が出力される。そして、減算器13bからの出力が、ダウンサンプリング部12cでダウンサンプリングされて、第3帯域の信号として、関数近似部21cで関数近似される。

【0093】
図16に示す回路構成で帯域分割して関数近似すると、それぞれの帯域分割した信号として、各周波数帯域の端部での信号成分の重なりがない、より良好な帯域分割を行うことができる。すなわち、第2帯域の信号成分を第2帯域分離フィルタ11bで抽出する際には、第2帯域分離フィルタ11bの前段の減算器13aで、既に第1帯域の信号成分が除去されているので、第1帯域の信号成分が加わることがなく、信号成分の重なりを効果的に除去できるのである。第2帯域と第3帯域との重なりについても、同様に除去される。

【0094】
次に、図17に基づいて、本発明の第2の実施形態例に用いられる帯域分離フィルタの第2の変形例の構成について説明する。
図17に示すように、入力端子10aに得られるデジタルオーディオ信号は、第1帯域分離フィルタ11aに供給されて、第1帯域の信号成分(低音域信号成分)が抽出される。この第1帯域の信号は、ダウンサンプリング部12aによりダウンサンプリングされ、続いてダウンサンプリングされた第1帯域の信号が関数近似部21aで関数近似される。

【0095】
また、端子10aに得られるデジタルオーディオ信号は、第3帯域分離フィルタ11cに供給され、第3帯域の信号成分(高音域信号成分)が抽出される。この第3帯域の信号は、ダウンサンプリング部12cによりダウンサンプリングされ、このダウンサンプリングされた第3帯域の信号が、関数近似部21cに供給されて関数近似される。

【0096】
図17に示す、第2の変形例では、第2の帯域の信号を抽出する方法に特徴がある。すなわち、第1帯域分離フィルタ11aが出力する第1帯域の低音域のデジタルオーディオ信号と、第3帯域分離フィルタ11cが出力する第3帯域の高音域のデジタルオーディオ信号が、加算器14aで加算される。そして、この加算器14aの加算出力が、減算器14bに供給されて、入力されるデジタルオーディオ信号から減算される。

【0097】
減算器14bで、上述のような減算処理を行うことにより、端子10aに得られるデジタルオーディオ信号から、第1帯域の信号(低音域信号)と第3帯域の信号(高音域信号)が減算されるため、減算器14bからは、第2帯域の信号成分(中音域信号)だけが取り出されることになる。
そして、この減算器14bの出力である第2帯域の信号が、ダウンサンプリング部12bでダウンサンプリングされた後、関数近似部21bに供給されて関数近似がなされる。

【0098】
この図17に示すように帯域分割して関数近似する場合にも、それぞれの帯域分割した信号として、各周波数帯域の端部での信号成分の重なりがない、良好な帯域分割を行うことが可能となる。

【0099】
次に、図18に基づいて、本発明の第2の実施形態例に用いられる帯域分離フィルタの第3の変形例について説明する。
図18に示すように、端子10aから入力されるデジタルオーディオ信号は、第1帯域分離フィルタ11aに供給され、第1帯域の信号成分が抽出される。そして、この第1帯域の信号がダウンサンプリング部12aによりダウンサンプリングされた後、関数近似部21aで関数近似される。

【0100】
この関数近似部21aで関数近似されたデジタルオーディオ信号は、関数補間部22aに供給され、元のデジタルオーディオ信号に復元され、更にアップサンプリング部24aで元のサンプリング周期に戻される。そして、元のサンプリング周期に戻された信号が減算器15aに供給される。

【0101】
減算器15aでは、端子10aから与えられるデジタルオーディオ信号から、上記アップサンプリング部24aが出力するデジタルオーディオ信号が減算される。そして、この減算器15aの出力が、第2帯域分離フィルタ11bに供給されて、第2帯域の信号成分が取り出される。この第2帯域の信号は、ダウンサンプリング部12bによりダウンサンプリングされた後、関数近似部21bで関数近似される。

【0102】
同様に、関数近似部21bの出力は、関数補間部22bで元のデジタルオーディオ信号として復元され、更にアップサンプリング部24bで元のサンプリング周期に戻される。そして、元のサンプリング周期に戻された信号が、減算器15bに供給される。

【0103】
減算器15bでは、減算器15aからのデジタルオーディオ信号から、アップサンプリング部24bでアップサンプリングされたデジタルオーディオ信号が減算され、その減算器15bの出力から、第3帯域の信号成分が取り出される。そして、この第3帯域の信号がダウンサンプリング部12cによりダウンサンプリングされた後、関数近似部21cで関数近似される。

【0104】
この図18に示すような回路構成のもので、関数近似した信号を元の信号から減算する方法を用いても、各帯域分割した信号は、各周波数帯域の端部での信号成分の重なりがない、良好な帯域分割信号となる。

【0105】
次に、図19に基づいて、本発明の第2の実施形態例に用いられる帯域分離フィルタの第4の変形例について説明する。
図19に示すように、端子10aから与えられるデジタルオーディオ信号は、第1帯域分離フィルタ11aに供給され、第1帯域の信号成分(低音域信号成分)が抽出される。この第1帯域の信号は、ダウンサンプリング部12aに送られてダウンサンプリングされた後、関数近似部21aで関数近似される。

【0106】
同様に、端子10aから与えられるデジタルオーディオ信号は、第2帯域分離フィルタ11bに供給され、第2帯域の信号成分(中音域信号成分)が抽出される。そして、この第2帯域の信号は、ダウンサンプリング部12bでダウンサンプリングされた後、関数近似部21bで関数近似される。

【0107】
図19に示す第4の変形例では、第3の帯域信号を取り出す方法に特徴がある。すなわち、関数近似部21aから得られる第1帯域の関数近似値と、関数近似部21bから得られる第2帯域の関数近似値が、それぞれ、関数補間部22a、22bで復元された後、これら復元された2つの帯域の信号が加算器16で加算される。そして、加算器16の出力がアップサンプリング部17でアップサンプリングされて、減算器18に供給される。

【0108】
そして、減算器18において、端子10aに得られるデジタルオーディオ信号から、アップサンプリング部17の出力が減算される。この減算によって、端子10aからのデジタルオーディオ信号から、第1帯域の信号(低音域信号)と第2帯域の信号(中音域信号)が減算されることになり、結果として、減算器18からは第3帯域の信号成分(高音域信号)だけが抽出されることになる。
そして、この減算器18から得られる第3帯域の信号は、ダウンサンプリング部12cでダウンサンプリングされた後、関数近似部21cにおいて関数近似される。

【0109】
図19に示すような帯域分割方法により帯域分割した信号を関数近似する場合でも、それぞれの帯域分割した信号として、各周波数帯域の端部での信号成分の重なりがない、良好な帯域分割信号が得られる。

【0110】
なお、図16~図19に示す変形例では、いずれも3つの帯域に分割する例について説明したが、これらの各変形例の処理を3つ以上の更に多く帯域分割に適用できることは言うまでもない。つまり、帯域分割数を拡大して、4つ以上の帯域に分割する回路構成としてもよい。また、図16~図19の各変形例では、ダウンサンプリング部及びアップサンプリング部を破線で示しているが、これは、これらのダウンサンプリング部及びアップサンプリング部が本発明にとって必須の構成要素ではないことを意味している。

【0111】
すなわち、上述の実施例においては、入力信号のダウンサンプリング後に関数近似して圧縮し、関数再生後アップサンプリングする方法について説明した。しかし、関数近似自体が、極値間を関数で表しているため、ダウンサンプリングの機能を持ち、再生時には、関数演算で極値間の信号を再生することからアップサンプリングの機能を持っている。従って、本願発明においては、ダウンサンプリング、アップサンプリングの処理は必ずしも必要としない。

【0112】
<第3の実施形態例の説明>
次に、本発明の第3の実施の形態例として、オーディオ信号の帯域をオクターブ単位で分割する場合の例を説明する。
図20は、オーディオ信号の帯域をオクターブ単位で分割する回路装置の全体のブロック構成図を示したものである。この第3の実施形態例でも、既に説明してきた第1及び第2の実施形態例と類似するところは多いが、ここでは、オクターブ単位の処理ということもあるので、図20の構成要素に付与する符号は、図1、図15とは異なる符合を付して以下説明する。

【0113】
図20に示すように、オーディオ信号源101から出力されるアナログオーディオ信号は、アナログ/デジタル変換器102に供給され、一定のサンプリング周期毎に所定ビット数にサンプリングされたデジタルオーディオ信号とされる。このアナログ/デジタル変換器102で変換されたデジタルオーディオ信号は、圧縮されていないデジタルオーディオ信号である。

【0114】
以下、デジタル・アナログ変換器102から出力されるデジタルオーディオ信号を圧縮符号化するための構成とその動作について説明する。
まず、デジタル・アナログ変換器102から与えられるデジタルオーディオ信号が、オクターブ帯域分離フィルタ110a~110n(nはオクターブ数に対応した整数)に供給される。このオクターブ帯域分離フィルタ110a~110nは、入力オーディオ信号を異なる複数のオクターブ帯域の信号成分に分離するフィルタである。ここで、オクターブ帯域とは、西洋音楽などで言われる「8度音程」を1オクターブとして、その1オクターブの周波数帯域を意味する。可聴帯域の2倍に相当する40kHz程度までのオーディオ信号を1オクターブ毎に分割すると、十数個のオクターブ帯域に分離されることになる。

【0115】
このオクターブ帯域分離フィルタ110a~110nは、例えば、区分多項式で表される標本化関数ψ(k)をインパルス応答関数とする基本フィルタである。
この各オクターブ帯域分離フィルタ110a~110nで帯域分割された信号は、それぞれの1オクターブ帯域を12音階に対応した周波数帯域に分離する音階帯域分離フィルタ121a~121l,122a~122l,・・・,129a~129lに供給される。

【0116】
ここでいう12音階は、1オクターブを構成する8度音程を、半音を含めて表現した音階である。但し1オクターブを構成する8度音程といった場合には、基準となる音から1オクターブ上の音も含まれ、12音階と言った場合には、その1オクターブ上の音は含まれない。以下の説明で、1オクターブ帯域という場合には12音階が含まれる帯域のことを示し、1オクターブ上の音の音階の帯域は含まれない。

【0117】
第1オクターブ帯域分離フィルタ110aの出力は、いうまでもなく1オクターブの周波数幅のオーディオ信号となるが、その12音階の周波数を中心周波数とした12個の音階帯域分離フィルタ121a~121lに供給され、12音階の周波数成分に分離される。

【0118】
同様に、第2~第nオクターブ帯域分離フィルタ110b~110nの出力は、それぞれの1オクターブの周波数幅のオーディオ信号が12音階の周波数を中心周波数とした12個の音階帯域分離フィルタ122a~122l,・・・,129a~129lに供給される。そして、1オクターブの周波数幅のオーディオ信号が、各12音階の周波数成分に分離され、全てのオクターブ帯域が12音階の周波数成分に分解される。

【0119】
このようにして分解された12音階の周波数成分のそれぞれは、帯域ごとにその同じ音階の信号(オクターブの信号)が集められ、各音階の成分の集合ごとに関数近似部130a~130lで関数近似される。
すなわち、12個の関数近似部130a~130lが用意され、関数近似部130aはC音(ド音)、関数近似部130bはC♯音(ド♯音)、関数近似部130cはD音(レ音)、関数近似部130dではD♯音(レ♯音)、関数近似部130eはE音(ミ音)、関数近似部130fはF音(ファ音)、関数近似部130gはF♯音(ファ♯音)、関数近似部130hはG音(ソ音)、関数近似部130iはG♯音(ソ♯音)、関数近似部130jはA音(ラ音)、関数近似部130kはA#音(ラ♯音)、関数近似部130lは音(シ音)をそれぞれ関数近似する。

【0120】
このように各音階に対応した関数近似部130a~130lにおいて、それぞれのサンプル点ごとに、オクターブ帯域分離フィルタ110a~110nで分割した数(n個)のオーディオ信号が得られることになる。例えば、C音(ド音)の関数近似部130aでは、それぞれオクターブ離れたn個のC音のサンプル値が得られ、そのn個のC音のサンプル値の関数近似処理が行われる。そして、この関数近似によりデータ量が削減されたパラメータが出力されて、符号化部140に供給される。他の関数近似部130b~130lについても同様の処理が行われる。この関数近似部130a~130lにおける関数近似は、図1、図15の関数近似部21a~21mと同じなのでその説明は省略する。

【0121】
ここで、図21A~図21Cに基づいて、オクターブと12音階について説明しておく。
図21Aは、縦軸に12音階データ、横軸にオクターブ帯域(倍率)をマトリクスとして示した図である。一般にオクターブの高さは、ノートナンバーという値で表現され、12音階のデータは周波数で表現される。
通常、オーディオ信号は、オクターブ帯域ごとに分割され、1オクターブの信号は2**(k/12)[2の(k/12)乗]ごとの音階データに分割される。つまり、基音(ド)の周波数を「1」、その1オクターブ上の基音(ド)を「2」として、その基音(ド)から基音(ド)までを12段階に分割すると、それぞれの段階が2の(k/12)乗(k:1~12)に分かれるということである。

【0122】
ここで、オクターブごとの帯域分離は中心周波数と帯域幅により決まる台形型の帯域分離フィルタで分離される。例えば、中心周波数f=369.9944(F♯)Hz*2とすると、1オクターブ内の最低音Cは中心周波数fの1/√2、最高音Bは中心周波数fの√2倍となる。従って、帯域幅はf0n=f/√2~f11n=√2f(C~B)として設定した条件でオクターブごとに帯域分離が行うことができる。このように分割された帯域内の12音階は、1オクターブ内の最低音Cの周波数f0nに対して、k番目の音階音の周波数
knは、 fkn=f0n*2(k/12)・・・(k=0-11)
で与えられる。
図21Aは縦列が1オクターブ内の12音階信号列、横列が同一音階に対するオクターブ毎の信号列を示す。一つの音はその中の一つの音階であり、かつ9オクターブの中のいずれかに当たる信号であり、図21Aに示すマトリクスの交点●に当たる部分である。

【0123】
また、図21Bは、ピアノでC(ド)を叩いたときの、オクターブ倍率(帯域)と振幅の関係を示した図であり、図21Cは、チェロでC(ド)を引いたときの、オクターブ倍率(帯域)と振幅の関係を示した図である。ピアノの場合は、オクターブ倍率2で際立って振幅が大きくなり、他のところでは平均的に小さな振幅になっている。また、チェロの場合は、オクターブ倍率が比較的小さいところでは、幅広い範囲で大きな振幅の信号が得られ、オクターブ倍率10以上になると、小さな振幅の信号となっている。つまり、楽器の特性が極めて忠実に表現されていることがわかる。

【0124】
図22は、帯域分離フィルタをオクターブ周波数区間ごとに分割構成する場合の、音階周波数域と振幅の関係(周波数特性)を示した図である。上述したように、音は12種類(音階)に分けられる。この12段階に分けた1単位を「半音」という。つまり「ト゛(C)」と「ト゛♯(C#)」の間、「ド♯(C#)」と「レ(D)」の間、・・・が半音ということになる。

【0125】
「ド(C4)」の周波数は261Hzでその1オクターブ上の「ド(C5)」の周波数は522Hzである。また、ラ(A4)の周波数は440Hzであり、その1オクターブ下の「ラ(A3)」の周波数は220Hzである。このように周波数が2倍の関係を倍音という。したがって、音階周波数は、1オクターブ内で12の周波数に分割され、オクターブ信号はn倍の周波数毎に同じ音になる。

【0126】
図22では、12音階の中の最も周波数が低い「ド(C1~C10)」の音が各周波数帯域の左端33Hz、65Hz、131Hz、261Hz、523Hz、1047Hz、2093Hz・・・と倍音関係を保つように配置されている。また、12音階の中の最も高い周波数「シ(B1~B10)」の音が各周波数帯域の右端61Hz、124Hz、247Hz、494Hz、987Hz、1975Hz・・・で示されるように、倍音関係を保つように配置されている。

【0127】
再び、図20で説明すると、関数近似部130a~130lで関数近似された12音階の各信号は、符号化部140に送られる。符号化部140では、12音階全ての音階域のパラメータの符号化がなされるが、この符号化の際には、各パラメータの信号状態に応じて、各階調の信号のビット配分などを決める可変長符号化を行うようにしてもよい。この可変長符号化を行った場合には、各階調成分のビット配分などの情報を、オーディオ信号のサイド情報(補助情報)として、含ませるようにする。符号化部140で符号化されたデータは、ビットストリーム形成部150に供給され、決められた形式のビットストリームデータとして出力される。

【0128】
また、必要により誤り検出符号や誤り訂正符号をビットストリーム形成部150内で生成させて、その生成された誤り検出符号又は誤り訂正符号を、ビットストリームに付加することもできる。このようにしてビットストリーム形成部150から出力されたビットストリームデータは、例えば各種伝送路を経由して受信側に伝送させる。或いは、各種記憶媒体に記憶される。この記憶媒体は、通常は、符号化装置が備える記憶手段が用いられるが、それ以外にも、例えば外部の何らかのデータベースなどに転送して記憶させるようにしてもよい。

【0129】
なお、図20の例では、各音階帯域分離フィルタから集められた信号を直接、関数近似する構成としてあるが、各音階帯域分離フィルタから集められた信号のサンプリング周期を間引くダウンサンプリングを行い、そのダウンサンプリングされた信号に対して関数近似するようにしてもよい。ダウンサンプリングすることで、圧縮後のオーディオ信号のデータ量をより効果的に削減できる。

【0130】
次に、図20の符号化処理装置で符号化された信号を復号化する処理装置の例を、図23に基づいて説明する。
図23に示すように、符号化されたビットストリームは、ビットストリーム入力部201に供給される。このビットストリームには、誤り検出符号又は誤り訂正符号が付加されており、このビットストリーム入力部201では、付加された誤り検出符号又は誤り訂正符号を使用した誤り検出処理又は誤り訂正処理が行われる。

【0131】
そして、誤り検出処理又は誤り訂正処理がなされたビットストリームの中の関数近似されたパラメータの符号化データが、復号化部202に供給されて、それぞれの分離された帯域ごとに、そのパラメータが復号化される。
そして、復号化部202で復号化された各帯域のパラメータは、関数補間部210a~210lに供給される。この関数補間部210a~210lは、図20に示した符号化装置側の12音階の関数近似部130a~130lに対応して、12個(12音階)設けてあり、関数近似部130a~130lでの近似処理と逆の処理が行われる。そして、12音階の各オクターブのサンプル点の値が復元される。

【0132】
ここで、各関数補間部210a~210lの出力には、それぞれに割り当てられた音階の帯域の信号だけが、1オクターブ間隔で含まれることになる。その各関数補間部210a~210lの出力は、1オクターブ成分ごとに分離するn個のフィルタ列に供給される。
すなわち、関数補間部210aで復元されたC(ド)音の音階の帯域の集合の出力が、n個のオクターブ帯域分離フィルタ221a~221nに供給される。そしてオクターブ帯域分離フィルタ221aでは、第1オクターブ帯域のC(ド)音の音階の帯域の信号が取り出され、オクターブ帯域分離フィルタ221bでは、第2オクターブ帯域のC(ド)音の音階の帯域の信号が取り出される。以下、同様に各フィルタで処理されて、1オクターブ間隔のC(ド)音の信号が、1オクターブごとに分離される。

【0133】
同様にして、関数補間部210bで復元されたC♯音の音階の帯域の集合の出力は、n個のオクターブ帯域分離フィルタ222a~222nに供給されて、1オクターブ間隔のC♯音の信号が、1オクターブごとに分離される。この処理が12個の音階の帯域の復元信号に対して行われる。図23に示した例では、途中を省略して、C♯音の音階の帯域の集合の出力が、n個のオクターブ帯域分離フィルタ232a~232nに供給されて、1オクターブごとに分離される構成まで示してある。

【0134】
そして、各オクターブ帯域分離フィルタ221a~221n,222a~222n,・・・,232a~232nで分離された各帯域の信号を、それぞれのオクターブ帯域ごとに個別の加算器241a~241lに集めて加算し、それぞれの加算器で1オクターブの帯域のオーディオ信号を復元して、n個のオクターブの帯域の信号を得る。
更に、各加算器241a~241lで得られたn個のオクターブの帯域の信号が、合成フィルタ203で合成されて、1系統のデジタルオーディオ信号が得られる。

【0135】
なお、上述例においては、オクターブ信号毎に復元する方法を示したが、これは難聴者等に対して帯域別に増幅度を調整可能とするためである。従って、復元処理は各帯域毎の加算演算であり、通常者に対しては、関数補間部210a~210lの各出力を直接合成フィルタ203に供給して、オクターブ単位に集合する必要はない。

【0136】
合成フィルタ203が出力するデジタルオーディオ信号は、デジタル/アナログ変換器204に供給され、このデジタル/アナログ変換器204で変換されたアナログオーディオ信号が、アナログオーディオ信号出力端子205から出力される。

【0137】
このようにして、符号化時と逆の復号化処理を行うことで、元のオーディオ信号を良好に復元する復号化が可能である。
なお、図23に示した構成例では、復号の過程を順に示すために、各オクターブ帯域分離フィルタ221a~221n,222a~222n,・・・,232a~232nで各音階の帯域を得て、各オクターブ帯域分離フィルタからの同じ音階(例えばC(ド)のみ)の帯域の信号を加算器241a~241lで加算することにより1オクターブごとの信号を得ている。そして、加算器241a~241lからの信号を、更に合成フィルタ203で合成して、デジタル・アナログ変換器204に供給している。しかし、例えば、各オクターブ帯域分離フィルタ221a~221n,222a~222n,・・・,232a~232nの出力を、加算器241~241lで加算しないで、それぞれの音階(例えば、C(ド))ごとに、12個の合成フィルタで直接合成するようにしてもよい。これによって、図21B、図21Cに示したように、楽器毎の周波数特性を利用した音源抽出に有効な分類が可能となる。

【0138】
なお、上述した実施の形態では、符号化構成や復号化構成は、それぞれ対応した信号処理を行う手段を備えた専用の装置として構成させた例について説明したが、例えば各種データ処理を行うパーソナルコンピュータ装置などの情報処理装置に、上述した実施の形態で説明した符号化処理部や復号化処理部での処理に相当する信号処理を実行させるプログラム(ソフトウェア)を実装させて、そのプログラムの実行によるソフトウェア処理で、同様の符号化や復号化を行うようにしてもよい。プログラムは、各種記録媒体を介して配布させる他に、インターネットなどの伝送媒体を介して配布するようにしてもよい。

【0139】
本発明について、オーディオ信号の圧縮、再生技術について詳細を説明したが、その技術的特徴は音の高さ(音域)に応じて圧縮・再生を自由に行える点にある。この特徴はオーディオ装置や音楽のネットワーク配信に限らず、騒音環境内での案内放送やBGMなどの人間の精神的癒し空間の形成などへの利用の効果があることは自明である。特に高音や低音が聞き取りにくい難聴者や高齢者に対する補聴器等への利用には非常に有効な技術である。
【符号の説明】
【0140】
1、101・・・オーディオ信号源、
2、102・・・アナログ/デジタル変換器、
3、140・・・符号化部、
4、150・・・ビットストリーム形成部、
5・・・サイド情報符号化部、
10・・・フィルタバンク、
11a~11m・・・帯域フィルタ、
12a~12m・・・ダウンサンプリング部、
20・・・関数近似部(21a~21m:(帯域ごとの)関数近似部)、
31a~31m・・・量子化ビット割当て部、
51・・・ビットストリーム入力部、
52・・・復号化部、
53a~53m・・・逆量子化部、
22a、22b、54a~54m・・・関数補間部、
56・・・デジタル/アナログ変換器、
57・・・アナログオーディオ信号出力端子、
60・・・フィルタバンク、
24a、24b、61a~61m・・・アップサンプリング部、
62・・・サブバンド合成フィルタ、
110a~110n・・・オクターブ分離フィルタ、
121a~121l、122a~122l、129a~129l・・・12音階分割フィルタ、
130a~130l・・・12音階毎の関数近似部、
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9
【図11】
10
【図12】
11
【図13】
12
【図14】
13
【図15】
14
【図16】
15
【図17】
16
【図18】
17
【図19】
18
【図20】
19
【図21】
20
【図22】
21
【図23】
22
【図24】
23