TOP > 国内特許検索 > 音声強調処理装置 > 明細書

明細書 :音声強調処理装置

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第5046233号 (P5046233)
公開番号 特開2008-186010 (P2008-186010A)
登録日 平成24年7月27日(2012.7.27)
発行日 平成24年10月10日(2012.10.10)
公開日 平成20年8月14日(2008.8.14)
発明の名称または考案の名称 音声強調処理装置
国際特許分類 G10L  21/04        (2006.01)
G10L  21/02        (2006.01)
FI G10L 21/04 130A
G10L 21/04 200C
G10L 21/02 302B
請求項の数または発明の数 10
全頁数 14
出願番号 特願2007-265290 (P2007-265290)
出願日 平成19年10月11日(2007.10.11)
優先権出願番号 2007000582
優先日 平成19年1月5日(2007.1.5)
優先権主張国 日本国(JP)
審査請求日 平成22年10月6日(2010.10.6)
特許権者または実用新案権者 【識別番号】504145342
【氏名又は名称】国立大学法人九州大学
発明者または考案者 【氏名】中島 祥好
【氏名】上田 和夫
【氏名】白石 君男
個別代理人の代理人 【識別番号】100085257、【弁理士】、【氏名又は名称】小山 有
審査官 【審査官】山下 剛史
参考文献・文献 特開平7-107053(JP,A)
特開平10-20886(JP,A)
特開平7-160299(JP,A)
特開2003-280696(JP,A)
特開2005-202354(JP,A)
特表2005-528647(JP,A)
調査した分野 G10L 19/00-21/04
H04M 1/00
H04R 3/00- 3/04,25/00
特許請求の範囲 【請求項1】
入力信号の周波数成分を圧縮する機能を備えた音声強調処理装置において、この音声強調処理装置は、入力帯域制限部と入力帯域内パワー算出部と調波性符号算出部と帯域内信号乗算部と出力信号制限部と信号加算部から成り、前記入力帯域制限部は、前記入力信号の所定の周波数成分をそのまま通過させる第1の帯域フィルタを有し、入力帯域内パワー算出部は、下限周波数が前記第1の帯域フィルタの上限周波数以上の周波数値に設定され、前記入力信号を通過させる第2の帯域フィルタと、前記第2の帯域フィルタの出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部から構成され、前記調波性符号算出部は、任意の通過周波数帯域を有し、前記入力信号を通過させる調波性抽出フィルタと、前記調波性抽出フィルタの出力信号の符号を抽出する符号抽出部から構成され、前記帯域内信号乗算部は、前記入力帯域内パワー算出部と前記調波性符号算出部の出力信号を乗算する機能を有し、前記出力信号制限部は、前記入力信号の周波数成分が圧縮される周波数帯域を通過周波数帯域とする圧縮帯域フィルタから構成され、前記信号加算部は、前記入力帯域制限部の出力と前記出力信号制限部の出力を加算する機能を有することを特徴とする音声強調処理装置。
【請求項2】
請求項1に記載の音声強調処理装置において、前記調波性抽出フィルタの通過周波数帯域が、前記第1の帯域フィルタと一致、または含まれることを特徴とする音声強調処理装置。
【請求項3】
請求項1に記載の音声強調処理装置において、前記調波性抽出フィルタの通過周波数帯域が、前記圧縮帯域フィルタと一致、または含まれることを特徴とする音声強調処理装置。
【請求項4】
請求項1、2または3に記載の音声強調処理装置において、前記入力帯域内パワー算出部と前記調波性符号算出部と前記帯域内信号乗算部と前記出力信号制限部をそれぞれ複数有し、各入力帯域内パワー算出部における第2のフィルタの通過帯域が重複せず、かつ、各出力信号制限部における圧縮帯域フィルタの通過帯域が重複しないことを特徴とする音声強調処理装置。
【請求項5】
請求項1、2、3または4に記載の音声強調処理装置において、前記入力帯域内パワー算出部の出力信号を増幅することを特徴とする音声強調処理装置。
【請求項6】
請求項1、2、3、4または5に記載の音声強調処理装置において、前記出力信号制限部の出力信号を増幅することを特徴とする音声強調処理装置。
【請求項7】
入力信号の周波数成分を圧縮する機能を備えた音声強調処理装置において、この音声強調処理装置は、入力帯域制限部と入力帯域内パワー算出部と写像先帯域内パワー算出部とパワー比算出部とパワー比乗算部と信号加算部から成り、前記入力帯域制限部は、前記入力信号の所定の周波数成分をそのまま通過させる第1の帯域フィルタを有し、前記入力帯域内パワー算出部は、下限周波数が前記第1の帯域フィルタの上限周波数以上の周波数値に設定され、前記入力信号を通過させる第2の帯域フィルタと、前記第2の帯域フィルタの出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部から構成され、前記写像先帯域内パワー算出部は、前記入力信号の周波数成分が圧縮される周波数帯域を通過周波数帯域とし,前記入力信号を通過させる入力信号圧縮帯域フィルタと、前記入力信号圧縮帯域フィルタの出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部から構成され、前記パワー比算出部は前記入力帯域内パワー算出部と前記写像先帯域内パワー算出部の出力信号の比率を算出する機能を有し、前記パワー比乗算部は、前記入力信号圧縮帯域フィルタの出力信号と前記パワー比算出部の出力信号を乗算する機能を有し、前記信号加算部は、前記入力帯域制限部の出力と前記パワー比乗算部の出力を加算する機能を有することを特徴とする音声強調処理装置。
【請求項8】
請求項7に記載の音声強調処理装置において、前記入力帯域内パワー算出部と前記写像先帯域内パワー算出部と前記パワー比算出部と前記パワー比乗算部をそれぞれ複数有し、各入力帯域内パワー算出部における第2のフィルタの通過帯域が重複せず、かつ、各写像先帯域内パワー算出部における入力信号圧縮帯域フィルタの通過帯域が重複しないことを特徴とする音声強調処理装置。
【請求項9】
請求項7または8に記載の音声強調処理装置において、入力信号圧縮帯域フィルタの出力信号を増幅することを特徴とする音声強調処理装置。
【請求項10】
請求項7、8または9に記載の音声強調処理装置において、前記パワー比乗算部の出力信号を増幅することを特徴とする音声強調処理装置。
発明の詳細な説明 【技術分野】
【0001】
本発明は、公共放送装置、拡声装置、補聴器、電話機などで、入力音声の高周波数成分を低周波数域に圧縮し、明瞭で自然な音声を提供するための音声強調処理装置に関する。
【背景技術】
【0002】
人間の聴覚は、加齢とともに高周波数域の聴力から徐々に低下していくことが知られている。これは内耳の機能低下に起因する難聴であり、一般に感音性難聴と呼ばれ、その中でも特に加齢によるものは老人性難聴と呼ばれる。老人性難聴では、加齢とともに聴力が低下し始める周波数が下がっていくことが統計的にも証明されている。
【0003】
また、老人性難聴ではない感音性難聴においても、その多くで高周波数帯域の聴力低下が認められる。高齢者、難聴者など、聞こえに悩む人々の大部分は高周波数帯域の聴力低下に悩んでいると言っても過言ではない。
【0004】
一方、人間の音声の子音部分には高周波数成分が多く含まれるので、高周波数域の聴力が低下すると、子音部の聞き取り及び弁別能力が低下し、音声の内容の正確な理解が困難になり、ひいては音声コミュニケーションに多大なる障害をもたらす。
【0005】
現在市販されている補聴器の多くは、入力音の高周波数成分のみを増幅する機能(高域強調)を有しているが、感音性難聴の場合は単なる聴力低下に留まらず、高周波数域の周波数分解能の低下やリクルートメント現象(低いレベルの音は聞こえないが、高いレベルの音は一般人と同じようにうるさく感じる現象)などを示す場合が多く、単なる高域強調では満足な補聴効果が得られない場合が多い。
【0006】
近年のディジタル補聴器の多くには、リクルートメント現象を補償するためにノンリニア増幅と呼ばれる機能が搭載されている。これは、低レベルの入力音は増幅し、高レベル音は増幅しない機能であり、補聴器の音の快適性という観点では多くの高齢者、難聴者に支持されている機能である。
【0007】
特許文献1には、高周波数域の聴力が低下した難聴者のために、音声を周波数スペクトル包絡、音源周波数および音源振幅に関する特徴パラメータに変換する手段と、この特徴パラメータを数値変換した後、パーコール合成する手段を備え、周波数スペクトル包絡が低周波数帯域に圧縮された音声を合成出力することを特徴とする補聴器に関する記載がある。
【0008】
また、高周波数域の聴力が低下していても、見た目の格好悪さや経済的な問題などで、このような補聴器を使用していない高齢者、難聴者が数多く存在する。これら補聴器を使用していない高齢者や難聴者にとって、駅構内など多くの騒音が混在する環境において、アナウンス等の音声を聞き取ることには非常な困難が伴うことは想像に難くない。
【0009】
一方、電話においては、通信データ量を低減するために伝送周波数帯域を300~3400Hzに制限されている。これは、電話での通話においては、一般ユーザーも高周波数域の情報がカットされた音声を聴取しているということであって、すなわち、一般ユーザーも高周波数域の聴力が低下した難聴者と同様の状態で音声を聴取しているということである。実際に現在の市販の電話機においては、高齢者や難聴者でなくとも、音声の内容の正確な理解が困難になるケースが少なくないという現状がある。

【特許文献1】特開昭57-178499
【発明の開示】
【発明が解決しようとする課題】
【0010】
高周波数域の聴力が低下した高齢者、難聴者に対して、単に音声レベルを増幅しただけでは、聴力が正常な低周波数域の成分が過度に聞こえてしまって、うるさく感じるだけである。また、高域強調やノンリニア増幅を行っても、周波数分解能等の他の要因によって、やはり十分な補聴効果が得られない場合が多い事が知られている。
【0011】
特許文献1には、高周波数域の聴力が低下した難聴者のための周波数圧縮方式に関する記載があるが、この方式は音声の調波構造も圧縮してしまうので、音声の自然性を損なってしまい、高齢者や軽度難聴者には使い難いという問題があった。
【0012】
また、駅構内などの多くの騒音が混在する環境においては、補聴器を使用していない高齢者や難聴者のために、アナウンス音声に高域強調やノンリニア増幅を施すという方法が考えられるが、難聴者の聴覚特性は個人ごとに様々であり、このような補聴器用の音声信号処理方式を一律に適用するのは困難であった。
【0013】
さらに、電話機においては、通信コストやインフラ整備の観点から鑑みるに、その伝送周波数帯域を拡大する事は現実的に困難であるが、現状の狭い伝送周波数帯域の中で、明瞭性が高く、自然で高品質な音声通話を実現するのは困難であった。
【課題を解決するための手段】
【0014】
上記の課題を解決するために、本発明は、公共放送装置、拡声装置、補聴器、電話機などで、明瞭で自然な音声を提供するための音声強調処理装置に関して、以下の構成とした。
【0015】
入力帯域制限部と入力帯域内パワー算出部と調波性符号算出部と帯域内信号乗算部と出力信号制限部と信号加算部から成り、前記入力帯域制限部は、前記入力信号の所定の周波数成分をそのまま通過させる第1の帯域フィルタを有し、入力帯域内パワー算出部は、下限周波数が前記第1の帯域フィルタの上限周波数以上の周波数値に設定され、前記入力信号を通過させる第2の帯域フィルタと、前記第2の帯域フィルタの出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部から構成され、前記調波性符号算出部は、任意の通過周波数帯域を有し、前記入力信号を通過させる調波性抽出フィルタと、前記調波性抽出フィルタの出力信号の符号を抽出する符号抽出部から構成され、前記帯域内信号乗算部は、前記入力帯域内パワー算出部と前記調波性符号算出部の出力信号を乗算する機能を有し、前記出力信号制限部は、前記入力信号の周波数成分が圧縮される周波数帯域を通過周波数帯域とする圧縮帯域フィルタから構成され、前記信号加算部は、前記入力帯域制限部の出力と前記出力信号制限部の出力を加算する機能を有することを特徴とする構成とした。これにより、入力音声の子音等の高周波数成分を低周波数域に圧縮した上で、明瞭で自然な音声を提供することができる。
【0016】
また、前記調波性抽出フィルタの通過周波数帯域が、前記第1の帯域フィルタと一致することを特徴とする構成とした。これにより、周波数圧縮される帯域内の信号の調波性を維持し、明瞭で自然な音声を提供することができる上に、前記第1の帯域フィルタと前記調波性抽出フィルタを同一のフィルタで構成することが可能となり、より小規模なシステムで構成することができる。
【0017】
また、前記調波性抽出フィルタの通過周波数帯域が、前記圧縮帯域フィルタと一致することを特徴とする構成とした。これにより、周波数圧縮される帯域内の信号の調波性をより正確に維持し、明瞭で自然な音声を提供することができる上に、前記第1の帯域フィルタと前記調波性抽出フィルタを同一のフィルタで構成することが可能となり、より小規模なシステムで構成することができる。
【0018】
また、前記入力帯域内パワー算出部と前記調波性符号算出部と前記帯域内信号乗算部と前記出力信号制限部をそれぞれ複数有し、各入力帯域内パワー算出部における第2のフィルタの通過帯域が重複せず、かつ、各出力信号制限部における圧縮帯域フィルタの通過帯域が重複しないことを特徴とする構成とした。これにより、音声の子音等の高周波数成分の調波性や自然性を損なうことなく、明瞭な音声を提供することができる。
【0019】
また、前記入力帯域内パワー算出部の出力信号を増幅することを特徴とする構成とした。これにより、高周波数域の聴力が低下した高齢者や聴覚障害者に対して、入力音声の子音等の高周波数成分を圧縮すると共に強調して、より明瞭な音声を提供することができる。
【0020】
また、前記出力信号制限部の出力信号を増幅することを特徴とする構成とした。これにより、高周波数域の聴力が低下した高齢者や聴覚障害者に対して、入力音声の子音等の高周波数成分を圧縮すると共に強調して、より明瞭な音声を提供することができる。
【0021】
また、入力帯域制限部と入力帯域内パワー算出部と写像先帯域内パワー算出部とパワー比算出部とパワー比乗算部と信号加算部から成り、前記入力帯域制限部は、前記入力信号の所定の周波数成分をそのまま通過させる第1の帯域フィルタを有し、前記入力帯域内パワー算出部は、下限周波数が前記第1の帯域フィルタの上限周波数以上の周波数値に設定され、前記入力信号を通過させる第2の帯域フィルタと、前記第2の帯域フィルタの出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部から構成され、前記写像先帯域内パワー算出部は、前記入力信号の周波数成分が圧縮される周波数帯域を通過周波数帯域とし、前記入力信号を通過させる入力信号圧縮帯域フィルタと、前記入力信号圧縮帯域フィルタの出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部から構成され、前記パワー比算出部は前記入力帯域内パワー算出部と前記写像先帯域内パワー算出部の出力信号の比率を算出する機能を有し、前記パワー比乗算部は、前記入力信号圧縮帯域フィルタと前記パワー比算出部の出力信号を乗算する機能を有し、前記信号加算部は、前記入力帯域制限部の出力と前記パワー比乗算部の出力を加算する機能を有することを特徴とする構成とした。これにより、入力音声の子音等の高周波数成分を低周波数域に圧縮した上で、明瞭で自然な音声を提供することができる上に、演算処理が簡略であるので小規模、低消費電力のシステムを構成することができる。
【0022】
また、前記入力帯域内パワー算出部と前記写像先帯域内パワー算出部と前記パワー比算出部と前記パワー比乗算部をそれぞれ複数有し、各入力帯域内パワー算出部における第2のフィルタの通過帯域が重複せず、かつ、各写像先帯域内パワー算出部における入力信号圧縮帯域フィルタの通過帯域が重複しないことを特徴とする構成とした。これにより、音声の子音等の高周波数成分の調波性や自然性を損なうことなく、明瞭な音声を提供することができる上に,演算処理が簡略であるので小規模、低消費電力のシステムを構成することができる。
【0023】
また,前記入力信号圧縮帯域フィルタの出力信号を増幅することを特徴とする構成とした。これにより、高周波数域の聴力が低下した高齢者や聴覚障害者に対して、入力音声の子音等の高周波数成分を圧縮すると共に強調して、より明瞭な音声を提供することができる上に、演算処理が簡略であるので小規模、低消費電力のシステムで構成することができる。
【0024】
また,パワー比乗算部の出力信号を増幅することを特徴とする構成とした。これにより、高周波数域の聴力が低下した高齢者や聴覚障害者に対して、入力音声の子音等の高周波数成分を圧縮すると共に強調して、より明瞭な音声を提供することができる上に、演算処理が簡略であるので小規模、低消費電力のシステムで構成することができる。
【発明の効果】
【0025】
本発明の音声強調処理装置は、子音等の音声の高周波数成分を低周波数域へ向けて圧縮し、高周波数域の聴力が低下した高齢者や聴覚障害者に、音声のレベルを過度に増幅したり、音声の高周波数域を強調したりせずに、その聴覚に残存する周波数域内の情報のみで明瞭かつ自然な音声を提供することが出来る。さらに、本発明の音声強調処理装置は、伝送周波数帯域が制限された電話機の通話においても、その帯域制限によって聞き取りが困難となっていた子音等の音声の高周波数成分を明瞭かつ自然に提供することが出来る。
【0026】
従来、このような音声処理においては、周波数成分を圧縮することによって、音声の調波構造が壊れてしまい、音声の自然性を著しく損なってしまう場合が多かった。しかし、本発明による音声強調処理装置では、音声の調波構造を維持したまま、自然で明瞭な音声を提供することが出来る。
【0027】
また、本発明の音声強調処理装置は、一般に高周波数成分を多く含み、母音に比較してレベルの小さい子音の成分を、その強調処理のプロセスにおいて、必要に応じて増幅することができる。これにより、高周波数域の聴力が低下した高齢者や聴覚障害者でも、自然で明瞭な音声を聴取することが出来る。
【0028】
さらに、本発明の音声強調処理装置は、子音等の電話機の伝送周波数帯域外の音声情報を伝送周波数帯域内に圧縮して伝送、通話することを可能としている。これにより、高周波数域の聴力が低下した高齢者や聴覚障害者のみならず、一般ユーザーにおいても、電話機における通話品質を向上することを可能としている。
【発明を実施するための最良の形態】
【0029】
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明する。なお、以下の説明において、同一機能を有するものは同一の符号とし、その繰り返しの説明は省略する。
【0030】
図1は、本発明の第1の実施形態におけるシステムのブロック図であり、入力音声の所定の周波数成分をそのまま通過させる第1の帯域フィルタ7から成る入力帯域制限部1と、下限周波数が前記第1の帯域フィルタ7の上限周波数以上の周波数値に設定され、前記入力信号を通過させる第2の帯域フィルタ8と、前記第2の帯域フィルタ8の出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部9から成る入力帯域内パワー算出部2と、任意の通過周波数帯域を有し、前記入力信号を通過させる調波性抽出フィルタ10と、前記調波性抽出フィルタ10の出力信号の符号を抽出する符号抽出部11から成る調波性符号算出部3と、前記入力帯域内パワー算出部2の出力と前記調波性符号算出部3の出力を乗算する帯域内信号乗算部4と、入力信号の周波数成分が圧縮される周波数帯域を通過周波数帯域とする圧縮帯域フィルタ12から成る出力信号制限部5と、前記入力帯域制限部1の出力と前記出力信号制限部5の出力を加算する信号加算部6から構成されている。
【0031】
本発明の音声強調処理装置では、第2の帯域フィルタ7の出力信号を、第2の帯域フィルタ7よりも狭帯域になっている圧縮帯域フィルタ12の帯域内に圧縮し、その圧縮された信号を第1の帯域フィルタ7の出力と信号加算部6で加算することにより、高周波数域の音声成分が低周波数域に圧縮された音声を生成している。
【0032】
圧縮のために、第2の帯域フィルタ7の出力のパワーエンベロープ(パワーの時間的変化)をパワーエンベロープ抽出部9で抽出し、調波性抽出フィルタ10の出力の符号を符号抽出部11で算出している。ここで本実施例では、この符号を、瞬時振幅値が正の場合は1、0の場合は0、負の場合は-1としている。
【0033】
パワーエンベロープ抽出部9と符号抽出部11の出力を、帯域内信号乗算部4で乗算し、前記圧縮帯域フィルタ12に通す。これにより、入力信号の調波性、非調波性を保ったまま振幅変調をかけることになるので、入力音の調波構造を保ったまま、明瞭性、自然性が高い周波数圧縮音声を生成することができる。
【0034】
図2には、本発明の第2の実施形態におけるシステムブロック図として、前記入力帯域内パワー算出部2と前記調波性符号算出部3と前記帯域内信号乗算部4と前記出力信号制限部5をそれぞれ複数有し、各入力帯域内パワー算出部2における第2のフィルタ8の通過帯域が重複せず、かつ、各出力信号制限部5における圧縮帯域フィルタ12の通過帯域が重複しない構成を示す。
【0035】
第2の実施の形態では、入力音の高周波数成分を複数の帯域に分割し、それぞれの帯域内信号を圧縮、加算することによって、より広い帯域の成分を、より狭い帯域内に圧縮することを可能としている。
【0036】
なお、調波性抽出フィルタ10は、符号抽出部11で入力信号の調波性に関する情報を符号化するためのフィルタである。本実施例では、調波性抽出フィルタ10を任意の通過周波数帯域を有する独立したフィルタとして構成しているが、システムの構成を簡略化するために、これを第1の帯域フィルタ7と共用することも可能である。この場合、第1の帯域フィルタ7の出力は、信号加算器6に送られると共に符号抽出部11に送られ、その符号を抽出し、各帯域内信号乗算部4において各入力帯域内パワー算出部2の出力と乗ぜられる。
【0037】
図3には、第2の実施の形態において、前記入力帯域内パワー算出部2と前記調波性符号算出部3と前記帯域内信号乗算部4と前記出力信号制限部5を各々3種類有し、さらに、調波性抽出フィルタ10と圧縮帯域フィルタ12の通過周波数帯域が一致する場合の信号の様相を模式的に示している。ここで、図中の太字で示された数字は、対応する構成部の符号である。
以下、本実施例では図3を用いて、さらに具体的に説明する。
【0038】
本実施例では、第1の帯域フィルタ7の境界周波数(下限周波数-上限周波数)を70-3150 Hz 、第2の帯域フィルタ8の境界周波数を(1)3150-4000 Hz 、(2)4000-5300Hz、(3)5300-7700Hzとし、調波性抽出フィルタ10の境界周波数を(1)3150-3400 Hz、(2)3400-3650Hz、(3)3650-4000Hz としている。
【0039】
この設定により、図4に示すように、元々は70-7700Hzの帯域内の入力音に対して、低周波数成分(70-3150Hz)はそのままに、高周波数成分(3150-7700Hz)のみが3150-4000Hzの帯域に周波数圧縮される。
【0040】
第2の帯域フィルタ8(3150-4000 Hz)の出力信号のパワーの時間的変化をパワーエンベロープ抽出部9で算出する。ここでは、このパワーエンベロープを1 ms の時間窓の移動平均として表し、その平方根を算出している。ちなみに、この平方根化は、後述する符号抽出部11から出力される符号と乗算を行うために、パワーを振幅の次元に変換するために行っている。
【0041】
次に、調波性抽出フィルタ10(3150-3400 Hz)の出力信号を、符号抽出部11で、瞬時振幅値が正なら+1、ゼロなら0、負なら-1 の符号に変換し、前記パワーエンベロープ抽出部9の出力と乗算する。さらに、その出力から圧縮帯域フィルタ12によって3150-3400 Hz の帯域を取り出す。
【0042】
以上の操作により、入力音の 3150-4000 Hz に含まれるパワー変化の情報が調波性、非調波性を保ったまま、3150-3400 Hz に圧縮(写像)されたことになる。
【0043】
同様の操作を行い、入力音の4000-5300 Hz に含まれるパワー変化の情報を、写像先の調波性、非調波性を保ったまま3400-3650 Hz に圧縮し、5300-7700 Hz に含まれるパワー変化の情報を、写像先の調波性、非調波性を保ったまま、3650-4000 Hz に圧縮する。その後、それぞれの出力(圧縮された成分)と第1の帯域フィルタの出力を信号加算部6で加算することにより、周波数圧縮音が生成される。
【0044】
本実施例の場合は、調波性抽出フィルタ10と圧縮帯域フィルタ12の通過周波数帯域が一致している。このため、符号抽出部11で抽出された調波性情報は、周波数圧縮される周波数帯域の調波性情報と完全に一致しており、より自然な周波数圧縮音声を生成できる。
【0045】
図8は、本発明の第3の実施形態におけるシステムのブロック図であり、入力音声の所定の周波数成分をそのまま通過させる第1の帯域フィルタ7から成る入力帯域制限部1と、下限周波数が前記第1の帯域フィルタ7の上限周波数以上の周波数値に設定され、前記入力信号を通過させる第2の帯域フィルタ8と、前記第2の帯域フィルタ8の出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部9から成る入力帯域内パワー算出部2と、前記入力信号の周波数成分が圧縮される周波数帯域を通過周波数帯域とし、前記入力信号を通過させる入力信号圧縮帯域フィルタ16と、前記入力信号圧縮帯域フィルタ16の出力信号のパワーエンベロープ信号を抽出するパワーエンベロープ抽出部9から成る写像先帯域内パワー算出部15と、前記入力帯域内パワー算出部2と前記写像先帯域内パワー算出部15の出力信号の比率を算出するパワー比算出部17と、前記入力信号圧縮帯域フィルタ16と前記パワー比算出部17の出力信号を乗算するパワー比乗算部18と、前記入力帯域制限部1の出力と前記パワー比乗算部18の出力を加算する信号加算部6から構成されている。
【0046】
本実施例では、第2の帯域フィルタ7の出力信号を、第2の帯域フィルタ7よりも狭帯域になっている入力信号圧縮帯域フィルタ16の帯域内に圧縮し、その圧縮された信号を第1の帯域フィルタ7の出力と信号加算部6で加算することにより、高周波数域の音声成分が低周波数域に圧縮された音声を生成している。
【0047】
圧縮のために、入力帯域内パワー算出部2の第2の帯域フィルタ8の出力のパワーエンベロープ(パワーの時間的変化)をパワーエンベロープ抽出部9で抽出するとともに、写像先帯域内パワー算出部15の入力信号圧縮帯域フィルタ16の出力のパワーエンベロープをパワーエンベロープ抽出部9で抽出している。
【0048】
入力帯域内パワー算出部2の出力信号と写像先帯域内パワー算出部15の出力信号の比率をパワー比算出部17で算出し、その結果と入力信号圧縮帯域フィルタ16の出力信号をパワー比乗算部18で乗算する。これにより、入力音の調波構造を保ったまま、明瞭性、自然性が高い周波数圧縮音声を生成することができる上に、実施例1および2よりも低演算量で効率的なシステムを構成することができる。
【0049】
図9には、本発明の第4の実施形態におけるシステムブロック図として、前記入力帯域内パワー算出部2と前記写像先帯域内パワー算出部15と前記パワー比算出部17と前記パワー比乗算部18をそれぞれ複数有し、各入力帯域内パワー算出部2における第2の帯域フィルタ8の通過帯域が重複せず、かつ、各写像先帯域内パワー算出部15における入力信号圧縮帯域フィルタ16の通過帯域が重複しない構成を示す。
【0050】
第4の実施の形態では、入力音の高周波数成分を複数の帯域に分割し、それぞれの帯域内信号を圧縮、加算することによって、より広い帯域の成分を、狭い帯域内に圧縮することを可能としている。
【0051】
図10には、第4の実施の形態において、前記入力帯域内パワー算出部2と前記写像先帯域内パワー算出部15と前記パワー比算出部17と前記パワー比乗算部18を各々3種類有する場合の信号の様相を模式的に示している。ここで、図中の太字で示された数字は、対応する構成部の符号である。
以下、本実施例では図10を用いて、さらに具体的に説明する。
【0052】
本実施例では、第1の帯域フィルタ7の境界周波数(下限周波数-上限周波数)を70-3150 Hz 、第2の帯域フィルタ8の境界周波数を(1)3150-4000 Hz 、(2)4000-5300Hz、(3)5300-7700Hzとし、入力信号圧縮帯域フィルタ16の境界周波数を(1)3150-3400 Hz、(2)3400-3650Hz、(3)3650-4000Hz としている。
【0053】
この設定により、図4に示すように、元々は70-7700Hzの帯域内の入力音に対して、低周波数成分(70-3150Hz)はそのままに、高周波数成分(3150-7700Hz)のみが3150-4000Hzの帯域に周波数圧縮される。
【0054】
第2の帯域フィルタ8(3150-4000 Hz)の出力信号のパワーの時間的変化 をパワーエンベロープ抽出部9で算出する。ここでは、このパワーの時間的変化を1 ms の時間窓で移動平均し、その平方根をパワーエンベロープ a1 とする。
【0055】
次に、入力信号圧縮帯域フィルタ16(3150-3400 Hz)の出力信号のパワーの時間的変化をパワーエンベロープ抽出部9で、1 ms の時間窓の移動平均の平方根として算出し、パワーエンベロープ b1とする。前記第2の帯域フィルタ8(3150-4000 Hz)の出力信号のパワーエンベロープ a1 との比 a1 / b1 をパワー比算出部17で算出する。
【0056】
さらに、入力信号圧縮帯域フィルタ16(3150-3400 Hz)の出力信号と前記パワー比算出部17の出力 a1 / b1 を前記パワー比乗算部18で乗算する。
以上の操作により、入力音の 3150-4000 Hz に含まれるパワー変化の情報が調波性、非調波性を保ったまま、3150-3400 Hz に圧縮(写像)されたことになる。
【0057】
同様の操作を行い、入力音の4000-5300 Hz に含まれるパワー変化の情報を、写像先の調波性、非調波性を保ったまま3400-3650 Hz に圧縮し、5300-7700 Hz に含まれるパワー変化の情報を、写像先の調波性、非調波性を保ったまま、3650-4000 Hz に圧縮する。その後、それぞれの出力(圧縮された成分)と第1の帯域フィルタの出力を信号加算部6で加算することにより、周波数圧縮音が生成される。
【0058】
図5に、本実施例よって生成された周波数圧縮音声のサウンドスペクトログラムを示す。(a)は原音声、(b)は周波数圧縮を行わずに帯域を制限した音声、(c)は本実施例による周波数圧縮音声である。音声の調波性を保ったまま、高周波数成分が圧縮されている様子が認められる。
【0059】
図6には、本発明を適用した(a)公共放送装置、(b)補聴器、(c)電話機のシステムの一例を示す。(a)公共放送装置では、アナウンス者がマイクロフォンに向かって発声し、その音声に対して周波数圧縮処理を行う。周波数圧縮された音声は、駅構内や建物に既存の放送システム(放送設備)にてスピーカーより流される。
【0060】
(b)の補聴器では、マイクロフォンで集音された音信号を周波数圧縮し、その後、使用者(難聴者)の聴力特性に合わせて増幅等の通常の補聴処理を行い、イヤホンより出力する。なお、本実施例では、周波数圧縮後に補聴処理を行っているが、必要に応じて周波数圧縮前に補聴処理を行う構成にしても良い。
【0061】
(c)の電話機では、電話機1と電話機2が通話を行っている場合を想定している。マイクロフォンに向かって発声された音声に対して周波数圧縮処理を行い、その音声を伝送することによって通話を行う。(a)(b)(c)の各装置共に、本発明を適用することにより、利用者へ明瞭で自然な音声を提供することを可能としている。
【0062】
図7には、本発明の第5の実施形態におけるシステムブロック図を示す。本発明による音声強調処理装置は、音声の高周波数成分を低周波数域に圧縮することを目的としているが、その明瞭性をさらに高めるために、本実施例では、圧縮処理の過程で、子音等の成分が含まれる高周波数域の成分を選択的に増幅することによって高域強調を行っている。
【0063】
ここでは、第2の実施の形態に高域強調を適用した例を用いて説明する。図7に示すように、前記入力帯域内パワー算出部2の出力信号を増幅器13で増幅しても、前記出力信号制限部5の出力信号を増幅器14で増幅しても実現することが出来る。例えば、増幅器13で入力帯域内パワー算出部2の出力信号(4000-5300 Hz)を+5dB、出力信号(5300-7700 Hz)を+10dB増幅すれば、圧縮音声の(3400-3650 Hz)及び(3650-4000 Hz)の成分が、それぞれ+5dB、+10dB強調される。
【0064】
さらに、前記出力信号制限部5の出力信号の総エネルギーが前記入力帯域内パワー算出部2の出力信号の総エネルギーに等しくなるように増幅すれば、入力音声と同等の音量感の圧縮音声を生成することも可能である。
【0065】
ここでは、第2の実施の形態を用いて説明したが、第4の実施の形態においても、同様に高周波数域の成分を選択的に増幅することは可能である。この場合は、前記入力信号圧縮帯域フィルタ16のパワー比乗算部18に入力される信号およびパワー比乗算部18の出力信号を増幅すれば同様の効果を得ることができる。
【0066】
なお、本実施例では、周波数圧縮処理による音声強調についてのみ述べたが、本発明の周波数圧縮処理と子音強調等の他の音声強調処理方式を併用することによって、本発明の効果がより高まる場合がある。
【0067】
また、本実施例では、主に補聴器、放送装置、電話機について述べたが、例えば、メガホンなどの拡声装置に本音声強調処理装置による周波数圧縮を適用すれば、自然で明瞭な拡声音声が生成できる。
【図面の簡単な説明】
【0068】
【図1】本発明の第1の実施形態におけるシステムのブロック図
【図2】本発明の第2の実施形態におけるシステムのブロック図
【図3】本発明の第2の実施形態における信号の模式図
【図4】本発明の第2の実施形態における周波数圧縮の概念図
【図5】サウンドスペクトログラム
【図6】本発明を適用した公共放送装置、補聴器、電話機のシステムの一例
【図7】本発明の第5の実施形態におけるシステムのブロック図
【図8】本発明の第3の実施形態におけるシステムのブロック図
【図9】本発明の第4の実施形態におけるシステムのブロック図
【図10】本発明の第4の実施形態における信号の模式図
【符号の説明】
【0069】
1…入力帯域制限部、 2…入力帯域内パワー算出部、 3…調波性符号算出部、 4…帯域内信号乗算部、 5…出力信号制限部、 6…信号加算部、 7…第1の帯域フィルタ、 8…第2の帯域フィルタ、 9…パワーエンベロープ抽出部、 10…調波性抽出フィルタ、 11…符号抽出部、12…圧縮帯域フィルタ、13…増幅器、14…増幅器、15…写像先帯域内パワー算出部、16…入力信号圧縮帯域フィルタ、17…パワー比算出部、18…パワー比乗算部
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9