TOP > 国内特許検索 > マイクロホン装置 > 明細書

明細書 :マイクロホン装置

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第5391374号 (P5391374)
公開番号 特開2009-188638 (P2009-188638A)
登録日 平成25年10月25日(2013.10.25)
発行日 平成26年1月15日(2014.1.15)
公開日 平成21年8月20日(2009.8.20)
発明の名称または考案の名称 マイクロホン装置
国際特許分類 H04R   1/00        (2006.01)
H04R   3/00        (2006.01)
FI H04R 1/00 327Z
H04R 3/00 320
請求項の数または発明の数 5
全頁数 21
出願番号 特願2008-025379 (P2008-025379)
出願日 平成20年2月5日(2008.2.5)
審査請求日 平成23年1月19日(2011.1.19)
特許権者または実用新案権者 【識別番号】504133110
【氏名又は名称】国立大学法人電気通信大学
発明者または考案者 【氏名】プラサド ラジキショール
【氏名】小池 卓二
【氏名】高橋 紀成
【氏名】松野 文俊
個別代理人の代理人 【識別番号】100122884、【弁理士】、【氏名又は名称】角田 芳末
【識別番号】100133824、【弁理士】、【氏名又は名称】伊藤 仁恭
審査官 【審査官】菊地 陽一
参考文献・文献 特開2006-279385(JP,A)
特開平05-022784(JP,A)
特開2007-189578(JP,A)
特開2004-289762(JP,A)
特開平04-234096(JP,A)
特開2001-326985(JP,A)
特開2004-023446(JP,A)
特開平11-308680(JP,A)
特開平11-331990(JP,A)
実開平02-062864(JP,U)
調査した分野 H04R 1/00
H04R 3/00
特許請求の範囲 【請求項1】
板状であって、前記板状の一の面と密接する生体表面の振動を検出して電気信号に変換する圧電素子である検出部と、
前記検出部から出力される前記生体の発生器官から発声されたインパルス状の音声による前記生体表面の振動に応じた電気信号に基づいて、前記生体の発声器官から前記生体表面の前記検出部が取り付けられた位置までの当該生体の伝達関数、および、その逆伝達関数を算出する演算部と、
前記演算部で算出された前記逆伝達関数を利用した演算を行うフィルタを、前記検出部から出力される電気信号に適用してフィルタ処理を行う信号処理部と、
前記信号処理部によってフィルタ処理された電気信号を外部に出力する出力部と、
前記生体の発声器官から発声されて空間を伝播した気導音を収音し、電気信号に変換する収音部と、
前記信号処理部において前記フィルタが適用された電気信号と、前記収音部から出力される電気信号とを比較し、比較結果に基づいて前記演算部で算出された前記逆伝達関数の補正量を算出する比較演算部と、を備え、
前記演算部は、前記比較演算部で算出された前記補正量に基づいて、前記逆伝達関数を補正する
ことを特徴とするマイクロホン装置。
【請求項2】
前記生体の発声器官から発声されたインパルス状の音声は、使用者の舌打ち音である
ことを特徴とする請求項に記載のマイクロホン装置。
【請求項3】
前記板状の検出部の前記生体表面と密接する面の反対側に設けられる緩衝材、をさらに含み、
前記板状の検出部は、前記生体表面と前記緩衝材の一の面との間に狭持される
ことを特徴とする請求項1又は2に記載のマイクロホン装置。
【請求項4】
前記緩衝材は、海綿状に形成されている
ことを特徴とする請求項に記載のマイクロホン装置。
【請求項5】
前記検出部の圧電素子は、ポリフッ化ビニリデンを用いて構成される板状である
ことを特徴とする請求項1乃至のいずれかに記載のマイクロホン装置。
発明の詳細な説明 【技術分野】
【0001】
本発明は、人体中を伝導する音声を利用したマイクロホン装置に関する。
【背景技術】
【0002】
近年、人体、特に骨格を伝導する音声(骨導音)の取得は、周囲騒音の影響を受けにくく、騒音下での音声通話や音声入力を可能にする手法として注目されている。しかし、骨導音の取得には、(1)音の表現に重要な高域成分が少ないために明瞭度が低い、(2)骨導音声の周波数特性は低域が高く高域が低いために音質が悪い、(3)外耳道の個人差やピックアップユニットの装着の仕方で明瞭度が大きく変化する、(4)コード(信号線)の摩擦などの異音を収音しやすい、(5)運動性雑音を拾いやすい、(6)効率やS/N比が悪い、(7)声帯や声道あるいは口などの各部位からの音声伝達が非常に複雑であるために骨導音声固有の音質が生ずる、といった不都合があるとされている。
【0003】
上記(1)~(6)は骨導音を取得する従来方法が適切でないことにより発生する問題である。(1)~(6)の問題を解決するものとして、ピックアップ素子の接触子に、人体の検出部位との間隔の大小差を緩和する調整機能を設け、人体の個人差に対する補正を簡便に行い、フィット感ないし装着性を向上させた技術が開示されている(例えば、特許文献1参照。)。さらに、この特許文献1に記載された技術によれば、接触子が人体に接触する構成としたので、骨導音声認識の明瞭度やS/N比が向上し、良好に骨導音声を認識することができる。
【特許文献1】特開2002-262377号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところで、上記の(7)については、骨導音が有する本質的な問題であり、骨導音から気導音と同等な再現性の高い音声情報を得るためには、適切な補正が必要である。特許文献1には、このような補正処理については記載されていない。
【0005】
本発明は、このような状況に鑑みてなされたものであり、取得した骨導音から、気導音と同等な再現性の高い音声情報を得られるようにするものである。
【課題を解決するための手段】
【0006】
本発明の一側面のマイクロホン装置は、板状であって、その板状の一の面と密接する生体表面の振動を検出して電気信号に変換する圧電素子である検出部と、その検出部から出力される生体の発生器官から発声されたインパルス状の音声による生体表面の振動に応じた電気信号に基づいて、生体の発声器官から生体表面の検出部が取り付けられた位置までの当該生体の伝達関数、および、その逆伝達関数を算出する演算部と、その演算部で算出された逆伝達関数を利用した演算を行うフィルタを、検出部から出力される電気信号に適用してフィルタ処理を行う信号処理部と、その信号処理部によってフィルタ処理された電気信号を外部に出力する出力部と、を備える。また生体の発声器官から発声されて空間を伝播した気導音を収音し、電気信号に変換する収音部と、信号処理部において上記フィルタが適用された電気信号と、収音部から出力される電気信号とを比較し、比較結果に基づいて演算部で算出された逆伝達関数の補正量を算出する比較演算部と、を備える。演算部は、比較演算部で算出された補正量に基づいて、逆伝達関数を補正する。
【0007】
本発明の一側面においては、使用者の発声器官から体表の検出部が取り付けられた位置までの逆伝達関数を用いて骨導振動情報を補正するため、気導音に近い、原音の再現性が高い音質が得られる。
【発明の効果】
【0008】
以上のように、本発明の一側面によれば、取得した骨導音から、気導音と同等な再現性の高い音声情報を得ることができる。
【発明を実施するための最良の形態】
【0009】
以下、本発明の実施の形態の例について、添付図面を参照しながら説明する。
【0010】
以下に述べる実施の形態は、本発明を実施するための好適な形態の具体例であるから、技術的に好ましい種々の限定が付されている。ただし、本発明は、以下の実施の形態の説明において特に本発明を限定する旨の記載がない限り、これらの実施の形態に限られるものではない。したがって、例えば、以下の説明で挙げる使用材料とその使用量、処理時間、処理順序および各パラメータの数値的条件等は好適例に過ぎず、また、説明に用いた各図における寸法、形状および配置関係等も実施の形態の一例を示す概略的なものである。
【0011】
本発明は、人間など生体の発する音声を認識する手法として、人体中を伝導する音声を利用したものであり、特に骨格を伝導する音声(骨導音)を取得するマイクロホン装置に関する。そのマイクロホン装置は、大きく分けて、発音により体表に発生する微細振動を高周波数域まで計測可能なセンサと、そのセンサから出力される音声信号を補正する装置から構成される。
【0012】
本発明の一実施の形態においては、上記センサに、歪みに応じて電荷を発生する圧電効果を有する素子、すなわち圧電素子であるポリフッ化ビニリデン(PVDF:PolyVinylidine DiFluoride) フィルムを利用する。このポリフッ化ビニリデン(以下、「PVDF」という。)フィルムを用いてPVDF骨導音センサを構成し、PVDF骨導音センサを体表の任意の箇所に固定して、そのPVDF骨導音センサが体表の振動を検出することにより骨導音を取得する。
【0013】
図1は、本発明の一実施の形態に係るPVDF骨導音センサの使用例を示した図である。
図示された例は、PVDF骨導音センサ1のPVDFフィルムを使用者の額に密着させ、ゴムバンド等の固定手段2で固定した場合の例である。額に固定したPVDF骨導音センサ1によって、使用者から発せられた音声を検出する。
【0014】
図2は、図1に示したPVDF骨導音センサの概略構成を示す斜視図である。また、図3は、図2に示したPVDF骨導音センサ1のX-X線に沿う断面図である。なお、図3では、固定手段2の記載は省略している。
【0015】
図2,図3に示すように、PVDF骨導音センサ1は、PVDFフィルム11と、緩衝材12、絶縁板13、および、固定手段2を含むように構成される。さらにPVDFフィルム11の一方の端部近傍には、電極14が設けられ、その電極14にはリード線15が接続している。リード線15は、後述する増幅部21と接続している。
【0016】
PVDFフィルム11は、その一の面が体表(例えば、額の表面など)に密着するよう略矩形もしくは正方形の板状に形成されている。PVDFフィルム11は、その形状が矩形の板状である場合、長手方向が骨導振動の検出方向になることが知られている。図2に示す例では、PVDFフィルム11の生体振動の検出方向は、体表に沿ってPVDFフィルム11の長手方向であるから、帯状の固定手段2の短手方向すなわち額の縦方向V1である。
【0017】
緩衝材12は、PVDFフィルム11を体表に均一に押し当てるとともに高品位の音声を取得するためのものであり、絶縁板13とPVDFフィルム11の間に挟装される。緩衝材12の形状は、おおよそ板状であり、緩衝材11には、絶縁板13を介して固定手段2からの押力が直接かからないよう海綿状の構造を持つスポンジ(発泡体)などが用いられる。その平面部分の面積(大きさ)は、PVDFフィルム11を体表に均一に押し当てる上で、PVDFフィルム11の平面部分の面積(大きさ)と同じか、または大きい方が好ましい。緩衝材12の材料としては、例えば化粧用パフに用いられるニトリルゴム(NBR)、エチレン酢酸ビニール共重合樹脂(EVA)、あるいは、プレーンゴムなどの有機高分子を主成分とする弾性材料が用いられる。
【0018】
なお、緩衝材12を設けず、ゴムバンド等の固定手段によってPVDFフィルム11を体表に押し当てるようにしてもよい。ただし、緩衝材12を設けた場合の方が、緩衝材12を使用しない場合のそれと比較して、音声の再現性が良好であることが、本発明者らによる実験で確かめられている。また、緩衝材はスポンジに限らず他の組成や構造を持つ材料でもよいが、スポンジは他の材料と比べて高周波数帯域の音声の再現性がよい。さらに、スポンジの厚みによってPVDFフィルム11で検出される音声の周波数特性が異なる。
【0019】
絶縁板13は、PVDFフィルム11およびスポンジ12が設けられた側と、固定手段2側との間に設けられ、電気や熱の伝導を防ぐものである。本実施の形態では、絶縁板13としてゴム板を使用するが、この例に限られない。
【0020】
固定手段2は、PVDFフィルム11を体表に均一に押し当てるため、前記PVDFフィルム11の平面部の垂直方向に力を加えるものである。固定手段2によってPVDFフィルム11が表皮に密着できればよく、強い押し当て力は不要である。この例では、ゴムバンドを使用しているがこの例に限られない。例えば、帽子、ヘルメットまたはゴーグルなどを利用してPVDFフィルム11を体表に密着させるようにしてもよい。さらに、PVDFフィルムの額と密着する面に接着剤を塗布、または、粘着テープを貼付してPVDFフィルムと額を密着させるようにしてもよい。ただし、接着剤および粘着テープを使用しない場合の方が、それらを使用する場合と比較して体表の微細振動の検出感度が良好であることが、本願の出願人による実験で確かめられている。
【0021】
従来の骨導振動を検出するセンサは、生体振動により加振されることで生じるセンサ内部の構造体の変形を電荷(電荷信号)に換えて出力するものがほとんどである。一方、本実施の形態に係るPVDF骨導音センサ1は、例えば額の表皮にPVDFフィルム11を密着させることにより、骨導音によって表皮に生じるひずみを直接電荷(電荷信号)に換えて出力する。これにより、PVDF骨導音センサ1自体の共振特性によらず、高域を含む広い周波数帯域で起伏のないフラットな出力特性を持たせることができる。
【0022】
また、生体振動の検出方向が体表に沿う方向であるため、外部の騒音による(体表に対し垂直方向に加わる)音圧の影響を受けにくい。
【0023】
さらに、空気と体表とのインピーダンスは大きく異なるため、生体外部からの騒音によって表皮にはほとんど歪みは生じない。そのため、特別なフィルタ回路を必要とせずにPVDF骨導音センサ1単体で外部からの騒音を遮断することができる。
【0024】
図4は、本発明の一実施の形態に係るPVDF骨導音センサの他の使用例を示した図である。
使用者の発声器官から発せられた音声の骨導振動を額で検出すると、その振動方向は額の表皮に沿って横方向であることが、本発明者らの実験により確かめられた。そこで、図4に示すように、PVDF骨導音センサ1(PVDFフィルム)の長手方向が、帯状の固定手段2の長手方向に沿うようにPVDF骨導音センサ1を固定する。このように、PVDF骨導音センサ1の骨導振動の検出方向を固定手段2の長手方向すなわち額の横方向V2にすることによって、図2に示したPVDF骨導音センサ1よりも、さらに微細な振動を検出することができるようになる。
【0025】
ここで、図5~図8を参照して、騒音環境下における実験によって得られた結果に基づいてPVDF骨導音センサを評価する。
実験に使用したPVDF骨導音センサは、PVDFフィルム11に東京センサ社製の「DT1-028K/L(30×12mm,厚さ28μm)」、緩衝材12としてスポンジ、絶縁板13としてゴム板を使用し、PVDFフィルム11とゴム板(絶縁板13)との間にスポンジ(緩衝材12)を挟んだ。そして、このPVDF骨導音センサを、ゴムバンドを固定手段2として用いて固定した。さらに、プラスチック板をゴム板(絶縁板13)に貼り付け、ゴム板(絶縁板13)とゴムバンド(固定手段2)の間にプラスチック板を配置した。
【0026】
図5は、ホワイトノイズ下でPVDF骨導音センサより得られた信号の短時間高速フーリエ変換(短時間FFT(FFT:Fast Fourier Transform))結果の例を示す図である。横軸は時間[s]、縦軸は周波数[Hz]とパワースペクトラムを表す。アプリケーションの元データのパワースペクトラムの表示は、図ではカラー(有彩色)表示されていないが、実際はパワーの強い方から弱い方に向かって赤色、緑色、青色のように段階的にカラー表示されている。測定は、90dBのホワイトノイズの下、被験者が何も発声しない状態において、PVDF骨導音センサから出力される信号を検出し、検出した信号を短時間FFT処理する方法によって行った。なお、ホワイトノイズとは、全ての(広帯域にわたる)周波数を含む雑音のことである。
【0027】
一般に、気導音を検出するマイクロホンの場合には全周波数帯域で赤くなるが、図5に示した例では、外来ノイズ(空気中を伝導する音声)の検出が抑えられ、広い領域で緑色になっている。すなわち、PVDF骨導音センサの場合、1000Hz~3000Hz付近の帯域以外の雑音は30dB程度抑えられており、PVDF骨導音センサそのものがバンドバスフィルタとして機能していることがわかる。なお、一般に音声の取得に必要な周波数帯域は、200Hz~5000Hz程度とされている。
【0028】
図6は、ホワイトノイズ下で測定された音声信号の短時間FFT結果の例を示す図であり、(a)はマイクロホン、(b)はPVDF骨導音センサの場合である。横軸は時間[s]、縦軸は周波数[Hz]とパワースペクトラムを表し、図5と同様に元データはカラー表示されている。測定は、90dBのホワイトノイズの下で、被験者がニュース原稿を読んだ場合にPVDF骨導音センサから出力される信号を検出し、検出した信号を短時間FFT処理する方法によって行った。なお、被験者の音声には、200Hz~5000Hzのバンドパスフィルタをかけてある。
【0029】
図6(a)に示すように、マイクロホンの場合、ホワイトノイズ下では約5000Hz以上の周波数帯域でも外来ノイズを拾ってしまい、赤く表示される。一方、PVDF骨導音センサの場合、図6(b)に示すように、音声明瞭度は低いものの約3000Hzを超える帯域の雑音が抑えられており、被験者の会話内容が断片的に聞き取れるものとなっている。
【0030】
図7は、工事現場騒音下で測定された音声信号の短時間FFT結果の例を示す図であり、(a)はマイクロホン、(b)はPVDF骨導音センサの場合である。横軸は時間[s]、縦軸は周波数[Hz]とパワースペクトラムを表し、図5と同様に元データはカラー表示されている。測定は、85dBの工事現場騒音の下で、被験者がニュース原稿を読んだ場合にPVDF骨導音センサから出力される信号を検出し、検出した信号を短時間FFT処理する方法によって行った。なお、上述同様、被験者の音声には、200Hz~5000Hzのバンドパスフィルタをかけてある。
【0031】
図7(a)に示すように、マイクロホンの場合、ほぼ1000Hz以下のノイズを全ての時間にわたって拾ってしまう。一方、図7(b)は、PVDF骨導音センサの場合には、ほぼ1000Hz以下のノイズが全ての時間にわたって遮断されることを示している。
【0032】
図8は、図7の工事現場騒音下で測定された音声信号の波形の例を示す図であり、(a)はマイクロホン、(b)はPVDF骨導音センサの場合である。図8(a),(b)からわかるように、PVDF骨導音センサの場合は会話内容に伴って音声の波形が変化しており、被験者の会話内容が明確に聞き取れるものとなっている。
【0033】
以上説明したように、PVDF骨導音センサ1のPVDFフィルム11を使用者の体表の任意の位置に密着させるだけでよく、強い押し当て力は不要であるので、PVDFフィルム自体も感触が優しくて柔らかな薄型の形状に加工できる。このため、使用者の体表への装着性がよく、長時間装用が可能である。
【0034】
また、生体振動(骨導振動)の検出方向が体表に沿う方向であるため、外部の騒音による(体表に垂直方向に加わる)音圧の影響を受けにくく、騒音環境下に強い。
【0035】
また、PVDF骨導音センサ1のPVDFフィルム11の一の面を表皮に密着させるため、センサ構造由来の共振の影響がなく、高域までフラットな周波数特性が得られる。
【0036】
なお、図5~図8に示した測定データは、PVDF骨導音センサに海綿状の構造を持つスポンジ(発泡体)で構成した緩衝材12を用いた場合の例であるが、緩衝材12の種類によって、取得できる周波数範囲や出力レベルが変わってくる。ただ、材質が変わっても、スポンジ状のものであれば、その差はそれほど大きくはない。
【0037】
それに対し、海綿状の構造を持つスポンジ(発泡体)に替えて硬質のプラスチック板を挿入すると、本発明者らの実験では周波数範囲はかなり狭くなるという結果が得られた。ただ、プラスチック板を用いた場合、外部の騒音も音声信号(200~4000Hzあたり)の周波数で低下するので、会話の内容が重要で音声の質を問題にしない場合(音声認識等に用いない等)は、有用である。反対に、スポンジを用いた場合は、外部ノイズさえ消去できれば、計測可能な周波数範囲は広いので、音声認識等に利用するには適していると言える。
すなわち、スポンジを用いた場合は、周波数範囲は8000Hz程度以下で、音声認識に適している。一方、プラスチック板を用いた場合は、周波数範囲は4000Hz程度以下で、外部からの騒音が会話領域で小さく、語音認識に適している。
【0038】
ところで、骨導音と気導音とでは、その伝達経路が異なるため、卓越する(伝導しやすい)周波数成分も異なる。よって、PVDF骨導音センサにより骨導振動を高品位に検出し、検出した信号を再生したとしても、気導音と異なった音質となる。通常、人間を含む動物は気導音によりコミュニケーション(会話)を行っている。したがって、骨導音を正確に再現するだけでは、人体の発声器官で発声された原音を忠実に再現する高品質のマイクロホン(「Hi-Fiマイクロホン」とも呼ばれる。)としては機能し得ず、取得した骨導振動を気導音と同等な周波数成分を持つ電気信号へと変換する必要がある。
【0039】
そこで、本発明では、例えば舌打ちなどにより発生する擬似インパルス音により、人体の発声器官から額など体表のPVDF骨導音センサが固定された箇所までの伝達関数を求め、その逆伝達関数により、高品位に取得した骨導振動に対応する電気信号を補正して出力するようにする。また、周囲環境が比較的静寂な場合には、通常のマイクロホンで収音した音声情報と骨導振動情報から伝達関数およびその逆伝達関数を常に補正していく学習回路も用意する。
【0040】
次に、本発明の一実施の形態に係るPVDF骨導音センサを適用したマイクロホン装置について説明する。
【0041】
図9は、上述したPVDF骨導音センサを適用したマイクロホン装置の概略構成を示すブロック図である。
図9に示すマイクロホン装置20は、PVDF骨導音センサ1と、増幅部21と、信号処理部22と、出力部23と、スイッチ24と、マイクロホン25と、増幅部26と、スイッチ27と、伝達関数演算処理部28を含む。さらに、プログラムメモリ30と、揮発性メモリ31と、不揮発性メモリ32と、制御演算部33と、比較演算部34と、操作部35を含むように構成される。各ブロックは、バス29を介して相互にデータの送受信が可能なように接続されている。
【0042】
PVDF骨導音センサ1は、上述したようにPVDFフィルム11(特許請求の範囲に記載した検出部の一例)およびその他の部品から構成され、使用者の体表、例えば額に取り付けられる。使用者の発声器官から発せられた音声による体表の骨導振動をPVDFフィルム11で検出し、検出した振動に応じた電荷を発生させて増幅部21へ出力するものである。
【0043】
増幅部21は、PVDF骨導音センサ1から入力された電荷の情報を電気信号(電圧信号)に変換し、信号処理部22またはスイッチ24に出力するものである。この増幅部21には、電荷信号を電圧信号に変換するいわゆるチャージアンプを利用できる。
【0044】
信号処理部22は、フィルタ回路を備えており、増幅部21から入力された電気信号u(t)にフィルタを適用し、フィルタ処理した出力音声信号y(t)を出力部23へ出力するものである。フィルタ回路は 使用者の発声器官から人体表面のPVDF骨導音センサ1が取り付けられた位置までの伝達関数G(s)に対する逆伝達関数G(s)-1に基づいてフィルタ処理を行う。計算に用いる逆伝達関数G(s)-1については、不揮発性メモリ32から読み込んで使用する。なお、tは時間、sは複素数を表しており、t領域は時間領域、s領域は複素領域を表す。この信号処理部22としては、汎用のプロセッサの他、デジタルシグナルプロセッサ(DSP:Digital Signal Processor)を用いることができる。
【0045】
ここで信号処理部22で実施されるフィルタ処理を説明する。まずt領域の入力信号u(t)をラプラス変換してs領域の関数U(s)を計算し、この関数U(s)に逆伝達関数G(s)-1をたたみ込み積分して関数Y(s)を得る。そして、関数Y(s)を逆ラプラス変換して時間領域の関数で表された出力音声信号y(t)が求められる。つまり、信号処理部22では、大きく2つの処理が行われている。
(1) Y(s)=G(s)-1・U(s)
(2) 逆ラプラス変換Y(s)→y(t)
【0046】
出力部23は、外部のスピーカ、レコーダ、あるいは音声認識装置などに対して、信号処理部22から供給された出力音声信号を出力するインタフェースである。
【0047】
スイッチ24は、制御演算部32からの制御信号により開状態と閉状態を切り換える切換手段である。スイッチ24が閉状態のとき、増幅部21から出力された電気信号が、このスイッチ24を介して伝達関数演算処理部28に入力される。
【0048】
マイクロホン25、増幅部26およびスイッチ27は、使用者の発声器官から人体表面のPVDF骨導音センサ1が取り付けられた位置までの伝達関数G(s)およびそれに対する逆伝達関数G(s)-1を補正するための信号を取得するのに設けられた回路である。
【0049】
マイクロホン25は、特許請求の範囲に記載した収音部の一例であり、体表にPVDF骨導音センサ1が取り付けられた使用者の発声器官から発せられた音声の気導振動(音圧)を検出し、検出した気導振動に応じた電気信号(電圧信号)を発生して増幅部26に出力する。なお、このマイクロホン25は、使用者の体の任意の場所に取り付けてもよいし、マイクロホン装置20と完全に別体構成として後述する補正モードのときのみ使用者の口の近くに設置するとともに、マイクロホン装置20の増幅部26と接続するようにしてもよい。
【0050】
増幅部26は、マイクロホン25から入力された電気信号を増幅し、増幅した電気信号をスイッチ27に出力するものである。この増幅部26は、マイクロホン25から入力される電気信号の信号レベルが十分に大きい場合は設けなくてもよい。
【0051】
スイッチ27は、制御演算部33からの制御信号により開状態と閉状態を切り換える切換手段である。スイッチ26が閉状態のとき、マイクロホン25から出力された電気信号m(t)が、このスイッチ27を介して伝達関数演算処理部28に入力される。
【0052】
伝達関数演算処理部28は、特許請求の範囲に記載した演算部の一例であり、入力されたt領域の関数をs領域の関数に変換するラプラス変換を用いて、PVDF骨導音センサ1を用いたプロセス、および、マイクロホン25を用いたプロセスのそれぞれの動特性を表す伝達関数を求める。この伝達関数演算処理部28としては、汎用のプロセッサの他、デジタルシグナルプロセッサ(DSP:Digital Signal Processor)を用いることができる。
【0053】
例えば、本実施の形態において、人体の発声器官から発声された音声(原音)の信号u(t)をラプラス変換した関数をU(s)、使用者の発声器官から体表のPVDF骨導音センサ1が取り付けられた位置までの伝達関数をG(s)、またPVDF骨導音センサ1から出力され増幅器21で増幅された電気信号u(t)をラプラス変換した関数をU(s)とすると、PVDF骨導音センサ1の入出力の関係は、次式のように表される。
U(s)=G(s)・U(s)・・・・・(1)
【0054】
ここで、発声器官から発声された音声の信号u(t)が、インパルス状である場合、信号u(t)をラプラス変換すると1になることから、(1)式より次式が導かれる。
U(s)=G(s)・・・・・・・・・・(2)
【0055】
つまり、発声器官でインパルス状の音声を発声し、このとき増幅部21から入力される電気信号u(t)をラプラス変換し、s領域の関数U(s)を計算することにより、発声器官から体表のPVDF骨導音センサ1が取り付けられた位置までの伝達関数G(s)が求められる。そして、求めた伝達関数G(s)を、揮発性メモリ31に一時記憶する。
【0056】
発声器官で発声するインパルス状の音声としては、一例として舌打ち音が挙げられる。舌打ち音は「あ」や「お」といった他の音と比較して多くの周波数成分が含まれているので、使用者が発した音声のより正確な周波数解析が行える。勿論、舌打ち音以外の他の発声音により、使用者の発声器官から体表の所定部位までの伝達関数を求めるようにしてもよい。なお、伝達関数G(s)からその逆伝達関数G(s)-1を計算することは容易であるから、伝達関数演算処理部28で伝達関数G(s)を計算するとともに逆伝達関数G(s)-1も計算し、揮発性メモリ31に一時記憶、もしくは不揮発性メモリ32に保存するようにしてもよい。
【0057】
また、伝達関数演算処理部28は、マイクロホン25から出力され増幅器26で増幅された電気信号m(t)をラプラス変換して、s領域の関数M(s)を計算する。そして、求めた関数M(s)を、揮発性メモリ31に一時記憶する。なお、後述する比較演算部34での比較演算に使用するため、マイクロホン25で収音する音声と、PVDF骨導音センサ1で検出する骨動振動に対応する音声は、同一使用者の同一音源とすると、比較演算部34での比較処理をしやすく都合がよい。
【0058】
プログラムメモリ30は、ROM(Read Only Member)などの不揮発性の記憶手段であり、制御演算部33が制御または演算を行う際に読み出す各種のプログラムや設定値などを保存するものである。
【0059】
揮発性メモリ31は、RAM(Random Access Memory)などの揮発性の記憶手段であり、制御演算部33が制御または演算を行う際の作業領域として使用されるものである。この揮発性メモリ31には、伝達関数演算処理部28で計算された伝達関数G(s)や逆伝達関数G(s)-1が一時記憶される。
【0060】
不揮発性メモリ32は、不揮発性の記録手段であり、例えばフラッシュメモリなどの半導体メモリやハードディスクドライブ(HDD:Hard Disk Drive)、あるいはDVD(Digital Versatile Disk)等の記録メディアなどが適用される。この不揮発性メモリ32には、伝達関数演算処理部28で計算された伝達関数G(s)や逆伝達関数G(s)-1が保存される。
【0061】
制御演算部33は、例えばCPU(Central Processing Unit)などのプロセッサから構成され、プログラムメモリ30に記録されているプログラムを揮発性メモリ31に読み出して実行することにより、各ブロックの制御やデータの加工・演算等を行う。例えば、伝達関数演算処理部28において伝達関数G(s)や逆伝達関数G(s)-1を計算すると説明したが、この例に限られない。任意の信号から伝達関数G(s)やその逆伝達関数G(s)-1を計算するためのプログラムをプログラムメモリ30に保存しておき、制御演算部33が、そのプログラムを実行して、入力された信号の伝達関数G(s)やその逆伝達関数G(s)-1を計算するようにしてもよい。
【0062】
比較演算部34は、特許請求の範囲に記載した比較演算部の一例であって、学習機能の主要部である。比較演算部34では、PVDF骨導音センサ1の系統における信号処理部22の出力音声信号y(t)に対応するs領域の関数Y(s)(入力がインパルスのとき出力の関数Y(s)=G(s)である。)と、マイクロホン25の系統における増幅部26の出力信号m(t)に対応するs領域の関数M(s)とを比較する。関数Y(s)と関数M(s)は同一であることが理想だが、実際には使用者の発声器官から体表のPVDF骨導音センサ1が取り付けられた位置までの伝達関数の分だけ誤差が生じる。そこで、関数Y(s)と関数M(s)の間に予め設定した閾値以上の誤差がある場合には、誤差量に基づいて逆伝達関数G(s)-1の補正量ΔG(s)-1を計算し、信号処理部22へ供給する。補正量ΔG(s)-1が供給された信号処理部22では、比較演算部34から入力された補正量ΔG(s)-1に基づいて逆伝達関数の補正が行われる。
【0063】
操作部35は、使用者の操作に応じた操作信号を生成し、図示しないインタフェースを介して制御演算部に操作信号を供給するものであり、押ボタンや操作キーなどから構成される。使用者が操作部35を操作することにより、例えば使用者の発声器官からPVDF骨導音センサ1までの逆伝達関数G(s)-1を初期値として登録する登録モード、通常の録音を行う録音モード、さらに骨導振動情報(逆伝達関数)を補正する補正モードが切り換えられる。
【0064】
次に、上述のように構成されたマイクロホン装置20の登録モード時の動作を説明する。
初期値登録モードが選択されたとき、制御演算部33は、スイッチ24を閉状態にする。登録モードにおいて、使用者の体表(例えば額)に取り付けたPVDF骨導音センサ1は、使用者が発したインパルス状の音声による体表の骨導振動を検出すると、その骨導振動に応じた電荷信号を発生する。この電荷信号は増幅部21で電気信号u(t)に変換されてスイッチ24を介して伝達関数演算処理部28に入力される。伝達関数演算処理部28は、入力された電気信号u(t)から、使用者の発声器官から体表のPVDF骨導音センサ1が取り付けられた位置までの伝達関数G(s)および逆伝達関数G(s)-1を計算する。そして、この逆伝達関数G(s)-1が不揮発性メモリ32に送られ保存される。
【0065】
続いて、マイクロホン装置20の録音モード時の動作を説明する。
録音モードが選択されたとき、制御演算部33は、スイッチ24,27を開状態にする。これと並行して、信号処理部22は、登録モードにより登録された使用者の発声器官から体表に取り付けられたPVDF骨導音センサ1までの逆伝達関数G(s)-1を、不揮発性メモリ32から読み込んで内部のフィルタに設定する。
【0066】
そして、使用者の体表(例えば額)に取り付けたPVDF骨導音センサ1が、使用者の発した音声による体表の骨導振動を検出すると、その骨導振動に応じた電荷信号を発生する。この電荷信号は増幅部21で電気信号u(t)に変換されて信号処理部22に入力される。信号処理部22は、入力される電圧信号u(t)に対し逆伝達関数G(s)-1が設定されたフィルタを適用して出力音声信号y(t)を算出し、出力音声信号y(t)を出力部23へ出力する。出力部23は、信号処理部22から出力された出力音声信号y(t)を、スピーカ、レコーダあるいは音声認識装置等へ出力する。
【0067】
このように、使用者の発声器官から体表のPVDF骨導音センサ1が取り付けられた位置までの伝達関数G(s)の逆伝達関数G(s)-1を用いて、PVDF骨導音センサ1で検出した骨導振動情報(電気信号u(t))を補正するので、気導音に近い、つまり発声器官で発せられた音声に忠実な音声が得られる。
【0068】
また、伝達関数G(s)および逆伝達関数G(s)-1を、初期値として下打ち音等のインパルス状の音声から導出することができるので、マイクロホン装置の使用に先立って予め学習をさせる必要がなく、使い勝手がよい。
【0069】
なお、上述したマイクロホン装置20のPVDF骨導音センサ1と増幅部21は、有線または無線で接続され、増幅部21を含む各ブロックを筐体に収納して該筐体を例えば視聴者の身体の任意の位置に取り付けたり、バッグなどに収納したりしてもよい。または、また、ノイズを軽減するために、少なくとも増幅部21をPVDF骨導音センサ1と一体構成としてもよい。さらにまた、PVDF骨導音センサ1を除く、または、PVDF骨導音センサ1と増幅部21を除く各ブロックの機能を携帯電話端末等の携帯機器に設けるようにしてもよい。
【0070】
次に、図10を参照して、マイクロホン装置20の学習機能、すなわち補正モード時の動作を説明する。
【0071】
まず、ステップS1において、使用者が操作部35を操作して補正モードに切り換えると、制御演算部33は、補正モードに切り換えられたことを検出してスイッチ24,27を閉状態にする。この処理が終了すると、ステップS2に進む。
【0072】
ステップS2において、使用者が例えば舌打ち音などのインパルス状の音声を発すると、使用者の体表(例えば額)に取り付けたPVDF骨導音センサ1は、使用者が発したインパルス状の音声による体表の骨導振動を検出し、その骨導振動に応じた電荷信号を発生する。この電荷信号は増幅部21で電気信号u(t)に変換されてスイッチ24を介して伝達関数演算処理部28に入力される。一方、マイクロホン25は、使用者が発したインパルス状の音声(気導音)を検出して電気信号に変換し、その電気信号を増幅部26へ送る。増幅部26に送られた電気信号は増幅された後、スイッチ24を介して伝達関数演算処理部28に入力される。この処理が終了した後、ステップS3に進む。
【0073】
ステップS3において、伝達関数演算処理部28は、入力された電気信号u(t)からインパルス音の入力に対する、使用者の発声器官から体表のPVDF骨導音センサ1が取り付けられた位置までの伝達関数G(s)を計算する。この処理が終了した後、ステップS4に進む。
【0074】
ステップS4において、伝達関数演算処理部28は、上記ステップS3の処理で計算した伝達関数G(s)に対応する逆伝達関数G(s)-1を計算し、揮発性メモリ31に一時記憶する。この処理が終了した後、ステップS5に進む。
【0075】
ステップS5において、伝達関数演算処理部28は、逆伝達関数G(s)-1について補正処理を行う必要があるか否かを判定する。この判定は、後述する関数Y(s)と関数M(s)の比較結果(誤差)に基づいて算出される補正信号の有無により行われるので、初期段階では補正なしと判定し、ステップS7に進む。一方、補正ありと判定した場合はステップS6に進む。補正ありの場合の処理については後述する。
【0076】
ステップS7において、信号処理部22は、入力された電気信号u(t)をラプラス変換して、例えば図11(a)示すような、関数U(s)を得る。そして、その関数U(s)に逆伝達関数G(s)-1をたたみ込み積分して、例えば図11(b)に示すような、出力音声信号の関数Y(s)を得、この関数Y(s)を比較演算部34に送る。それと並行して、伝達関数演算処理部28は、入力された電気信号m(t)をラプラス変換して、例えば図11(b)に示すような、関数M(s)を得、この関数M(s)を比較演算部34に送る。この処理が終了した後、ステップS8に進む。
【0077】
ステップS8において、比較演算部34は、PVDF骨導音センサ1を経路した出力音声信号の関数Y(s)と、マイクロホン25を経路した出力信号の関数M(s)を比較する。この比較処理により、PVDF骨導音センサ1で検出した骨導音とマイクロホン25で検出した気導音との差異の有無により、信号処理部22で用いられる逆伝達関数G(s)-1が正確かどうか、つまり使用者が骨導音ではなく気導音を聞いているかのような感覚を奏するものであるか否かが判定される。この処理が終了した後、ステップS9に進む。
【0078】
ステップS9において、比較演算部34は、ステップS8における比較の結果、誤差があると判定した場合には、ステップS10に進む。一方、関数Y(s)と関数M(s)の比較結果に誤差がないと判定した場合には、ステップS11に進む。なお、ここでは実際の誤差の有無を判定の基準としたが、得られた誤差が予め不揮発性メモリ31等に保存しておいた所定の閾値の範囲内であれば、誤差なしと判定するようにしてもよい。
【0079】
ステップS10において、比較演算部34は、ステップS9の比較結果すなわち誤差量に応じて逆伝達関数G(s)-1の補正量ΔG(s)-1を計算し、伝達関数演算処理部28に入力する。この処理が終了後、ステップS5の処理に進む。
【0080】
ステップS5において、伝達関数演算処理部28は、先に求めた逆伝達関数G(s)-1について補正処理を行う必要があるか否かを判定する。ここでは、補正信号の入力があるので補正ありと判定し、ステップS6に進む。
【0081】
ステップS6において、伝達関数演算処理部28は、入力されたΔG(s)-1に基づいて、先に求めた逆伝達関数G(s)-1を補正する。補正した逆伝達関数G′(s)-1(=G(s)-1+ΔG(s)-1)は新たな逆伝達関数として、揮発性メモリ31に一時記憶され、ステップS7以降の処理に使用される。
【0082】
上記ステップS6の処理が終了後、ステップS7において、信号処理部22および伝達関数演算処理部28は各々、補正後の逆伝達関数G′(s)-1に基づいて、PVDF骨導音センサ1を経由した出力音声信号の関数Y(s)、および、マイクロホン25を経由した出力信号の関数M(s)を計算する。この処理が終了した後、ステップS8に進む。
【0083】
ステップS8において、比較演算部34は、PVDF骨導音センサ1を経路した出力音声信号の関数Y(s)と、マイクロホン25を経路した出力信号の関数M(s)を比較する。この処理が終了した後、ステップS9に進む。
【0084】
ステップS9において、比較演算部34は、再度、関数Y(s)と関数M(s)を比較し、比較の結果、誤差があると判定した場合には、ステップS10に進む。一方、関数Y(s)と関数M(s)を比較して誤差がないと判定した場合には、ステップS11に進む。
【0085】
そして、ステップ11において、比較演算部34は、最終的に誤差なしと判定された逆伝達関数を、不揮発性メモリ32に保存する。この処理が終了した後、一連の補正モードの処理を終了する。
【0086】
このような補正モードにおける処理(学習機能)により、信号処理部22で用いられる逆伝達関数G(s)-1を常に正確なもの、原音の再現性の高いものに改善できる。それにより、使用者は、PVDF骨導音センサ1を用いて取り込まれた音声に対して、骨導音ではなく気導音を聞いているかのような感覚を得ることができる。
【0087】
なお、図11に示した例では、補正モードが選択されると逆伝達関数を逐一求めるような処理(ステップS2~S4)としているが、登録モード時に不揮発性メモリ32に予め保存しておいた逆伝達関数を、以降の処理に利用するようにしてもよい。
【0088】
図12は、本発明の他の実施の形態に係るPVDF骨導音センサの使用例を示す図である。
この実施の形態では、PVDF骨導音センサに2枚のPVDFフィルム11A,11Bを使用し、これらを使用者の体表の任意の箇所、例えば額に重ねることで検出感度を向上させるようにしたものである。この場合、PVDFフィルム11Aの振動の検出方向とPVDFフィルム11Bの振動の検出方向を直交させて固定する。額で検出される骨導振動は、額の横方向が支配的ではあるが、縦方向からも検出される。したがって、このようにすることにより、額の横方向V2の振動のみならず、縦方向V1の振動も検出できるので、骨導振動のより高感度および高精度な検出が実現できる。
【0089】
以上説明したように、本発明のマイクロホン装置によれば、骨導振動を検出するPVDF骨導音センサに用いるPVDFフィルムを使用者の体表(表皮)に密着させるだけでよく、強い押し当て力は不要である。したがって、PVDFフィルム自体も感触が優しくて柔らかな薄型の形状に加工できる。このため、使用者の体表への装着性がよく、長時間装用が可能である。
【0090】
また、PVDF骨導音センサに用いるPVDFフィルムの生体振動(骨導振動)の検出方向が体表に沿う方向であるため、外部の騒音による(体表に垂直方向に加わる)音圧の影響を受けにくく、騒音環境下に強い。
【0091】
また、PVDF骨導音センサ1のPVDFフィルムの一の面を表皮に密着させるため、センサ構造由来の共振の影響がなく、高域までフラットな周波数特性が得られる。
【0092】
また、使用者の発声器官から体表のPVDF骨導音センサが取り付けられた位置までの逆伝達関数を用いて骨導振動情報を補正するため、気導音に近い、原音の再現性が高い音質が得られる。
【0093】
また、上記の逆伝達関数は、初期値として使用者の舌打ち音から導出することができるので、事前の学習なしに直ちに使用することができる。また、初期値として登録した逆伝達関数を、その後の学習により随時改善することができるため、信号処理部で出力音声信号を得る処理で用いられる逆伝達関数を常に正確なものに補正でき、原音の再現性を向上させることができる。
【0094】
さらに上記のことから、本発明のマイクロホン装置は、高騒音環境下で、高品位な音声取得が可能となるため、災害時(レスキュー用など)や工場等で使用可能な通信手段(コミュニケーションデバイス)として活用できる。また、PVDF骨導音センサを小型化することにより、携帯電話端末等への応用も可能である。また、取得できる音声が高音質なため、騒音環境下における音声認識装置への応用も可能である。さらにまた、広い周波数の体表振動を取得可能であるため、心音や呼吸音、眼針等も長時間にわたって計測可能であり、在宅の患者に利用してもらい遠隔地の病院などで行う検診に用いられる在宅健康モニタリングデバイスなどへの応用も考えられる。
【0095】
図13は、PVDF骨導音センサを頸部(喉)に取り付けて脈拍を測定した場合の測定データ例である。横軸は時間(t)、縦軸は電圧(V)を表す。また、図14は、PVDF骨導音センサを目蓋に取り付けて眼針すなわち眼の動きを測定した場合の測定データ例である。横軸は時間(t)、縦軸は電圧(V)を表す。このように、微細振動を検出して良好な測定データが得られる。
【0096】
なお、上述した実施の形態では、PVDFフィルムを用いて骨導音を検出するセンサを構成したが、圧電効果を有する板状の圧電素子であればこの例に限られない。
【0097】
さらに、上述した実施の形態では、使用者が一人の場合を想定して説明したが、本発明のマイクロホン装置を、複数の使用者で共用してもよい。この場合、使用者毎に発声器官から体表のPVDF骨導音センサが取り付けられた位置までの伝達関数およびその逆伝達関数を計算し、逆伝達関数を使用者のID(識別情報)やパスワード等と対応づけて不揮発性メモリや記録メディア等に保存しておく。そして、マイクロホン装置の使用を開始する度に、制御演算部がIDやパスワード等により使用者を識別し、対応している逆伝達関数を不揮発性メモリから読み出して、信号処理部などでの信号処理に利用する。
このようにした場合、予め使用者毎に逆伝達関数を登録しておけば、後で使用する際に再度逆伝達関数を測定する必要がなく、操作が簡素化され使い勝手がよくなる。また、使用者は、他人の逆伝達関数を使用することなく、自分の逆伝達関数を利用して処理された音声が得られるので、違和感のない音声が得られる。
【図面の簡単な説明】
【0098】
【図1】本発明の一実施の形態に係るPVDF骨導音センサの使用例を示す図である。
【図2】図1の示したPVDF骨導音センサの概略構成を示す斜視図である。
【図3】図2に示したPVDF骨導音センサの概略断面図(X-X線矢視)である。
【図4】本発明の一実施の形態に係るPVDF骨導音センサの他の使用例を示す図である。
【図5】ホワイトノイズ下でPVDF骨導音センサより得られた信号の短時間FFT結果の例を示す図である。
【図6】ホワイトノイズ下で測定された音声信号の短時間FFT結果の例を示す図であり、(a)はマイクロホン、(b)はPVDF骨導音センサである。
【図7】工事現場騒音下で測定された音声信号の短時間FFT結果の例を示す図であり、(a)はマイクロホン、(b)はPVDF骨導音センサである。
【図8】図7の工事現場騒音下で測定された音声信号の波形の例を示す図であり、(a)はマイクロホン、(b)はPVDF骨導音センサである。
【図9】本発明の一実施の形態に係るPVDF骨導音センサが適用されたマイクロホン装置の概略構成を示すブロック図である。
【図10】本発明の一実施の形態に係るマイクロホン装置による逆伝達関数の補正処理を示すフローチャートである。
【図11】図9に示したマイクロホン装置の各ブロックにおける音声信号の波形の例を示す図である。
【図12】本発明の他の実施の形態に係るPVDF骨導音センサの使用例を示す図である。
【図13】本発明のマイクロホン装置を応用して得られた脈拍の測定データ例を示す図である。
【図14】本発明のマイクロホン装置を応用して得られた眼針の測定データ例を示す図である。
【符号の説明】
【0099】
1…PVDF骨導音センサ、2…固定手段、11,11A,11B…PVDFフィルム、12…緩衝材、13…絶縁板、14…電極、15…リード線、20…マイクロホン装置、21…増幅部、22…信号処理部、23…出力部、24,27…スイッチ、25…マイクロホン、26…増幅部、28…伝達関数演算処理部、30…プログラムメモリ、31…揮発性メモリ、32…不揮発性メモリ、33…制御演算部、34…比較演算部、35…操作部
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図9】
4
【図10】
5
【図11】
6
【図12】
7
【図14】
8
【図5】
9
【図6】
10
【図7】
11
【図8】
12
【図13】
13