TOP > 研究報告検索 > 聴覚の情景分析に基づく音声・音響処理システム

聴覚の情景分析に基づく音声・音響処理システム

研究報告コード R000000289
掲載日 2002年9月30日
研究者
  • 河原 英紀
研究者所属機関
  • 和歌山大学システム工学部
研究機関
  • 和歌山大学システム工学部
報告名称 聴覚の情景分析に基づく音声・音響処理システム
報告概要 この研究領域は脳機能の解明の内,脳型情報処理システムの構築を目指すものである。本研究の主な成果は,音声分析変換合成法STRAIGHTの基本周波数抽出アルゴリズムの精度および耐雑音性の改善と非周期的信号の情報表現に関する諸発明である。音声・音響の実時間処理に向け頑健性付与を視点にSTRAIGHTを見直し,非周期的信号の情報表現では,時間領域での不動点に基づく駆動情報の抽出方向を発明して特許化を図った。これは,音声からの声門閉止時点の抽出・決定手法であるに止まらず,機器の異常診断などの機械化にも有効である。また,STRAIGHTの非周期信号への拡張の本質が,Mellin変換を中心とした聴覚末梢系の計算理論と関連深いことが,明らかになりつつある。本年度は情報表現を主体に,その様々な音声技術への展開に着手した。この過程で課題となる,複数音源による音声・音響信号処理では,両耳・位相情報の利用など,手掛りを探索している。
研究分野
  • 聴覚
  • 聴覚・音声モデル
  • 音声処理
  • 自然語処理
  • 人工知能
関連発表論文 (1)Speech Communication,Vol.27,No.3-4,Restructuring speech epresentations using a pitch-adaptive time-frequency smoothing and an nstantaneous-frequency-based F0 extraction: Possible role of a repetitive structure in sounds pp.187-207,河原英紀、勝瀬郁代、Aシュベニエ
(2)6Th European Conference on Speech Communication and Technology FIXED POINT ANALYSIS OF FREQUENCY TO INSTANTANEOUS FREQUENCY MAPPING FOR ACCURATE ESTIMATION OF F0 AND PERIODICITY Hideki Kawahara, Haruhiro kawahara, Alain de Cheveigne, Roy D, Patterson
研究制度
  • 戦略的基礎研究推進事業、研究領域「脳を創る」研究代表者 河原 英紀(和歌山大学システム工学部)/科学技術振興事業団
研究報告資料
  • 河原 英紀. 聴覚の情景分析に基づく音声・音響処理システム. 戦略的基礎研究推進事業 平成11年度 研究年報.科学技術振興事業団, 2000. p.975 - 977.

PAGE TOP