TOP > 国内特許検索 > 符号化装置、復号装置、パラメータ学習装置、およびプログラム

符号化装置、復号装置、パラメータ学習装置、およびプログラム NEW

国内特許コード P210017464
整理番号 S2019-0590-N0
掲載日 2021年3月12日
出願番号 特願2019-150516
公開番号 特開2021-033466
出願日 令和元年8月20日(2019.8.20)
公開日 令和3年3月1日(2021.3.1)
発明者
  • 中鹿 亘
出願人
  • 国立大学法人電気通信大学
発明の名称 符号化装置、復号装置、パラメータ学習装置、およびプログラム NEW
発明の概要 【課題】より高品位に符号化および復号する。
【解決手段】符号化部は、複素数の観測データを、勾配法を利用した学習により求められた複素数のパラメータが設定されたニューラルネットワークである複素ニューラルネットワークを用いて複素数のまま符号化し、複素数の潜在変数の分布を符号化データとして出力する。復号部は、複素数の観測データが符号化された符号化データを、勾配法を利用した学習により求められた複素数のパラメータが設定されたニューラルネットワークである複素ニューラルネットワークを用いて複素数のまま復号して得られる復号データとして、再構築された前記複素数の観測データを出力する。本技術は、例えば、音声データや画像データなどの複素数データの符号化および復号に適用できる。
【選択図】図3
従来技術、競合技術の概要

近年、ディープラーニングを用いた手法が飛躍的に高い精度を上げており、画像認識や音声認識などの幅広い分野において盛んに研究が行われている(例えば、非特許文献1参照)。

また、これまでに数多くのディープラーニング手法が提案されており、その中の最も代表的な生成モデルの一つとして、変分オートエンコーダ(variational autoencoder; VAE)が挙げられる(例えば、非特許文献2参照)。

産業上の利用分野

本開示は、符号化装置、復号装置、パラメータ学習装置、およびプログラムに関し、特に、より高品位に符号化および復号することができるようにした符号化装置、復号装置、パラメータ学習装置、およびプログラムに関する。

特許請求の範囲 【請求項1】
複素数の観測データを、勾配法を利用した学習により求められた複素数のパラメータが設定されたニューラルネットワークである複素ニューラルネットワークを用いて複素数のまま符号化し、複素数の潜在変数の分布を符号化データとして出力する符号化部
を備える符号化装置。

【請求項2】
前記複素ニューラルネットワークは、確率分布を使って潜在変数を求める生成モデルであるVAE(variational autoencoder)に基づいて、複素数データをそのまま扱えるように表現された複素VAEである
請求項1に記載の符号化装置。

【請求項3】
前記複素ニューラルネットワークの出力層となるノードが、前記複素数の潜在変数の分布の平均を出力する平均出力部、前記複素数の潜在変数の分布の分散を出力する分散出力部、および、前記複素数の潜在変数の分布の擬似分散を出力する擬似分散出力部により構成される
請求項2に記載の符号化装置。

【請求項4】
前記符号化部は、前記複素数の観測データをzとし、前記複素数のパラメータをφとし、前記平均をμとし、前記分散をσとし、前記擬似分散をδとし、前記複素数の潜在変数をhとしたときに、次の式で表される複素正規分布pθ(z|h)を前記符号化データとして求める
【数1】
(省略)
請求項3に記載の符号化装置。

【請求項5】
前記複素数の観測データを取得する複素数データ取得部と、
前記複素数の観測データを単位時間ごとに切り出してスペクトル特徴量を算出し、そのスペクトル特徴量を正規化して前記符号化部に供給する前処理部と、
前記複素数のパラメータを保持し、前記符号化部に設定するパラメータ保持部と
をさらに備える請求項1に記載の符号化装置。

【請求項6】
符号化装置のコンピュータに、
複素数の観測データを、勾配法を利用した学習により求められた複素数のパラメータが設定されたニューラルネットワークである複素ニューラルネットワークを用いて複素数のまま符号化し、複素数の潜在変数の分布を符号化データとして出力すること
を含む符号化処理を実行させるためのプログラム。

【請求項7】
複素数の観測データが符号化された符号化データである複素数の潜在変数を、勾配法を利用した学習により求められた複素数のパラメータが設定されたニューラルネットワークである複素ニューラルネットワークを用いて複素数のまま復号して得られる復号データとして、再構築された前記複素数の観測データを出力する復号部
を備える復号装置。

【請求項8】
前記複素ニューラルネットワークは、確率分布を使って潜在変数を求める生成モデルであるVAE(variational autoencoder)に基づいて、複素数データをそのまま扱えるように表現された複素VAEである
請求項7に記載の復号装置。

【請求項9】
前記複素ニューラルネットワークの出力層となるノードが、複素平均を出力する複素平均出力部、分散行列を出力する分散行列出力部、および、擬似分散行列を出力する擬似分散行列出力部により構成される
請求項8に記載の復号装置。

【請求項10】
前記復号部は、前記複素数の観測データをzとし、前記複素数のパラメータをθとし、前記複素平均をaとし、分散行列をΓとし、擬似分散行列をCとし、前記複素数の潜在変数をhとしたときに、次の式で表される多変量複素正規分布pφ(z|h)を前記復号データとして求める
【数2】
(省略)
請求項9に記載の復号装置。

【請求項11】
前記復号部から出力される前記復号データに対して、単位時間ごとに正規化されたスペクトル特徴量を元に戻す処理を施す後処理部と、
前記後処理部において後処理が施された前記復号データを出力する出力部と、
前記複素数のパラメータを保持し、前記復号部に設定するパラメータ保持部と
をさらに備える請求項7に記載の復号装置。

【請求項12】
復号装置のコンピュータに、
複素数の観測データが符号化された符号化データを、勾配法を利用した学習により求められた複素数のパラメータが設定されたニューラルネットワークである複素ニューラルネットワークを用いて複素数のまま復号して得られる復号データとして、再構築された前記複素数の観測データを出力すること
を含む復号処理を実行させるためのプログラム。

【請求項13】
複素数の観測データを、第1の複素数のパラメータが設定されたニューラルネットワークである第1の複素ニューラルネットワークを用いて複素数のまま符号化し、複素数の潜在変数の分布を符号化データとして出力する符号化部と、
前記符号化データを、第2の複素数のパラメータが設定されたニューラルネットワークである第2の複素ニューラルネットワークを用いて複素数のまま復号して得られる復号データとして、再構築された前記複素数の観測データを出力する復号部と
を備え、
前記第1の複素数のパラメータおよび前記第2の複素数のパラメータを、勾配法を利用した学習により求める
パラメータ学習装置。

【請求項14】
前記符号化部により符号化された前記符号化データについて、誤差を逆伝播させるための補助演算を行う補助演算部と、
前記補助演算部から出力される複素数の潜在変数の分布に対するサンプリングを行い、複素数の潜在変数のサンプルを取得して、前記復号部に供給するサンプリング部と
をさらに備える請求項13に記載のパラメータ学習装置。

【請求項15】
前記第1の複素数のパラメータおよび前記第2の複素数のパラメータが、所定の終了条件を満足したか否かを判定する判定部と、
前記判定部により所定の終了条件を満足していないと判定された場合に、前記第1の複素数のパラメータおよび前記第2の複素数のパラメータを更新するパラメータ更新部と
をさらに備える請求項13に記載のパラメータ学習装置。

【請求項16】
パラメータ学習装置のコンピュータに、
複素数の観測データを、第1の複素数のパラメータが設定されたニューラルネットワークである第1の複素ニューラルネットワークを用いて複素数のまま符号化し、複素数の潜在変数の分布を符号化データとして出力することと、
前記符号化データを、第2の複素数のパラメータが設定されたニューラルネットワークである第2の複素ニューラルネットワークを用いて複素数のまま復号して得られる復号データとして、再構築された前記複素数の観測データを出力することと
を含み、
前記第1の複素数のパラメータおよび前記第2の複素数のパラメータを、勾配法を利用した学習により求める
パラメータ学習処理を実行させるためのプログラム。
国際特許分類(IPC)
画像

※ 画像をクリックすると拡大します。

JP2019150516thum.jpg
出願権利状態 公開


PAGE TOP

close
close
close
close
close
close
close