SAP11_03

Similar documents
Missing Data NMF

応用音響学

SAP11_12

音情報処理I

応用音響学

<4D F736F F F696E74202D2091E6824F82518FCD E838B C68CEB82E894AD90B B2E >

様々なミクロ計量モデル†

画像処理工学

PowerPoint プレゼンテーション

DVIOUT

講義「○○○○」

Implementation of Computationally Efficient Real-Time Voice Conversion

Microsoft PowerPoint - aep_1.ppt [互換モード]

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

第 4 週コンボリューションその 2, 正弦波による分解 教科書 p. 16~ 目標コンボリューションの演習. 正弦波による信号の分解の考え方の理解. 正弦波の複素表現を学ぶ. 演習問題 問 1. 以下の図にならって,1 と 2 の δ 関数を図示せよ δ (t) 2

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

IBIStutorial2014

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

カイ二乗フィット検定、パラメータの誤差

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

統計的データ解析

参考書 (1) 中村, 山本, 吉田 : ウェーブレットによる信号処理と画像処理, 共立出版 応用の紹介とプログラムリストが中心, 理論的背景はほとんどなし 意味不明の比喩を多用 各時代 各国別に美女を探すのが窓フーリエ変換である 応用テーマ : 不連続信号検出, 相関の検出, ノイズ除去, 画像デ

Microsoft PowerPoint - CSA_B3_EX2.pptx

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

PowerPoint プレゼンテーション

Microsoft PowerPoint - LectureB1handout.ppt [互換モード]

Microsoft PowerPoint - 時系列解析(11)_講義用.pptx

基礎統計

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - SP _slides

Microsoft Word - 補論3.2

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

数値計算法

SAP11_08

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft PowerPoint - no1_17

1. 線形シフト不変システムと z 変換 ここで言う システム とは? 入力数列 T[ ] 出力数列 一意変換 ( 演算子 ) 概念的には,, x 2, x 1, x 0, x 1, x 2, を入力すると, y 2, y 1, y 0, y 1, y 2, が出力される. 線形システム : 線形シ

Microsoft PowerPoint - 10.pptx

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

<4D F736F F F696E74202D2091E6824F82538FCD8CEB82E88C9F8F6F814592F990B382CC8CB4979D82BB82CC82505F D E95848D8682CC90B69

PowerPoint プレゼンテーション

PowerPoint Presentation

Microsoft Word - reg.doc

Microsoft PowerPoint - LectureB1_17woAN.pptx

Probit , Mixed logit

Microsoft PowerPoint - no1_19.pptx

memo

スライド 1

PowerPoint プレゼンテーション

Microsoft PowerPoint - 物情数学C(2012)(フーリエ前半)_up

線形システム応答 Linear System response

第6章 実験モード解析

景気指標の新しい動向

Microsoft PowerPoint - 第06章振幅変調.pptx

日心TWS

ベイズ統計入門

Microsoft PowerPoint - 三次元座標測定 ppt

2009 年 11 月 16 日版 ( 久家 ) 遠地 P 波の変位波形の作成 遠地 P 波の変位波形 ( 変位の時間関数 ) は 波線理論をもとに P U () t = S()* t E()* t P() t で近似的に計算できる * は畳み込み積分 (convolution) を表す ( 付録

データ解析

PowerPoint プレゼンテーション

スライド 1

<4D F736F F F696E74202D2091E6824F82568FCD8CEB82E892F990B382CC8CF889CA82BB82CC82515F B834E838A B9797A3959C8D F A282E982C682AB82CC8CEB82E897A62E >

OpRisk VaR3.2 Presentation

Microsoft PowerPoint - spe1_handout10.ppt

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2013-MUS-99 No /5/11 スペクトル包絡と基本周波数の同時推定のための無限カーネル線形予測分析法 吉井和佳 1,a) 後藤真孝 1,b) 概要 : 本稿では, 音声信号のスペクトル包絡と基本

横浜市環境科学研究所

Microsoft PowerPoint - 10.pptx

今回用いる例データ lh( 小文字のエル ) ある女性の血液中の黄体ホルモンを 10 分間隔で測定した時系列データ UKgas 1960 年 ~1986 年のイギリスのガス消費量を四半期ごとに観測した時系列データ ldeaths 1974 年 ~1979 年のイギリスで喘息 気管支炎 肺気腫による死

Microsoft PowerPoint - ip02_01.ppt [互換モード]

Microsoft PowerPoint - dm1_5.pptx

PowerPoint プレゼンテーション

ディジタル信号処理

Microsoft PowerPoint - DigitalMedia2_3b.pptx

09.pptx

untitled

Information Theory

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

システム工学実験 パラメータ推定手順

Microsoft Word - note02.doc

VocaListener2(ぼかりす2): ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システム

Microsoft PowerPoint - 画像工学 印刷用

スライド 1

Microsoft PowerPoint - Inoue-statistics [互換モード]

ビジネス統計 統計基礎とエクセル分析 正誤表

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

音声情報処理

Signal Processing Toolbox

遅延デジタルフィルタの分散型積和演算回路を用いたFPGA実装の検討

航空機の運動方程式

untitled

Microsoft Word - Chap17

Microsoft PowerPoint - dm1_6.pptx

インターリーブADCでのタイミングスキュー影響のデジタル補正技術

ボルツマンマシンの高速化

<4D F736F F F696E74202D C092425F D8A7789EF89C88A778BB38EBA816A8C6791D CC82B582AD82DD2E >

Microsoft PowerPoint - 第3回2.ppt

Transcription:

第 3 回 音声音響信号処理 ( 線形予測分析と自己回帰モデル ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所

講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮 ) 音声分析 合成 認識 強調 音楽信号処理統計的信号処理の基礎 ( スペクトル ガウス過程 最尤推定 ) ガウス性確率変数の基本性質時間周波数分析 ( 短時間フーリエ変換 ウェーブレット変換 ) ウィナーフィルタとカルマンフィルタ音声生成過程のモデル ( ソースフィルタ理論と藤崎モデル ) 自己回帰モデルと線形予測分析独立成分分析によるブラインド音源分離非負値行列因子分解によるスペクトログラムの分解表現スペクトル間擬距離最適化アルゴリズム (EM アルゴリズム 補助関数法 )

講義スケジュール 10/ 3 守谷先生担当 10/17 守谷先生担当 10/24 線形予測分析と自己回帰モデル 10/31 11/ 7 ( 休講 ) 11/14 11/21 11/28 12/ 5 12/12 12/19 ( 休講 ) 1/16 1/23 1/30

成績評価 レポート課題 本講義に関連する論文を1つ選び 発表資料形式 ( パワーポイント等 ) にまとめて学期末に提出してください 提出先は最終講義にてお知らせします どの程度本質を理解しているか 要点が分かりやすく記述されているか なぜその論文を重要と考えたか を評価の規準にして採点します 毎回の講義後にその回の講義に関連する論文を1つ挙げる予定です それらの中から選んでも良いですし 自分で自由に探してきてもOKです 講義の感想 レポートとともに講義に対する感想文も一緒に提出して下さい 講義用ホームページのURL: http://hil.t.u-tokyo.ac.jp/~kameoka/sap/

本日の話題 線形予測分析 音声情報処理研究の歴史の幕開けとなった信号処理技術 ( 統計的手法を取り入れた初めての音声研究として有名 ) 音声分析合成 ( ボコーダ ) 音声音響符号化 音声認識のための音声特徴量 音声強調 ( 残響除去 ブラインド音声分離 ) などへの応用 日本発の技術としても知られる

線形予測分析 3つの観点から解説 予測誤差 を最小化する観点 最小二乗誤差推定 線形系としての観点 自己回帰系 (AutoRegressive system) 音声の生成過程モデル 最尤推定 白色化 スペクトルマッチングとしての観点 最尤スペクトル推定 板倉斎藤距離

線形予測分析 3つの観点から解説 予測誤差 を最小化する観点 最小二乗誤差推定 線形系としての観点 自己回帰系 (AutoRegressive system) 音声の生成過程モデル 最尤推定 白色化 スペクトルマッチングとしての観点 最尤スペクトル推定 板倉斎藤距離

予測誤差 を最小化 動機 : 符号化への応用 少ないパラメータで音声信号を表現したい 問題 : 線形予測誤差の最小化 時刻の信号のサンプル値を 過去のサンプル値の線形結合で 予測 予測 の誤差を最小にするには結合係数 ( 予測係数という ) をどう置けば良い? time

最小二乗誤差推定による定式化 すべてのでとなるを求めたい 目的関数 最小解では を満たすため

最小二乗誤差推定による定式化 連立方程式に帰着 以上より最適予測係数は以下の方程式を満たす この方程式を Yule-Walker 方程式という

予測誤差 最適予測係数を とすると 予測の誤差 は 予測誤差と予測係数から元信号を復元可能

線形予測符号化 (Linear Predictive Coding) 時系列信号の可逆圧縮符号化の標準的な方式 時系列信号 予測係数 予測誤差 符号化して伝送 線形予測分析器 予測誤差の振幅は 0 付近に集中 Golomb-Rice 符号化 出現頻度の高い振幅値に短い符号の割り当て

線形予測分析 3つの観点から解説 予測誤差 を最小化する観点 最小二乗誤差推定 線形系としての観点 自己回帰系 (AutoRegressive system) 音声の生成過程モデル 最尤推定 白色化 スペクトルマッチングとしての観点 最尤スペクトル推定 板倉斎藤距離

線形予測分析 3つの観点から解説 予測誤差 を最小化する観点 最小二乗誤差推定 線形系としての観点 自己回帰系 (AutoRegressive system) 音声の生成過程モデル 最尤推定 白色化 スペクトルマッチングとしての観点 最尤スペクトル推定 板倉斎藤距離

線形系としての解釈 所与の信号から予測誤差を出力する線形システム 所与の信号 予測誤差 移動平均システム ( 全零モデル ) 予測誤差を入力として所与の信号を出力する線形システムは? 予測誤差 所与の信号 自己回帰システム ( 全極モデル )

音声生成過程のモデルとして 声帯振動が声道で共振して音声波形となって口から発せられる 声帯振動 音声波形 自己回帰システムにより声道特性を表現した場合の音声生成過程モデル

統計モデルによる音声生成過程の表現 声帯振動に関する仮定 Gauss 性 定常性 Toeplitz 行列 白色性 対角行列 声道特性に関する仮定 自己回帰システム ( 全極モデル )

最尤推定 今までの仮定をまとめると 未知パラメータは観測されるのは 観測信号の確率密度関数 ( 尤度関数という ) 対数尤度は logdet 項 :

白色化効果 以上の統計モデルではについて白色性を仮定していたので 先の最尤推定ではができるだけ白色になるようにを決めようとしていたことになる このことをよりイメージしやすくするため 以上のモデルを周波数領域で定式化してみよう

ここら辺で一息

線形予測分析 3つの観点から解説 予測誤差 を最小化する観点 最小二乗誤差推定 線形系としての観点 自己回帰系 (AutoRegressive system) 音声の生成過程モデル 最尤推定 白色化 スペクトルマッチングとしての観点 最尤スペクトル推定 板倉斎藤距離

線形予測分析 3つの観点から解説 予測誤差 を最小化する観点 最小二乗誤差推定 線形系としての観点 自己回帰系 (AutoRegressive system) 音声の生成過程モデル 最尤推定 白色化 スペクトルマッチングとしての観点 最尤スペクトル推定 板倉斎藤距離

周波数領域での定式化 時間領域では 周波数領域 (Fourier 変換領域 ) では ( は離散 Fourier 変換行列 ) の確率密度関数は?

について に関してここでは以下の巡回行列型を仮定 よって も巡回行列 は離散 Fourier 変換行列 によって対角化される 対角行列

周波数成分の確率密度関数 以上をまとめると 周波数の成分 他の周波数の成分と独立 分散がの複素正規分布に従う Im Re

スペクトルマッチング としての見方 周波数成分 が与えられた下での対数尤度 パワースペクトル 規格化周波数 上記の対数尤度は 定数項を除けば以下と等しい 板倉斎藤距離

板倉斎藤距離 他の擬距離尺度との比較 二乗誤差 I ダイバージェンス 板倉齋藤距離

線形予測分析は スペクトル包絡 の推定に相当 観測パワースペクトルと全極スペクトルとの板倉斎藤距離最小化 観測パワースペクトル パワースペクトル 全極スペクトル 周波数

線形予測分析 3つの観点から解説 予測誤差 を最小化する観点 最小二乗誤差推定 線形系としての観点 自己回帰系 (AutoRegressive system) 音声の生成過程モデル 最尤推定 白色化 スペクトルマッチングとしての観点 最尤スペクトル推定 板倉斎藤距離

レポート課題の対象論文 A. El-Jaroudi and J. Makhoul, Discrete All-Pole Modeling, IEEE Transactions on Signal Processing, Vol. 39, No. 2, pp. 411-423, 1991.