音情報処理I

Similar documents
応用音響学

SAP11_03

Missing Data NMF

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

Microsoft PowerPoint - H22制御工学I-2回.ppt

ディジタル信号処理

航空機の運動方程式

1. 線形シフト不変システムと z 変換 ここで言う システム とは? 入力数列 T[ ] 出力数列 一意変換 ( 演算子 ) 概念的には,, x 2, x 1, x 0, x 1, x 2, を入力すると, y 2, y 1, y 0, y 1, y 2, が出力される. 線形システム : 線形シ

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

PowerPoint Presentation

横浜市環境科学研究所

PowerPoint プレゼンテーション

Microsoft PowerPoint - ip02_01.ppt [互換モード]

Microsoft Word - NumericalComputation.docx

Microsoft PowerPoint - 10.pptx

応用音響学

Microsoft PowerPoint - 第3回2.ppt

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

PowerPoint プレゼンテーション

第 4 週コンボリューションその 2, 正弦波による分解 教科書 p. 16~ 目標コンボリューションの演習. 正弦波による信号の分解の考え方の理解. 正弦波の複素表現を学ぶ. 演習問題 問 1. 以下の図にならって,1 と 2 の δ 関数を図示せよ δ (t) 2

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

Microsoft PowerPoint - CSA_B3_EX2.pptx

画像処理工学

DVIOUT

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - 配布資料・演習18.pptx

様々なミクロ計量モデル†

数学 t t t t t 加法定理 t t t 倍角公式加法定理で α=β と置く. 三角関数

パソコンシミュレータの現状

memo

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - H22制御工学I-10回.ppt

DVIOUT-SS_Ma

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

<4D F736F F F696E74202D2091E6824F82518FCD E838B C68CEB82E894AD90B B2E >

微分方程式による現象記述と解きかた

Microsoft Word - 5章摂動法.doc

学習指導要領

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

DVIOUT

学習指導要領

航空機の運動方程式

PowerPoint プレゼンテーション

(Microsoft Word - 10ta320a_\220U\223\256\212w\223\301\230__6\217\315\221O\224\274\203\214\203W\203\201.docx)

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - 計測2.ppt [互換モード]

学習指導要領

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

画像解析論(2) 講義内容

Microsoft PowerPoint - spe1_handout10.ppt

チェビシェフ多項式の2変数への拡張と公開鍵暗号(ElGamal暗号)への応用

Chap2

学習指導要領

Microsoft Word - thesis.doc

DVIOUT

学力スタンダード(様式1)

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

システム工学実験 パラメータ推定手順

Microsoft PowerPoint - aep_1.ppt [互換モード]

1.民営化

以下 変数の上のドットは時間に関する微分を表わしている (ex. 2 dx d x x, x 2 dt dt ) 付録 E 非線形微分方程式の平衡点の安定性解析 E-1) 非線形方程式の線形近似特に言及してこなかったが これまでは線形微分方程式 ( x や x, x などがすべて 1 次で なおかつ

PowerPoint Presentation

Microsoft Word - 8章(CI).doc

経営学部2015.indd

2009 年 11 月 16 日版 ( 久家 ) 遠地 P 波の変位波形の作成 遠地 P 波の変位波形 ( 変位の時間関数 ) は 波線理論をもとに P U () t = S()* t E()* t P() t で近似的に計算できる * は畳み込み積分 (convolution) を表す ( 付録

Microsoft Word - 補論3.2

Microsoft Word - Chap17

学習指導要領

Microsoft PowerPoint - LectureB1_17woAN.pptx

2012/10/17 第 3 章 Hückel 法 Schrödinger 方程式が提案された 1926 年から10 年を経た 1936 年に Hückel 法と呼ばれる分子軌道法が登場した 分子の化学的特徴を残しつつ 解法上で困難となる複雑な部分を最大限にカットした理論である Hückel 法は最

学習指導要領

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

Microsoft PowerPoint - 課題1解答.pptx

Implementation of Computationally Efficient Real-Time Voice Conversion

画像類似度測定の初歩的な手法の検証

Microsoft Word - 第2章 ブロック線図.doc

学習指導要領

スライド 1

FEM原理講座 (サンプルテキスト)

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

インターリーブADCでのタイミングスキュー影響のデジタル補正技術

Excelを用いた行列演算

Microsoft PowerPoint - NA03-09black.ppt

<4D F736F F D2094F795AA95FB92F68EAE82CC89F082AB95FB E646F63>

Microsoft PowerPoint - 物情数学C(2012)(フーリエ前半)_up

09.pptx

航空機の運動方程式

2011年度 筑波大・理系数学

Microsoft PowerPoint - LectureB1handout.ppt [互換モード]

Microsoft PowerPoint - 複素数.pptx

景気指標の新しい動向

スライド 1

ボルツマンマシンの高速化

代数 幾何 < ベクトル > 1 ベクトルの演算 和 差 実数倍については 文字の計算と同様 2 ベクトルの成分表示 平面ベクトル : a x e y e x, ) ( 1 y1 空間ベクトル : a x e y e z e x, y, ) ( 1 1 z1

数学 ⅡB < 公理 > 公理を論拠に定義を用いて定理を証明する 1 大小関係の公理 順序 (a > b, a = b, a > b 1 つ成立 a > b, b > c a > c 成立 ) 順序と演算 (a > b a + c > b + c (a > b, c > 0 ac > bc) 2 図

第6章 実験モード解析

Transcription:

音情報処理論 音声処理における信号処理 ~ 線形予測分析 ~ 東京大学大学院情報理工学系研究科 / 奈良先端大 猿渡洋 4 年 月

準備 :Z 変換 Z 変換 離散的な時系列の特性を解析する 手法 準備 : は離散時間波形 x x { x,..., x, x,..., x } 実数 定義 正 Z 変換 ; 時間領域から Z 領域へ ここで X x は サンプル時間遅れを表す演算子 定義 逆 Z 変換 ;Z 領域から時間領域へ x j c X d 複素数

準備 :Z 変換の諸性質 時間遅れ : 畳み込み演算は Z 領域で積演算になる システムのインパルス応答を Z 変換したものをシステム伝達関数と呼ぶ H X Y h x y h A B h H においてとおけば DFTor フーリエ変換 のように考えることができ 周波数特性がわかる H or / f j N k j e e X x

準備 :Z 変換とシステム伝達関数 システム伝達関数の解析 p j j q p p q q A B h H pole ero / /...... Z の有理多項式 ero : 分子 = となる の解 零点 pole j : 分母 = となる の解 極

準備 :Z 変換とシステム伝達関数 極と零点の意味 極 : 分母 =の解 H の山 零点 : 分子 =の解 H の谷 Im[] 極 零点 Re[] 対数振幅特 j f H e 性 f

準備 :Z 変換とシステム伝達関数 3 極の配置とシステムの安定性 極の位置が単位円内 システムは安定単位円外 システムは不安定 極が単位円に接近 周波数特性上に強いピーク Im[] 極 極 Re[] 対数振幅特性 H e j f f

音声スペクトルからの情報抽出 音声信号スペクトル. スペクトル微細構造 周期成分 声帯の振動に対応 その人個人が持つ 声の高さ. スペクトル包絡構造 声道 鼻腔における共振 反共振特性 各音韻ごとの違いに対応 音声認識処理などでは この包絡情報に基づいて識別を行う.

スペクトル包絡の代表的抽出法 ケプストラム法 モデルを仮定しないノンパラメトリック法の一種 短時間スペクトル上において微細構造と包絡構造とを分ける 線形予測 Lear Predcto 法 自己回帰モデルに基づくパラメトリック法 声道における共振特性をモデリング

音声生成に適したモデルとは? 人間の音声生成モデル 声帯での基本振動を声道で音色付ける 声道 位置によって太さの異なる音響管の連続と見なせる 音響管における共振現象 自己回帰 AR 過程声道を模擬した音響管 声帯信号 各微小管毎に透過 反射が起きる 複雑な共振特性が生じる 口からの放射

線形予測と共振モデル 線形予測の原理 過去の波形標本値の組合せで現在の標本値を予測する 次の線形一次結合が成り立つと仮定 : x x x... px p ここでは平均値 分散の無相関な確率変数 この を最小にするように を決める を線形予測係数とよび を線形予測残差と呼ぶ 上式の Z 変換は以下で与えられる p X X... p X E E X p... p

線形予測と共振モデル 続き 式の意味 E X E A p... p where A p... p 予測残差 E を伝達関数 A に通して音声を生成 E A 声帯信号 極のみを持つ X 口からの放射

線形予測と共振モデル 続き 式で与えられる線形予測は 声帯信号のパワーを最小化するように声道特性を AR モデルによって推定する ことを示している A 推定されたは全極モデル 零点を持たず極だけから構成される伝達関数 であり その極の値によって共振特性が変化する 音声のスペクトル包絡の推定 A の推定に帰着 の推定問題

線形予測係数の推定 予測残差の算出 区間におけるの 乗和 p p j j j p p j j p j x x x [ ], where j x x j 自己相関関数

線形予測係数の推定 予測残差の最小化 j 乗残差和を最小にするを求める p j j p j j,, j,,..., p j,,..., p よって 線形予測係数を算出するには 上記のp 個の連立 次方程式を解けばよい 必ずしも解が存在するとは限らない?

線形予測係数の推定 3 安定に解を求めるには 自己相関関数 このとき j に制約を設ける, x, f or N j x x j r j, j の 変数に関する関数が 変数のみの関数となる j

線形予測係数の推定 4 を使用して連立方程式 を解く j r p p p p r r r r r r r r r r r r この行列はテプリッツ型 正定値行列 必ず逆行列が存在する利点. 線形予測係数が必ず求まる 利点. 高速解法 Durb の再帰的解法 が利用可能利点 3. 求められた全極モデルは絶対安定 極が単位円内

線形予測によるパワースペクトル LPC パワースペクトルの定義 f 予測残差のパワー... p p

線形予測によるスペクトル包絡 抽出されたスペクトル包絡 ケプストラムよりもピーク重視 であることに注目! DFT スペクトル

参考 ケプストラムによるスペクトル包絡 抽出されたスペクトル包絡 DFT スペクトル

線形予測によるホルマント抽出

余談 : 線形予測法と日本人の貢献 日経産業新聞 999 年 4 月 日掲載 音声認識の研究に金を出すことは価値ある投資だろうか 音声認識の研究とはまさに 錬金術 に等しい これは 969 年に米国音響学会誌に掲載された寄書の一部である 著者はジョン ピアス 当時 ベル電話研究所情報通信部門の責任者であった これを機に ピアス傘下にあった音声研究部門では 音声認識の研究が全面的に中止された トップの確信に満ちた判断で中止された研究をボトムアップで再開するのは容易なことではない この再開の主役として登場したのは 人の日本人であった 線形予測理論で世界的脚光を浴びていた現 NTT の板倉文忠 名古屋大名誉教授 を客員研究員として招いた これがベル研での音声認識研究の再始動をうながしたのである 当時 ベル研の研究室長であり 板倉を招いたジェームス フラナガン 現米国ラトガース大学副学長 は振り返る とても 正面切って音声認識の研究を行える状況ではなかった 部外者である客員研究員が自主的に研究を始めるという苦肉の策を講じ これが図に当った

線形予測分析のまとめ 長所 高速解法が存在するため比較的単純な操作でスペクトル包絡抽出可能 抽出されたスペクトル包絡において ホルマント共振がより強調される c.f. ケプストラム分析 より少ないパラメータ たかだか p 個の予測係数のみ で音声スペクトル包絡を表現可能 音声符号化に有利 問題点 線形予測係数を量子化して伝送をする場合 伝送誤差の影響によってすぐに不安定なフィルタになってしまう 例 典型的な電話音声の場合 bts 以上の精度必要 線形予測係数とスペクトルの直観的な関連がないので スペクトルの補間を行う場合に予測係数補間が不可能

線形予測分析の拡張 PARCOR 量子化誤差対策 : PARCOR 分析 線形予測による伝達関数 音響管の共振モデルに対応 線形予測係数を音響管の各管における反射係数へ一意に変換可能 反射係数が を超えることは無い 伝送エラーなどで歪んでしまった 以上にバケてしまった 反射係数を近似回復できる つまり絶対安定な伝達関数を受信側で構成可能 しかしまだ改善点が より情報圧縮を行いたい場合 とびとびの時間分析フレームのデータのみを伝送し 受手側では時間補間をすることによって復元を行いたい しかし LPC 係数 PARCOR 係数とも 時間軸方向の連続性はあまり明確ではない

線形予測分析の拡張 LSP 係数の時間補間対策 : LSP 線スペクトル対 係数 PARCOR 係数をさらに周波数領域へマッピング 絶対安定性を保ちつつスペクトルの時間補間が可能 スペクトル包絡 対応するLSPパラメータ 線スペクトルのペアを縦棒で表現 f 強い共振ピーク付近に棒線が密集 共振の強さは密集度合で決まる 伝送するのは線スペクトル ペア の周波数位置のみ

LSP 係数による時間補間 x t t t3 t f f 時間 t と t3 における LSP 線スペクトル対 の 推移より時間 t における LSP 係数を推測 補間できる

例題 : 次の線形予測モデル推定 音声波形の自己相関関数が以下のように与えられたとする r, r, r 5 a 線形予測係数を求めよ b LPCパワースペクトルを式で表せ はとする c b より極を求めて 平面に単位円とともに図示せよ d LPCパワースペクトルの概略図を書け 5

解答 : a 線形予測係数 線形予測係数 は以下を解くことで求まる r r r r r r よって /5 /3 /3 /5 /5 /5 /5

解答 : blpc パワースペクトル LPC パワースペクトルは次式で与えられる f 3 3 f

解答 : c 極とその配置 f の分母多項式の根が極である よって を解くと 3 3 5 j 3 極

解答 : dlpc パワースペクトル概略