TCX γ 0.9,, H / H, [4], 3. 3., ( /(,,,,,,, Mel Log Spectrum Approximation (MLSA [5],, [6], [7].,,,,,,, (,,, 3.,,,,,,,, sinc,,, [8], W, ( Y ij Y ij W l

Size: px
Start display at page:

Download "TCX γ 0.9,, H / H, [4], 3. 3., ( /(,,,,,,, Mel Log Spectrum Approximation (MLSA [5],, [6], [7].,,,,,,, (,,, 3.,,,,,,,, sinc,,, [8], W, ( Y ij Y ij W l"

Transcription

1 ,a,b,c,d,e,,,,,,,, TCX.,, (VoIP,,, 3GPP Extended Adaptive Multi-Rate Wideband (AMR- WB+ MPEG-D Unified Speech and Audio Coding (USAC [], [],,,, AMR-WB+ USAC, Transform Coded exitation (TCX, TCX NTT a sugiura@hil.t.u-toyo.ac.jp b amamoto.yutaa@lab.ntt.co.jp c harada.noboru@lab.ntt.co.jp d ameoa.hiroazu@lab.ntt.co.jp e moriya.taehiro@lab.ntt.co.jp,,, TCX., USAC (MDCT TCX [3] TCX,,, (LSP,,,.,, {a n } H = / + π j a n e N n, (0 N ( n, H H = / + a n γ n π j e N n, (0 < γ < ( n, H /H,,

2 TCX γ 0.9,, H / H, [4], 3. 3., ( /(,,,,,,, Mel Log Spectrum Approximation (MLSA [5],, [6], [7].,,,,,,, (,,, 3.,,,,,,,, sinc,,, [8], W, ( Y ij Y ij W log ix j W ix j (3, W, X, Y sinc, W X Y, [9], W, Y ij W + ( log W i X j L(W (4 ix j

3 f(x = x x > 0 Jensen W = ix j λ (5 ij(w i X j /λ ij ( λ ij λ ij 0, λ ij = W i X j /λ ij, ( log W i X j log ϕ ij + W ix j, (ϕ ij > 0 ϕ ij (6, W L(W λ ij Y ij (7 W i X j + ( log ϕ ij + W ix j G(W ϕ ij λ ij = W ix j W, ϕ ij = W i X j (8 ix j (7, λ, ϕ G(W W, W mn G(W W = W = j Y mj λ mjn/x nj ( W mn W mn = + j X nj ϕ mj = 0 j Y mjλ mjn /X nj j X nj/ϕ mj (9, W G(W W (8 λ, ϕ, (7, W. l W W (l, λ, ϕ λ ij = W (l i X j W (l i X, ϕ ij = j W (l i X j (0, (9 G(W W (l+, W mn (l+ =, = W (l W (l+ mn ( j Y mjw mn (l X nj / W (l mn j X nj/ W (l m X j m X j ( j Y mx nj /Ŷ mj j X, Ŷ = W (l X ( nj/ŷmj U, UW X X,, W, U,,, Y 3.3 TCX, (, (,, H /H, γ, N, (, f(,, f(0 = 0, {a n }, H = / + n H 0 = / + n a n γ n a n γ f( n π j e N n, ( N (3 γ,, f( U, f(0 0. U. (4 f(n N,, 3

4 情報処理学会研究報告 図 4 図 3 各帯域での包絡の線形予測分析からの改善量 (板倉斎藤距離基 準 の平均と標準偏差. 縦軸が 0 より大きい所は, 線形予測分 包絡の比較. 緑点線が MDCT による実数スペクトル, 赤破線 析の包絡よりもスペクトルからの距離が近いことを意味する. が提案手法, 青実線が線形予測分析による包絡. RWC 研究用音楽データベースのポピュラー音楽及びクラシッ ク計 5 曲からそれぞれランダムに 30 秒を切り取り使用. サ ンプリング周波数 6 Hz, フレームあたり 30 点のスペク 化により各行の非零要素数が最大 7 つであるようなメル対 トル, 包絡の次数は 6 次. MLSA フィルタは Speech Signal 数伸縮行列とその逆伸縮行列を設計した. そして, 音響信 Processing Toolit [0] のものを使用. 号の各フレームに対して, 最適化した伸縮行列または厳密 な sinc 補間による伸縮を用いた二種類の解像度伸縮包絡, 及び MLSA フィルタによる包絡を求め, パワースペクトル との板倉斎藤距離を計算した. 図 3 はある フレームで線形予測分析と最適化した伸縮 行列を用いた包絡を並べたものである. 低域において提案 手法の包絡の解像度が向上していることが確認できる. ま た, 定量的な評価として, 各手法による包絡が通常の線形予 測分析による包絡と比べ各帯域において精度がどれだけ変 化するかを比較した結果を図 4 に示す. 各手法の包絡はい ずれも対数的に周波数解像度を伸縮していることから, 通 常の線形予測分析と比べ低域での精度が上がり, その分高 図 5 提案手法の包絡を式 ( で平滑化した場合. 青破線が平滑化 域での精度が下がっている. 最適化した行列と厳密な sinc 前, 赤実線が平滑化後, 次数は 6. 補間との比較では, いずれも低域での精度向上は同等であ るが, 最適化した方では sinc 補間よりも高域での伸縮 逆 伸縮における無矛盾性が保たれていることがわかる. そし て, 提案手法は MLSA フィルタとほぼ同等な性能を示した. 4. 聴覚重み付け比較 続いて, 聴覚重み付けによる包絡の平滑化に関しても比 較を行った. 通常, 線形予測分析で得られた包絡を式 ( に よって重み付けした際には, 包絡のピークが急峻なほど大 きく平滑化され, なだらかなものはあまり変化しない. し かし, 前節と同様の解像度伸縮をした包絡にこの単純な平 滑化を行った結果, 図 5 のように低域において通常よりも ピークの形が大きく残ってしまった. これは式 ( の操作 がメル対数周波数軸上で行われてしまうことに起因する. 一方, 式 (3 を用いた場合, 図 6 のように軸の伸縮に合わ 図 6 提案手法の包絡を式 (3 で平滑化した場合. 青破線が平滑化 前, 赤実線が平滑化後, 次数は 音質の主観評価 せて平滑化された包絡が得られた. 周波数毎に γ に補正を 最後に TCX をベースとした符号化器を作成し, 上の実 かけることにより, 線形周波数軸上でのピークの急峻さに 験で使用したメル対数伸縮行列による解像度伸縮を導入し あわせて平滑化されることが確認できた. て, ITU-R BS.534- MUltiple Stimuli with Hidden Ref- 04 Information Processing Society of Japan 4

5 5. (a MUSHRA TCX, TCX, AMR-WB+.,,, MLSA,,,, (b 7 95, * 5 erence and Anchor (MUSHRA TCX 6 Hz 30 (0 ms, 40 ms, AMR-WB+ 7 ms RWC 6 0,, 6 Hz 6 bps 7 TCX, AMR-WB+ 3, 3.5 Hz, 00 7(a AMR-WB+,, 7(b., 6, 3 5,, [] 3GPP TS 6.90 version.0.0 Release, 3GPP, 0. [] M. Neuendorf, et al., MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types, AES 3nd Convention, Budapest, HU, Apr. 0. [3] G. Fuchs, et al., MDCT-Based Coder for Highly Adaptive Speech and Audio Coding, EUSIPCO., IEEE, pp.64-68, 009. [4] R. Rice and J. Plaunt, Adaptive Variable-Length Coding for Efficient Compression of Spacecraft Television Data, Transaction on Communication Technology, IEEE, Vol. COM-9, No.6, Dec., 97. [5], et al, (MLSA, 83/, Vol.J66-A, No., pp.-9, 983. [6] K. Koshida, et al., Efficient Encoding of Mel-Generalized Cepstrum for CELP Coders, ICASSP-97., IEEE, Vol., pp , 997. [7] K. Koshida, et al., A Wideband CELP Speech Coder at 6 bit/s Based on Mel-Generalized Cepstral Analysis, ICASP-98, IEEE, Vol., pp.6-64, 998. [8],,,, 97. [9], et al.,,, vol. 006-MUS-66, pp.77-84, Aug [0] ( 3 5

Implementation of Computationally Efficient Real-Time Voice Conversion

Implementation of Computationally Efficient Real-Time Voice Conversion 音情報処理 第 4 回 音声符号化 中村哲 1 秒間につき 128 kbi 使用 音声符号化 1 秒間につき 8 kbi だけ使用 伝送するビット数を 6% 程度に減らすことができる! 本日の講義を受けることで なぜこのようなことが可能なのかを理解することができます 講義内容 波形符号化 標本化 量子化 音声符号化方式 波形符号化方式 分析合成方式 ハイブリッド方式 聴覚符号化方式 符号化 ある情報を他のもの

More information

EVS 1 [17 19] EVS 2. EVS 2.1 EVS 13 1 Qualification Selection Characterization 3 [20] 12 EVS 2.2 EVS 1 20 ms 32 ms 2 8kHz NB: Narrow-ba

EVS 1 [17 19] EVS 2. EVS 2.1 EVS 13 1 Qualification Selection Characterization 3 [20] 12 EVS 2.2 EVS 1 20 ms 32 ms 2 8kHz NB: Narrow-ba 74 2 2018 pp. 83 92 83 VoLTE 3GPP EVS * NTT NTT 43.72.Gy, 43.60.Ek 1. ITU- T International Telecommunication Union Telecommunication standardizaion sector G.711 PCM Pulse Code Modulation A-law/µ-law [1]

More information

Microsoft PowerPoint - SP _slides

Microsoft PowerPoint - SP _slides 音情報処理 第 3 回音声符号化 戸田智基 名古屋大学情報基盤センター / 大学院情報科学研究科 講義内容 波形符号化 標本化 量子化 音声符号化方式 波形符号化方式 分析合成方式 ハイブリッド方式 聴覚符号化方式 符号化 ある情報を他のもの ( 符号 ) で置き換える作業 例 1: 新聞広告 賃貸マンションをお貸しします. 間取りは 2LDK で, 具体的には 8 畳,6 畳,4.5 畳のダイニングキッチン,

More information

Microsoft Word - 02gun_08hen_03.doc

Microsoft Word - 02gun_08hen_03.doc 2 群 ( 画像 音 言語 ) 8 編 ( 音声 オーディオ符号化 ) 3 章モバイル向け符号化方式 ( 執筆者 : 小澤一範 )[2009 年 12 月受領 ] 概要 既にサービスされていたアナログ方式と比べ同等以上の無線周波数利用効率を確保するために,1980 年代後半から移動体通信のディジタル化 ( 第二世代 ) を実現する検討が行われた. これには音声のディジタル圧縮は必須の重要技術であり,

More information

IPSJ SIG Technical Report 1, Instrument Separation in Reverberant Environments Using Crystal Microphone Arrays Nobutaka ITO, 1, 2 Yu KITANO, 1

IPSJ SIG Technical Report 1, Instrument Separation in Reverberant Environments Using Crystal Microphone Arrays Nobutaka ITO, 1, 2 Yu KITANO, 1 1, 2 1 1 1 Instrument Separation in Reverberant Environments Using Crystal Microphone Arrays Nobutaka ITO, 1, 2 Yu KITANO, 1 Nobutaka ONO 1 and Shigeki SAGAYAMA 1 This paper deals with instrument separation

More information

2. CABAC CABAC CABAC 1 1 CABAC Figure 1 Overview of CABAC 2 DCT 2 0/ /1 CABAC [3] 3. 2 値化部 コンテキスト計算部 2 値算術符号化部 CABAC CABAC

2. CABAC CABAC CABAC 1 1 CABAC Figure 1 Overview of CABAC 2 DCT 2 0/ /1 CABAC [3] 3. 2 値化部 コンテキスト計算部 2 値算術符号化部 CABAC CABAC H.264 CABAC 1 1 1 1 1 2, CABAC(Context-based Adaptive Binary Arithmetic Coding) H.264, CABAC, A Parallelization Technology of H.264 CABAC For Real Time Encoder of Moving Picture YUSUKE YATABE 1 HIRONORI

More information

SAP11_03

SAP11_03 第 3 回 音声音響信号処理 ( 線形予測分析と自己回帰モデル ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮 ) 音声分析 合成 認識 強調 音楽信号処理統計的信号処理の基礎

More information

動画コンテンツ 動画 1 動画 2 動画 3 生成中の映像 入力音楽 選択された素片 テンポによる伸縮 音楽的構造 A B B B B B A C C : 4) 6) Web Web 2 2 c 2009 Information Processing S

動画コンテンツ 動画 1 動画 2 動画 3 生成中の映像 入力音楽 選択された素片 テンポによる伸縮 音楽的構造 A B B B B B A C C : 4) 6) Web Web 2 2 c 2009 Information Processing S 1 2 2 1 Web An Automatic Music Video Creation System by Reusing Dance Video Content Sora Murofushi, 1 Tomoyasu Nakano, 2 Masataka Goto 2 and Shigeo Morishima 1 This paper presents a system that automatically

More information

11 22 33 12 23 1 2 3, 1 2, U2 3 U 1 U b 1 (o t ) b 2 (o t ) b 3 (o t ), 3 b (o t ) MULTI-SPEAKER SPEECH DATABASE Training Speech Analysis Mel-Cepstrum, logf0 /context1/ /context2/... Context Dependent

More information

40.9 22.6 18.1 4.9 1.0 15.3 10.0 (%) 3.5 5.8 6.0 23.5 29.5 70.5 100.0 (%) 267 447 456 1,788 2,244 5,364 7,609 0.3 6.5 975 5.6 386 (%) (%) (%) 3.6 6.3 100.0 6.6 5.3 27.2 32.8 67.2 100.0 22.5 538 452 10.1

More information

2.2 (a) = 1, M = 9, p i 1 = p i = p i+1 = 0 (b) = 1, M = 9, p i 1 = 0, p i = 1, p i+1 = 1 1: M 2 M 2 w i [j] w i [j] = 1 j= w i w i = (w i [ ],, w i [

2.2 (a) = 1, M = 9, p i 1 = p i = p i+1 = 0 (b) = 1, M = 9, p i 1 = 0, p i = 1, p i+1 = 1 1: M 2 M 2 w i [j] w i [j] = 1 j= w i w i = (w i [ ],, w i [ RI-002 Encoding-oriented video generation algorithm based on control with high temporal resolution Yukihiro BANDOH, Seishi TAKAMURA, Atsushi SHIMIZU 1 1T / CMOS [1] 4K (4096 2160 /) 900 Hz 50Hz,60Hz 240Hz

More information

IPSJ SIG Technical Report Vol.2010-AVM-68 No /3/ High-Efficient 2-pass Video Coding Algorithm based on Macroblock Rate-Distortion Kazu

IPSJ SIG Technical Report Vol.2010-AVM-68 No /3/ High-Efficient 2-pass Video Coding Algorithm based on Macroblock Rate-Distortion Kazu . High-Efficient -pass Video Coding Algorithm based on Macroblock Rate-Distortion Kazuya Yokohari, Atsushi Sagata and Kazuto Kamikura In order to achieve high-efficient video coding, -pass video coding

More information

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201

IPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201 BGM 1,4,a) 1 2 2 3,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 2015 1 100.. Web.. BGM.BGM [1]. BGM BGM 1 Waseda University, Shinjuku, Tokyo 169-8555, Japan 2 3 4 JST CREST a) ha-ru-ki@asagi.waseda.jp.

More information

バイノーラルマイクを用いたライフログ映像のショット識別 Life-log Video Shot Discrimination using Binaural Microphone 山野貴一郎 伊藤克亘 法政大学大学院情報科学研究科 法政大学情報科学部 Kiichiro YAMANO Katunobu

バイノーラルマイクを用いたライフログ映像のショット識別 Life-log Video Shot Discrimination using Binaural Microphone 山野貴一郎 伊藤克亘 法政大学大学院情報科学研究科 法政大学情報科学部 Kiichiro YAMANO Katunobu バイノーラルマイクを用いたライフログ映像のショット識別 Life-log Video Shot Discrimination using Binaural Microphone 山野貴一郎 伊藤克亘 法政大学大学院情報科学研究科 法政大学情報科学部 Kiichiro YAMANO Katunobu ITOU Graduate School of Computer and Information Sciences,

More information

21 1 2 1 2

21 1 2 1 2 21 1 2 1 2 1 2 3 ( ) 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 210 0.0 0.0 22 23 25 27 28 29 30 31 32 33 34 35 36 74 pp.4362003.10 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 141224 14 48 10

More information

Missing Data NMF

Missing Data NMF 月 4 2013 冬学期 [4830-1032] 第 4 回 音声音響信号処理 ( 線形予測分析と自己回帰モデル ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介 情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 音響学入門ペディア Q. 様々な音響特徴量それぞれの使い方や意味を教えて下さい 千葉祐弥東北大学大学院工学研究科博士後期課程 2 年 マスター特徴量って何に使うものタイトルの書式設定? 統計的分析 人間が音を聞く仕組みを解明する ( 方向 高さ 大きさ 音色 の知覚 ) データの符号化 圧縮への応用など 機械学習 パターン認識 音声認識 音声インターフェースの作成 楽曲のジャンル推定 楽曲検索 推薦等への応用など

More information

2013 M

2013 M 2013 M0110453 2013 : M0110453 20 1 1 1.1............................ 1 1.2.............................. 4 2 5 2.1................................. 6 2.2................................. 8 2.3.................................

More information

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 スペクトルデータの特徴 1 波 ( 波数 ) が近いと 吸光度 ( 強度 ) の値も似ている ノイズが含まれる 吸光度 ( 強度 ) の極大値 ( ピーク ) 以外のデータも重要 時系列データの特徴 2 時刻が近いと プロセス変数の値も似ている ノイズが含まれる プロセス変数の極大値

More information

it-ken_open.key

it-ken_open.key 深層学習技術の進展 ImageNet Classification 画像認識 音声認識 自然言語処理 機械翻訳 深層学習技術は これらの分野において 特に圧倒的な強みを見せている Figure (Left) Eight ILSVRC-2010 test Deep images and the cited4: from: ``ImageNet Classification with Networks et

More information

医系の統計入門第 2 版 サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. このサンプルページの内容は, 第 2 版 1 刷発行時のものです.

医系の統計入門第 2 版 サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます.   このサンプルページの内容は, 第 2 版 1 刷発行時のものです. 医系の統計入門第 2 版 サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. http://www.morikita.co.jp/books/mid/009192 このサンプルページの内容は, 第 2 版 1 刷発行時のものです. i 2 t 1. 2. 3 2 3. 6 4. 7 5. n 2 ν 6. 2 7. 2003 ii 2 2013 10 iii 1987

More information

Microsoft PowerPoint - ip02_01.ppt [互換モード]

Microsoft PowerPoint - ip02_01.ppt [互換モード] 空間周波数 周波数領域での処理 空間周波数 (spatial frquncy) とは 単位長さ当たりの正弦波状の濃淡変化の繰り返し回数を表したもの 正弦波 : y sin( t) 周期 : 周波数 : T f / T 角周波数 : f 画像処理 空間周波数 周波数領域での処理 波形が違うと 周波数も違う 画像処理 空間周波数 周波数領域での処理 画像処理 3 周波数領域での処理 周波数は一つしかない?-

More information

スライド タイトルなし

スライド タイトルなし (1) - E-Mail: katto@waseda.jp Y U V R G B (1/30 ) RGB / YUV = B G R V U Y 0.31 0.52 0.21 0.32 0.28 0.60 0.11 0.59 0.30 RGB YUV CCIR 601 4:4:4 4:2:2 4:2:0 Y Y Y U V U V U V YUVUV UV 4:2:0 4:2:2 (RGB8 )

More information

PowerPoint Presentation

PowerPoint Presentation 付録 2 2 次元アフィン変換 直交変換 たたみ込み 1.2 次元のアフィン変換 座標 (x,y ) を (x,y) に移すことを 2 次元での変換. 特に, 変換が と書けるとき, アフィン変換, アフィン変換は, その 1 次の項による変換 と 0 次の項による変換 アフィン変換 0 次の項は平行移動 1 次の項は座標 (x, y ) をベクトルと考えて とすれば このようなもの 2 次元ベクトルの線形写像

More information

VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案

VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案 VocaListener ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案 中野倫靖, 後藤真孝 ( 産業技術総合研究所 ) 2008 年 5 月 28 日第 75 回音楽情報科学研究会 (SIGMUS) 第 128 回ヒューマンコンピュータインタラクション研究会 (SIGHCI) 現状の歌声合成の使い方 歌声合成システムを選択 [ ] Vocaloid [ ] Vocaloid2

More information

TCP/IP IEEE Bluetooth LAN TCP TCP BEC FEC M T M R M T 2. 2 [5] AODV [4]DSR [3] 1 MS 100m 5 /100m 2 MD 2 c 2009 Information Processing Society of

TCP/IP IEEE Bluetooth LAN TCP TCP BEC FEC M T M R M T 2. 2 [5] AODV [4]DSR [3] 1 MS 100m 5 /100m 2 MD 2 c 2009 Information Processing Society of IEEE802.11 [1]Bluetooth [2] 1 1 (1) [6] Ack (Ack) BEC FEC (BEC) BEC FEC 100 20 BEC FEC 6.19% 14.1% High Throughput and Highly Reliable Transmission in MANET Masaaki Kosugi 1 and Hiroaki Higaki 1 1. LAN

More information

IPSJ SIG Technical Report Vol.2015-CVIM-196 No /3/6 1,a) 1,b) 1,c) U,,,, The Camera Position Alignment on a Gimbal Head for Fixed Viewpoint Swi

IPSJ SIG Technical Report Vol.2015-CVIM-196 No /3/6 1,a) 1,b) 1,c) U,,,, The Camera Position Alignment on a Gimbal Head for Fixed Viewpoint Swi 1,a) 1,b) 1,c) U,,,, The Camera Position Alignment on a Gimbal Head for Fixed Viewpoint Swiveling using a Misalignment Model Abstract: When the camera sets on a gimbal head as a fixed-view-point, it is

More information

DEIM Forum 2019 A7-1 Flexible Distance-based Hashing mori

DEIM Forum 2019 A7-1 Flexible Distance-based Hashing mori DEIM Forum 2019 A7-1 Flexible Distance-based Hashing 731 3194 E-mail: mc66023@e.hiroshima-cu.ac.jp,{wakaba,s naga,inagi,yoko}@hiroshima-cu.ac.jp, morikei18@gmail.com Flexible Distance-based Hashing(FDH)

More information

IPSJ-SLP

IPSJ-SLP F0 MFCC 1 2 3 1 1 1 1 MFCCF0 1 86.7% 90.2% A System for Automatic Discrimination between Singing and Speaking Voices on the Basis of Peak Interval of Spectral Change, F0, and MFCC Shimpei Aso, 1 Takeshi

More information

pp d 2 * Hz Hz 3 10 db Wind-induced noise, Noise reduction, Microphone array, Beamforming 1

pp d 2 * Hz Hz 3 10 db Wind-induced noise, Noise reduction, Microphone array, Beamforming 1 72 12 2016 pp. 739 748 739 43.60.+d 2 * 1 2 2 3 2 125 Hz 0.3 0.8 2 125 Hz 3 10 db Wind-induced noise, Noise reduction, Microphone array, Beamforming 1. 1.1 PSS [1] [2 4] 2 Wind-induced noise reduction

More information

2016 [1][2] H.264/AVC HEVC HEVC

2016 [1][2] H.264/AVC HEVC HEVC HEVC 2012 (409825) 2016 [1][2] H.264/AVC HEVC HEVC Abstract As ultra high definition television is planning on test broadcasting 2016, moving picture resolution enhancement is advancing in recent years.

More information

3 3) 6) 1) MPEG-7 2) MPEG-7 (A) (B) 2 9) Zils 10) (1) (2) 2.1 2

3 3) 6) 1) MPEG-7 2) MPEG-7 (A) (B) 2 9) Zils 10) (1) (2) 2.1 2 yoshii@kuis.kyoto-u.ac.jp m.goto@aist.go.jp okuno@i.kyoto-u.ac.jp 48% 82% Identification of Hihat Cymbals for Musical Audio Signals Using the Single Template Adaptation Method KAZUYOSHI YOSHII,MASATAKA

More information

2. ICA ICA () (Blind Source Separation BBS) 2) Fig. 1 Model of Optical Topography. ( ) ICA 2.2 ICA ICA 3) n 1 1 x 1 (t) 2 x 2 (t) n x(t) 1 x(t

2. ICA ICA () (Blind Source Separation BBS) 2) Fig. 1 Model of Optical Topography. ( ) ICA 2.2 ICA ICA 3) n 1 1 x 1 (t) 2 x 2 (t) n x(t) 1 x(t ICA 1 2 2 (Independent Component Analysis) Denoising Method using ICA for Optical Topography Yamato Yokota, 1 Tomoyuki Hiroyasu 2 and Hisatake Yokouchi 2 Optical topography is one of the promising ways

More information

, ( ξ/) ξ(x), ( ξ/) x = x 1,. ξ ξ ( ξ, u) = 0. M LS ξ ξ (6) u,, u M LS 3).,.. ξ x ξ = ξ(x),, 1. J = (ξ ξ, V [ξ ] 1 (ξ ξ )) (7) ( ξ, u) = 0, = 1,..., N

, ( ξ/) ξ(x), ( ξ/) x = x 1,. ξ ξ ( ξ, u) = 0. M LS ξ ξ (6) u,, u M LS 3).,.. ξ x ξ = ξ(x),, 1. J = (ξ ξ, V [ξ ] 1 (ξ ξ )) (7) ( ξ, u) = 0, = 1,..., N 1,,.,.. Maximum Likelihood Estimation for Geometric Fitting Yasuyuki Sugaya 1 Geometric fitting, the problem which estimates a geometric model of a scene from extracted image data, is one of the most fundamental

More information

第 1 回バイオメトリクス研究会 ( 早稲田大学 ) THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS Proceedings of Biometrics Workshop,169

第 1 回バイオメトリクス研究会 ( 早稲田大学 ) THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS Proceedings of Biometrics Workshop,169 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS Proceedings of Biometrics Workshop,169-8555 3-4-1,169-8555 3-4-1 E-mail: s hayashi@kom.comm.waseda.ac.jp, ohki@suou.waseda.jp Wolf

More information

2 (2016 3Q N) c = o (11) Ax = b A x = c A n I n n n 2n (A I n ) (I n X) A A X A n A A A (1) (2) c 0 c (3) c A A i j n 1 ( 1) i+j A (i, j) A (i, j) ã i

2 (2016 3Q N) c = o (11) Ax = b A x = c A n I n n n 2n (A I n ) (I n X) A A X A n A A A (1) (2) c 0 c (3) c A A i j n 1 ( 1) i+j A (i, j) A (i, j) ã i [ ] (2016 3Q N) a 11 a 1n m n A A = a m1 a mn A a 1 A A = a n (1) A (a i a j, i j ) (2) A (a i ca i, c 0, i ) (3) A (a i a i + ca j, j i, i ) A 1 A 11 0 A 12 0 0 A 1k 0 1 A 22 0 0 A 2k 0 1 0 A 3k 1 A rk

More information

Gmech08.dvi

Gmech08.dvi 145 13 13.1 13.1.1 0 m mg S 13.1 F 13.1 F /m S F F 13.1 F mg S F F mg 13.1: m d2 r 2 = F + F = 0 (13.1) 146 13 F = F (13.2) S S S S S P r S P r r = r 0 + r (13.3) r 0 S S m d2 r 2 = F (13.4) (13.3) d 2

More information

2014 3

2014 3 1 3 113 : 1 Copyright c 1 by Kobayashi Keisuke Desktop Music (DTM) DAW (Digital Audio Workstation) YAMAHA Vocaloid DTM MIDI (Musical Instruments Digital Interface) Lee (Non-negative Matrix Factorization;

More information

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫りにするために スペクトルを滑らかにする操作のことをいう 6.1 合積のフーリエ変換スペクトルの平滑化を行う際に必要な 合積とそのフーリエ変換について説明する 6.2 データ

More information

トピックモデルの応用: 関係データ、ネットワークデータ

トピックモデルの応用: 関係データ、ネットワークデータ NTT コミュニケーション科学基礎研究所 石黒勝彦 2013/01/15-16 統計数理研究所会議室 1 1 画像認識系から尐し遅れますが 最近では音声 音響データに対してもトピックモデルが利用されるようになっています 2 1. どの特徴量を利用するか? 2. 時系列性をどう扱うか? 3 どの特徴量を利用して どうやって BoW 形式に変換するかを検討する必要があります MFCC: 音声認識などで広い範囲で利用される

More information

<4D F736F F D B B83578B6594BB2D834A836F815B82D082C88C60202E646F63>

<4D F736F F D B B83578B6594BB2D834A836F815B82D082C88C60202E646F63> 単純適応制御 SAC サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. http://www.morikita.co.jp/books/mid/091961 このサンプルページの内容は, 初版 1 刷発行当時のものです. 1 2 3 4 5 9 10 12 14 15 A B F 6 8 11 13 E 7 C D URL http://www.morikita.co.jp/support

More information

スペクトルに対応する英語はスペクトラム(spectrum)です

スペクトルに対応する英語はスペクトラム(spectrum)です 7. ハミング窓とフラットトップ窓の等価ノイズ帯域幅 (ENBW) (1) Hamming 窓 Hamming 窓は次式で表されます MaTX にも関数が用意されています win = 0.54-0.46*cos(2*PI*[k/(N-1)); ただし k=0,1,---,n-1 N=256; K=[0:N-1]; w=0.54-0.46*cos(2*pi*k/(n-1)); mgplot_reset(1);

More information

VocaListener2(ぼかりす2): ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システム

VocaListener2(ぼかりす2): ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システム twitter アカウント : @VocaListener twitter ハッシュタグ : #vocalis VocaListener2( ぼかりす 2) ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システムの提案 中野倫靖, 後藤真孝 ( 産業技術総合研究所 ) 21 年 7 月 28 日第 86 回音楽情報科学研究会 (SIGMUS) VocaListener1( ぼかりす 1)

More information

[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing

[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing 1,a) 1,b) 1,c) 2012 11 8 2012 12 18, 2013 1 27 WEB Ruby Removal Filters Using Genetic Programming for Early-modern Japanese Printed Books Taeka Awazu 1,a) Masami Takata 1,b) Kazuki Joe 1,c) Received: November

More information

ディジタル信号処理

ディジタル信号処理 ディジタルフィルタの設計法. 逆フィルター. 直線位相 FIR フィルタの設計. 窓関数法による FIR フィルタの設計.5 時間領域での FIR フィルタの設計 3. アナログフィルタを基にしたディジタル IIR フィルタの設計法 I 4. アナログフィルタを基にしたディジタル IIR フィルタの設計法 II 5. 双 次フィルタ LI 離散時間システムの基礎式の証明 [ ] 4. ] [ ]*

More information

ohpr.dvi

ohpr.dvi 2003/12/04 TASK PAF A. Fukuyama et al., Comp. Phys. Rep. 4(1986) 137 A. Fukuyama et al., Nucl. Fusion 26(1986) 151 TASK/WM MHD ψ θ ϕ ψ θ e 1 = ψ, e 2 = θ, e 3 = ϕ ϕ E = E 1 e 1 + E 2 e 2 + E 3 e 3 J :

More information

2008 : 80725872 1 2 2 3 2.1.......................................... 3 2.2....................................... 3 2.3......................................... 4 2.4 ()..................................

More information

音情報処理I

音情報処理I 音情報処理論 音声処理における信号処理 ~ 線形予測分析 ~ 東京大学大学院情報理工学系研究科 / 奈良先端大 猿渡洋 4 年 月 準備 :Z 変換 Z 変換 離散的な時系列の特性を解析する 手法 準備 : は離散時間波形 x x { x,..., x, x,..., x } 実数 定義 正 Z 変換 ; 時間領域から Z 領域へ ここで X x は サンプル時間遅れを表す演算子 定義 逆 Z 変換

More information

SAP11_12

SAP11_12 第 12 回 音声音響信号処理 ( 講義のまとめ ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介 情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮 ) 音声分析 合成 認識 強調 音楽信号処理 統計的信号処理の基礎

More information

図 1: HPSS の処理の手順 HPSS では信号 s(t) をフレーム長 lk で STFT して得られる振幅スペクトログラム S 上で スペクトログラム を H, P に分離し 逆 STFT することにより 定常 狭帯域的成分 h(t) と非定常 広帯域的成分 p(t) とを分離する 調波打楽

図 1: HPSS の処理の手順 HPSS では信号 s(t) をフレーム長 lk で STFT して得られる振幅スペクトログラム S 上で スペクトログラム を H, P に分離し 逆 STFT することにより 定常 狭帯域的成分 h(t) と非定常 広帯域的成分 p(t) とを分離する 調波打楽 第回信号処理シンポジウム 1年11月日 日(奈良) 複数スペクトログラムに基づく信号の変動スペクトル表現と それに基づく信号の新しい分析 分離手法の検討 Multi-spectrogram-based Fluctuation Representation of Signal and Its Application to New Signal Analysis and Separation 橘秀幸 小野順貴

More information

Microsoft Word - 02gun_08hen_02.doc

Microsoft Word - 02gun_08hen_02.doc 2 群 ( 画像 音 言語 ) 8 編 ( 音声 オーディオ符号化 ) 2 章有線 汎用符号化方式 ( 執筆者 : 守谷健弘 )[2009 年 12 月受領 ] 概要 ITU-T,MPEG(Moving Picture Expert Group) などで制定されてきた音声やオーディオ信号の符号化方式を紹介する. これらの符号化方式の用途は必ずしも固定されていないが, 多様な電話サービス, インターネットを通じた配信,

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション エージェントベースドシミュレーションによる店舗内回遊モデル構築に関する研究 大阪府立大学 現代システム科学域 知識情報システム学類石丸悠太郎 指導教員 森田裕之 背景 顧客の店舗内回遊シミュレーションは 店舗内でのプロモーションや商品配置の影響を実施する前に結果を予測することが可能となるため 実施前に効果を確認することでコストや時間を削減することができる 従来は 購買履歴やアンケート結果を用いたモデルを行わざるを得なかったため

More information

基本 CMYK

基本 CMYK Information Communication Technology ICT = Information and Communication Technology 04 16 26 % 5 3 554 1,717 1,4 1,397 3,001 52.5 56.1 52.2 53.6 48.1 47.6 47.9 % 506 470 506 1,482 1,708 1,530 3,238 47.4

More information

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f 1,a) 2 zabbix Consideration of a system to support understanding of fault occurrences based on the similarity of the time series Miyaza Nao 1,a) Masuda Hideo 2 Abstract: With the development of network

More information

2

2 TECHNICAL DOCUMENT AES TECHNICAL COUNCIL Document ESTD1001.0.01-05 Multichannel surround sound systems and operations AES TC-MBAT Information Document: Multichannel Su rround Sound Systems and Operations.

More information

インターリーブADCでのタイミングスキュー影響のデジタル補正技術

インターリーブADCでのタイミングスキュー影響のデジタル補正技術 1 インターリーブADCでのタイミングスキュー影響のデジタル補正技術 浅見幸司 黒沢烈士 立岩武徳 宮島広行 小林春夫 ( 株 ) アドバンテスト 群馬大学 2 目次 1. 研究背景 目的 2. インターリーブADCの原理 3. チャネル間ミスマッチの影響 3.1. オフセットミスマッチの影響 3.2. ゲインミスマッチの影響 3.3. タイミングスキューの影響 4. 提案手法 4.1. インターリーブタイミングミスマッチ補正フィルタ

More information

untitled

untitled 4 1 4.1................................................. 1 4.1.1........................................ 1-1 4 17 11 30 4.1 2001 49% 2,400 47% 6,000 2001 390 8% 2005 3000 1000 IT 1 ADSL(Asymmetric Digital

More information

IPSJ SIG Technical Report Vol.2019-MUS-123 No.23 Vol.2019-SLP-127 No /6/22 Bidirectional Gated Recurrent Units Singing Voice Synthesi

IPSJ SIG Technical Report Vol.2019-MUS-123 No.23 Vol.2019-SLP-127 No /6/22 Bidirectional Gated Recurrent Units Singing Voice Synthesi Bidirectional Gated Recurrent Units Singing Voice Synthesis Using Bidirectional Gated Recurrent Units. [] (HMM) [] [3], [4] Kobe University MEC Company Ltd. (Text to Speech: TTS) [5].. 3Hz Hz c 9 Information

More information

IEEE e

IEEE e 2007 IEEE 802.11e LAN VoIP 2008 2 4 3606U075-2 1 5 1.1...................................... 5 1.2...................................... 5 1.3..................................... 6 2 IEEE 802.11e LAN

More information

数値計算:フーリエ変換

数値計算:フーリエ変換 ( ) 1 / 72 1 8 2 3 4 ( ) 2 / 72 ( ) 3 / 72 ( ) 4 / 72 ( ) 5 / 72 sample.m Fs = 1000; T = 1/Fs; L = 1000; t = (0:L-1)*T; % Sampling frequency % Sample time % Length of signal % Time vector y=1+0.7*sin(2*pi*50*t)+sin(2*pi*120*t)+2*randn(size(t));

More information

1 Jensen et al.[6] GRT S&P500 GRT RT GRT Kiriu and Hibiki[8] Jensen et al.[6] GRT 3 GRT Generalized Recovery Theorem (Jensen et al.[6])

1 Jensen et al.[6] GRT S&P500 GRT RT GRT Kiriu and Hibiki[8] Jensen et al.[6] GRT 3 GRT Generalized Recovery Theorem (Jensen et al.[6]) Generalized Recovery Theorem Ross[11] Recovery Theorem(RT) RT forward looking Kiriu and Hibiki[8] Generalized Recovery Theorem(GRT) Jensen et al.[6] GRT RT Kiriu and Hibiki[8] 1 backward looking forward

More information

(5 B m e i 2π T mt m m B m e i 2π T mt m m B m e i 2π T mt B m (m < 0 C m m (6 (7 (5 g(t C 0 + m C m e i 2π T mt (7 C m e i 2π T mt + m m C m e i 2π T

(5 B m e i 2π T mt m m B m e i 2π T mt m m B m e i 2π T mt B m (m < 0 C m m (6 (7 (5 g(t C 0 + m C m e i 2π T mt (7 C m e i 2π T mt + m m C m e i 2π T 2.6 FFT(Fast Fourier Transform 2.6. T g(t g(t 2 a 0 + { a m b m 2 T T 0 2 T T 0 (a m cos( 2π T mt + b m sin( 2π mt ( T m 2π g(t cos( T mtdt m 0,, 2,... 2π g(t sin( T mtdt m, 2, 3... (2 g(t T 0 < t < T

More information

cf_19_0802

cf_19_0802 CREATOR' S FILE 6 b i z. t o p p a n. c o. j p / g a i n f o 2 vol.39 Aug.24, 2007 S H I R A I Y O S H I H I S A 19 No. 7 8 9 C R E AT O R ' S F I L E vol.39 2007824 1 101-0024 http://www.toppan.co.jp

More information

a) Extraction of Similarities and Differences in Human Behavior Using Singular Value Decomposition Kenichi MISHIMA, Sayaka KANATA, Hiroaki NAKANISHI a

a) Extraction of Similarities and Differences in Human Behavior Using Singular Value Decomposition Kenichi MISHIMA, Sayaka KANATA, Hiroaki NAKANISHI a a) Extraction of Similarities and Differences in Human Behavior Using Singular Value Decomposition Kenichi MISHIMA, Sayaka KANATA, Hiroaki NAKANISHI a), Tetsuo SAWARAGI, and Yukio HORIGUCHI 1. Johansson

More information

15群(○○○)-8編

15群(○○○)-8編 2 群 ( 画像 音 言語 )-5 編 ( 画像符号化 ) 3 章符号化前処理 電子情報通信学会 知識の森 (http://www.ieice-hbkb.org/) ( 執筆者 : 坂東幸浩 )[2009 年 12 月受領 ] 概要 低ビットレート向けの映像符号化では, 符号化処理に先立ち各種の前処理が行われる. この前処理の目的は, 主観画質を損なわない範囲内で, 映像信号を符号化器において符号化しやすい

More information

10_08.dvi

10_08.dvi 476 67 10 2011 pp. 476 481 * 43.72.+q 1. MOS Mean Opinion Score ITU-T P.835 [1] [2] [3] Subjective and objective quality evaluation of noisereduced speech. Takeshi Yamada, Shoji Makino and Nobuhiko Kitawaki

More information

Wavelet HSI / [1] JPEG2000 9/7Wavelet [2][6] 2:1 9/7Wavelet Wavelet 80 Wavelet i

Wavelet HSI / [1] JPEG2000 9/7Wavelet [2][6] 2:1 9/7Wavelet Wavelet 80 Wavelet i 17 Wavelet Image Enhancement by Wavelet Transform 1060326 2006 3 10 Wavelet HSI / [1] JPEG2000 9/7Wavelet [2][6] 2:1 9/7Wavelet Wavelet 80 Wavelet i Abstract Image Enhancement by Wavelet Transform Yuichi

More information

AAC技術解説

AAC技術解説 2009 年 11 月 4 日 MPEG-2 AAC 方式の運用に関する技術解説 AAC 調整連絡会 1. まえがき 2004 年 1 月頃より地上デジタルテレビジョン放送の5.1chサラウンド番組の視聴者から 音声再生不具合のクレームが届くようになった 放送事業者で調査した結果 送出エンコーダの AACパラメータのひとつであるTNS 符号化ツールがONの際に 地上デジタル放送開始以前に設計されたAVアンプを地上デジタル放送用受信機に接続して5.1chサラウンド番組を視聴すると

More information

学習内容と日常生活との関連性の研究-第2部-第4章-1

学習内容と日常生活との関連性の研究-第2部-第4章-1 69 V A V + A V A 2A 2 http://www.jba-hp.jp/ http://www.kbn3.com/ http://www.usba.org/ 70 (1) (1996)35 7 pp.28-33 (2) (1994) 71 () 3 1 1 99 8 1 10 1 11.3 2.5 1 100 11.4 30.9 1 72 (1) http://www.stat.go.jp/data/zensho/1999/zuhyou/a906-6.xls

More information

Microsoft PowerPoint - 6.PID制御.pptx

Microsoft PowerPoint - 6.PID制御.pptx プロセス制御工学 6.PID 制御 京都大学 加納学 Division of Process Control & Process Systems Engineering Department of Chemical Engineering, Kyoto University manabu@cheme.kyoto-u.ac.jp http://www-pse.cheme.kyoto-u.ac.jp/~kano/

More information

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE {s-kasihr, wakamiya,

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE {s-kasihr, wakamiya, THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. 565-0871 1 5 E-mail: {s-kasihr, wakamiya, murata}@ist.osaka-u.ac.jp PC 70% Design, implementation, and evaluation

More information

1 0/1, a/b/c/ {0, 1} S = {s 1, s 2,..., s q } S x = X 1 X 2 X 3 X n S (n = 1, 2, 3,...) n n s i P (X n = s i ) X m (m < n) P (X n = s i X n 1 = s j )

1 0/1, a/b/c/ {0, 1} S = {s 1, s 2,..., s q } S x = X 1 X 2 X 3 X n S (n = 1, 2, 3,...) n n s i P (X n = s i ) X m (m < n) P (X n = s i X n 1 = s j ) (Communication and Network) 1 1 0/1, a/b/c/ {0, 1} S = {s 1, s 2,..., s q } S x = X 1 X 2 X 3 X n S (n = 1, 2, 3,...) n n s i P (X n = s i ) X m (m < n) P (X n = s i X n 1 = s j ) p i = P (X n = s i )

More information

untitled

untitled N N X=[ ] R IJK R X R ABC A=[a ] R B=[b ] R C=[c ] R ABC X =[ ] R = a b c X X X X X D( ) D(X X )= log + D( ) a a b b c c b c b c a c a c a b a b R X X A a t =a b c a = t a R i i = a =. a I R = a = b =

More information

WISS 2006 2 PowerPoint [3] [16] Mehrabian [10] 7% 93% [10] [19][18] Hindus [7] Lyons [9] [8] [14] TalkMan [4] [5] [6] 3 [19][18] [19] [19] 1 F0 [11] 7

WISS 2006 2 PowerPoint [3] [16] Mehrabian [10] 7% 93% [10] [19][18] Hindus [7] Lyons [9] [8] [14] TalkMan [4] [5] [6] 3 [19][18] [19] [19] 1 F0 [11] 7 WISS2006 A Presentation Training System using Speech and Image Processing. Web 1 [19] Copyright is held by the author(s). Kazutaka Kurihara and Takeo Igarashi,, Masataka Goto and Jun Ogata and Yosuke Matsusaka,,

More information

2.R R R R Pan-Tompkins(PT) [8] R 2 SQRS[9] PT Q R WQRS[10] Quad Level Vector(QLV)[11] QRS R Continuous Wavelet Transform(CWT)[12] Mexican hat 4

2.R R R R Pan-Tompkins(PT) [8] R 2 SQRS[9] PT Q R WQRS[10] Quad Level Vector(QLV)[11] QRS R Continuous Wavelet Transform(CWT)[12] Mexican hat 4 G-002 R Database and R-Wave Detecting System for Utilizing ECG Data Takeshi Nagatomo Ikuko Shimizu Takeshi Ikeda Akio Sashima Koichi Kurumatani R R MIT-BIH R 90% 1. R R [1] 2 24 16 Tokyo University of

More information

5 Armitage x 1,, x n y i = 10x i + 3 y i = log x i {x i } {y i } 1.2 n i i x ij i j y ij, z ij i j 2 1 y = a x + b ( cm) x ij (i j )

5 Armitage x 1,, x n y i = 10x i + 3 y i = log x i {x i } {y i } 1.2 n i i x ij i j y ij, z ij i j 2 1 y = a x + b ( cm) x ij (i j ) 5 Armitage. x,, x n y i = 0x i + 3 y i = log x i x i y i.2 n i i x ij i j y ij, z ij i j 2 y = a x + b 2 2. ( cm) x ij (i j ) (i) x, x 2 σ 2 x,, σ 2 x,2 σ x,, σ x,2 t t x * (ii) (i) m y ij = x ij /00 y

More information

sigmus201007_fujihara.dvi

sigmus201007_fujihara.dvi 1 1 1) W-PST W-PST W-PST W-PST Singing voice conversion method by using spectral envelope of singing voice estimated from polyphonic music Hiromasa Fujihara 1 and Masataka Goto 1 This paper describes a

More information

IPSJ SIG Technical Report Vol.2015-MUS-107 No /5/23 HARK-Binaural Raspberry Pi 2 1,a) ( ) HARK 2 HARK-Binaural A/D Raspberry Pi 2 1.

IPSJ SIG Technical Report Vol.2015-MUS-107 No /5/23 HARK-Binaural Raspberry Pi 2 1,a) ( ) HARK 2 HARK-Binaural A/D Raspberry Pi 2 1. HARK-Binaural Raspberry Pi 2 1,a) 1 1 1 2 3 () HARK 2 HARK-Binaural A/D Raspberry Pi 2 1. [1,2] [2 5] () HARK (Honda Research Institute Japan audition for robots with Kyoto University) *1 GUI ( 1) Python

More information