TCX γ 0.9,, H / H, [4], 3. 3., ( /(,,,,,,, Mel Log Spectrum Approximation (MLSA [5],, [6], [7].,,,,,,, (,,, 3.,,,,,,,, sinc,,, [8], W, ( Y ij Y ij W l
|
|
- みずき たつざわ
- 5 years ago
- Views:
Transcription
1 ,a,b,c,d,e,,,,,,,, TCX.,, (VoIP,,, 3GPP Extended Adaptive Multi-Rate Wideband (AMR- WB+ MPEG-D Unified Speech and Audio Coding (USAC [], [],,,, AMR-WB+ USAC, Transform Coded exitation (TCX, TCX NTT a sugiura@hil.t.u-toyo.ac.jp b amamoto.yutaa@lab.ntt.co.jp c harada.noboru@lab.ntt.co.jp d ameoa.hiroazu@lab.ntt.co.jp e moriya.taehiro@lab.ntt.co.jp,,, TCX., USAC (MDCT TCX [3] TCX,,, (LSP,,,.,, {a n } H = / + π j a n e N n, (0 N ( n, H H = / + a n γ n π j e N n, (0 < γ < ( n, H /H,,
2 TCX γ 0.9,, H / H, [4], 3. 3., ( /(,,,,,,, Mel Log Spectrum Approximation (MLSA [5],, [6], [7].,,,,,,, (,,, 3.,,,,,,,, sinc,,, [8], W, ( Y ij Y ij W log ix j W ix j (3, W, X, Y sinc, W X Y, [9], W, Y ij W + ( log W i X j L(W (4 ix j
3 f(x = x x > 0 Jensen W = ix j λ (5 ij(w i X j /λ ij ( λ ij λ ij 0, λ ij = W i X j /λ ij, ( log W i X j log ϕ ij + W ix j, (ϕ ij > 0 ϕ ij (6, W L(W λ ij Y ij (7 W i X j + ( log ϕ ij + W ix j G(W ϕ ij λ ij = W ix j W, ϕ ij = W i X j (8 ix j (7, λ, ϕ G(W W, W mn G(W W = W = j Y mj λ mjn/x nj ( W mn W mn = + j X nj ϕ mj = 0 j Y mjλ mjn /X nj j X nj/ϕ mj (9, W G(W W (8 λ, ϕ, (7, W. l W W (l, λ, ϕ λ ij = W (l i X j W (l i X, ϕ ij = j W (l i X j (0, (9 G(W W (l+, W mn (l+ =, = W (l W (l+ mn ( j Y mjw mn (l X nj / W (l mn j X nj/ W (l m X j m X j ( j Y mx nj /Ŷ mj j X, Ŷ = W (l X ( nj/ŷmj U, UW X X,, W, U,,, Y 3.3 TCX, (, (,, H /H, γ, N, (, f(,, f(0 = 0, {a n }, H = / + n H 0 = / + n a n γ n a n γ f( n π j e N n, ( N (3 γ,, f( U, f(0 0. U. (4 f(n N,, 3
4 情報処理学会研究報告 図 4 図 3 各帯域での包絡の線形予測分析からの改善量 (板倉斎藤距離基 準 の平均と標準偏差. 縦軸が 0 より大きい所は, 線形予測分 包絡の比較. 緑点線が MDCT による実数スペクトル, 赤破線 析の包絡よりもスペクトルからの距離が近いことを意味する. が提案手法, 青実線が線形予測分析による包絡. RWC 研究用音楽データベースのポピュラー音楽及びクラシッ ク計 5 曲からそれぞれランダムに 30 秒を切り取り使用. サ ンプリング周波数 6 Hz, フレームあたり 30 点のスペク 化により各行の非零要素数が最大 7 つであるようなメル対 トル, 包絡の次数は 6 次. MLSA フィルタは Speech Signal 数伸縮行列とその逆伸縮行列を設計した. そして, 音響信 Processing Toolit [0] のものを使用. 号の各フレームに対して, 最適化した伸縮行列または厳密 な sinc 補間による伸縮を用いた二種類の解像度伸縮包絡, 及び MLSA フィルタによる包絡を求め, パワースペクトル との板倉斎藤距離を計算した. 図 3 はある フレームで線形予測分析と最適化した伸縮 行列を用いた包絡を並べたものである. 低域において提案 手法の包絡の解像度が向上していることが確認できる. ま た, 定量的な評価として, 各手法による包絡が通常の線形予 測分析による包絡と比べ各帯域において精度がどれだけ変 化するかを比較した結果を図 4 に示す. 各手法の包絡はい ずれも対数的に周波数解像度を伸縮していることから, 通 常の線形予測分析と比べ低域での精度が上がり, その分高 図 5 提案手法の包絡を式 ( で平滑化した場合. 青破線が平滑化 域での精度が下がっている. 最適化した行列と厳密な sinc 前, 赤実線が平滑化後, 次数は 6. 補間との比較では, いずれも低域での精度向上は同等であ るが, 最適化した方では sinc 補間よりも高域での伸縮 逆 伸縮における無矛盾性が保たれていることがわかる. そし て, 提案手法は MLSA フィルタとほぼ同等な性能を示した. 4. 聴覚重み付け比較 続いて, 聴覚重み付けによる包絡の平滑化に関しても比 較を行った. 通常, 線形予測分析で得られた包絡を式 ( に よって重み付けした際には, 包絡のピークが急峻なほど大 きく平滑化され, なだらかなものはあまり変化しない. し かし, 前節と同様の解像度伸縮をした包絡にこの単純な平 滑化を行った結果, 図 5 のように低域において通常よりも ピークの形が大きく残ってしまった. これは式 ( の操作 がメル対数周波数軸上で行われてしまうことに起因する. 一方, 式 (3 を用いた場合, 図 6 のように軸の伸縮に合わ 図 6 提案手法の包絡を式 (3 で平滑化した場合. 青破線が平滑化 前, 赤実線が平滑化後, 次数は 音質の主観評価 せて平滑化された包絡が得られた. 周波数毎に γ に補正を 最後に TCX をベースとした符号化器を作成し, 上の実 かけることにより, 線形周波数軸上でのピークの急峻さに 験で使用したメル対数伸縮行列による解像度伸縮を導入し あわせて平滑化されることが確認できた. て, ITU-R BS.534- MUltiple Stimuli with Hidden Ref- 04 Information Processing Society of Japan 4
5 5. (a MUSHRA TCX, TCX, AMR-WB+.,,, MLSA,,,, (b 7 95, * 5 erence and Anchor (MUSHRA TCX 6 Hz 30 (0 ms, 40 ms, AMR-WB+ 7 ms RWC 6 0,, 6 Hz 6 bps 7 TCX, AMR-WB+ 3, 3.5 Hz, 00 7(a AMR-WB+,, 7(b., 6, 3 5,, [] 3GPP TS 6.90 version.0.0 Release, 3GPP, 0. [] M. Neuendorf, et al., MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types, AES 3nd Convention, Budapest, HU, Apr. 0. [3] G. Fuchs, et al., MDCT-Based Coder for Highly Adaptive Speech and Audio Coding, EUSIPCO., IEEE, pp.64-68, 009. [4] R. Rice and J. Plaunt, Adaptive Variable-Length Coding for Efficient Compression of Spacecraft Television Data, Transaction on Communication Technology, IEEE, Vol. COM-9, No.6, Dec., 97. [5], et al, (MLSA, 83/, Vol.J66-A, No., pp.-9, 983. [6] K. Koshida, et al., Efficient Encoding of Mel-Generalized Cepstrum for CELP Coders, ICASSP-97., IEEE, Vol., pp , 997. [7] K. Koshida, et al., A Wideband CELP Speech Coder at 6 bit/s Based on Mel-Generalized Cepstral Analysis, ICASP-98, IEEE, Vol., pp.6-64, 998. [8],,,, 97. [9], et al.,,, vol. 006-MUS-66, pp.77-84, Aug [0] ( 3 5
Implementation of Computationally Efficient Real-Time Voice Conversion
音情報処理 第 4 回 音声符号化 中村哲 1 秒間につき 128 kbi 使用 音声符号化 1 秒間につき 8 kbi だけ使用 伝送するビット数を 6% 程度に減らすことができる! 本日の講義を受けることで なぜこのようなことが可能なのかを理解することができます 講義内容 波形符号化 標本化 量子化 音声符号化方式 波形符号化方式 分析合成方式 ハイブリッド方式 聴覚符号化方式 符号化 ある情報を他のもの
More informationEVS 1 [17 19] EVS 2. EVS 2.1 EVS 13 1 Qualification Selection Characterization 3 [20] 12 EVS 2.2 EVS 1 20 ms 32 ms 2 8kHz NB: Narrow-ba
74 2 2018 pp. 83 92 83 VoLTE 3GPP EVS * NTT NTT 43.72.Gy, 43.60.Ek 1. ITU- T International Telecommunication Union Telecommunication standardizaion sector G.711 PCM Pulse Code Modulation A-law/µ-law [1]
More informationMicrosoft PowerPoint - SP _slides
音情報処理 第 3 回音声符号化 戸田智基 名古屋大学情報基盤センター / 大学院情報科学研究科 講義内容 波形符号化 標本化 量子化 音声符号化方式 波形符号化方式 分析合成方式 ハイブリッド方式 聴覚符号化方式 符号化 ある情報を他のもの ( 符号 ) で置き換える作業 例 1: 新聞広告 賃貸マンションをお貸しします. 間取りは 2LDK で, 具体的には 8 畳,6 畳,4.5 畳のダイニングキッチン,
More informationMicrosoft Word - 02gun_08hen_03.doc
2 群 ( 画像 音 言語 ) 8 編 ( 音声 オーディオ符号化 ) 3 章モバイル向け符号化方式 ( 執筆者 : 小澤一範 )[2009 年 12 月受領 ] 概要 既にサービスされていたアナログ方式と比べ同等以上の無線周波数利用効率を確保するために,1980 年代後半から移動体通信のディジタル化 ( 第二世代 ) を実現する検討が行われた. これには音声のディジタル圧縮は必須の重要技術であり,
More informationIPSJ SIG Technical Report 1, Instrument Separation in Reverberant Environments Using Crystal Microphone Arrays Nobutaka ITO, 1, 2 Yu KITANO, 1
1, 2 1 1 1 Instrument Separation in Reverberant Environments Using Crystal Microphone Arrays Nobutaka ITO, 1, 2 Yu KITANO, 1 Nobutaka ONO 1 and Shigeki SAGAYAMA 1 This paper deals with instrument separation
More information2. CABAC CABAC CABAC 1 1 CABAC Figure 1 Overview of CABAC 2 DCT 2 0/ /1 CABAC [3] 3. 2 値化部 コンテキスト計算部 2 値算術符号化部 CABAC CABAC
H.264 CABAC 1 1 1 1 1 2, CABAC(Context-based Adaptive Binary Arithmetic Coding) H.264, CABAC, A Parallelization Technology of H.264 CABAC For Real Time Encoder of Moving Picture YUSUKE YATABE 1 HIRONORI
More informationSAP11_03
第 3 回 音声音響信号処理 ( 線形予測分析と自己回帰モデル ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮 ) 音声分析 合成 認識 強調 音楽信号処理統計的信号処理の基礎
More information動画コンテンツ 動画 1 動画 2 動画 3 生成中の映像 入力音楽 選択された素片 テンポによる伸縮 音楽的構造 A B B B B B A C C : 4) 6) Web Web 2 2 c 2009 Information Processing S
1 2 2 1 Web An Automatic Music Video Creation System by Reusing Dance Video Content Sora Murofushi, 1 Tomoyasu Nakano, 2 Masataka Goto 2 and Shigeo Morishima 1 This paper presents a system that automatically
More information11 22 33 12 23 1 2 3, 1 2, U2 3 U 1 U b 1 (o t ) b 2 (o t ) b 3 (o t ), 3 b (o t ) MULTI-SPEAKER SPEECH DATABASE Training Speech Analysis Mel-Cepstrum, logf0 /context1/ /context2/... Context Dependent
More information40.9 22.6 18.1 4.9 1.0 15.3 10.0 (%) 3.5 5.8 6.0 23.5 29.5 70.5 100.0 (%) 267 447 456 1,788 2,244 5,364 7,609 0.3 6.5 975 5.6 386 (%) (%) (%) 3.6 6.3 100.0 6.6 5.3 27.2 32.8 67.2 100.0 22.5 538 452 10.1
More information2.2 (a) = 1, M = 9, p i 1 = p i = p i+1 = 0 (b) = 1, M = 9, p i 1 = 0, p i = 1, p i+1 = 1 1: M 2 M 2 w i [j] w i [j] = 1 j= w i w i = (w i [ ],, w i [
RI-002 Encoding-oriented video generation algorithm based on control with high temporal resolution Yukihiro BANDOH, Seishi TAKAMURA, Atsushi SHIMIZU 1 1T / CMOS [1] 4K (4096 2160 /) 900 Hz 50Hz,60Hz 240Hz
More informationIPSJ SIG Technical Report Vol.2010-AVM-68 No /3/ High-Efficient 2-pass Video Coding Algorithm based on Macroblock Rate-Distortion Kazu
. High-Efficient -pass Video Coding Algorithm based on Macroblock Rate-Distortion Kazuya Yokohari, Atsushi Sagata and Kazuto Kamikura In order to achieve high-efficient video coding, -pass video coding
More informationIPSJ SIG Technical Report Vol.2015-MUS-106 No.10 Vol.2015-EC-35 No /3/2 BGM 1,4,a) ,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 201
BGM 1,4,a) 1 2 2 3,4 BGM. BGM. BGM BGM. BGM. BGM. BGM. 1.,. YouTube 2015 1 100.. Web.. BGM.BGM [1]. BGM BGM 1 Waseda University, Shinjuku, Tokyo 169-8555, Japan 2 3 4 JST CREST a) ha-ru-ki@asagi.waseda.jp.
More informationバイノーラルマイクを用いたライフログ映像のショット識別 Life-log Video Shot Discrimination using Binaural Microphone 山野貴一郎 伊藤克亘 法政大学大学院情報科学研究科 法政大学情報科学部 Kiichiro YAMANO Katunobu
バイノーラルマイクを用いたライフログ映像のショット識別 Life-log Video Shot Discrimination using Binaural Microphone 山野貴一郎 伊藤克亘 法政大学大学院情報科学研究科 法政大学情報科学部 Kiichiro YAMANO Katunobu ITOU Graduate School of Computer and Information Sciences,
More information21 1 2 1 2
21 1 2 1 2 1 2 3 ( ) 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 210 0.0 0.0 22 23 25 27 28 29 30 31 32 33 34 35 36 74 pp.4362003.10 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 141224 14 48 10
More informationMissing Data NMF
月 4 2013 冬学期 [4830-1032] 第 4 回 音声音響信号処理 ( 線形予測分析と自己回帰モデル ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介 情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮
More informationPowerPoint プレゼンテーション
音響学入門ペディア Q. 様々な音響特徴量それぞれの使い方や意味を教えて下さい 千葉祐弥東北大学大学院工学研究科博士後期課程 2 年 マスター特徴量って何に使うものタイトルの書式設定? 統計的分析 人間が音を聞く仕組みを解明する ( 方向 高さ 大きさ 音色 の知覚 ) データの符号化 圧縮への応用など 機械学習 パターン認識 音声認識 音声インターフェースの作成 楽曲のジャンル推定 楽曲検索 推薦等への応用など
More information2013 M
2013 M0110453 2013 : M0110453 20 1 1 1.1............................ 1 1.2.............................. 4 2 5 2.1................................. 6 2.2................................. 8 2.3.................................
More information0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌
0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 スペクトルデータの特徴 1 波 ( 波数 ) が近いと 吸光度 ( 強度 ) の値も似ている ノイズが含まれる 吸光度 ( 強度 ) の極大値 ( ピーク ) 以外のデータも重要 時系列データの特徴 2 時刻が近いと プロセス変数の値も似ている ノイズが含まれる プロセス変数の極大値
More informationIPSJ SIG Techncal Report 歌声データベース 歌声の波形 スペクトル抽出 基本周波数抽出 HMM メルケプストラム ラベル HMM の学習 対数基本周波数 c 学習部 コンテキスト依存モデル c ( 合成部 楽譜 ラベル変換 ラベル... メルケプストラム パラメータ生成 ML
IPSJ SIG Techncal Report HMM HMM HMM HMM 60 Vbrato Modelng for HMM-based Sngng Voce Synthess Tomohko Yamada, Satoru Muto, Yoshhko ankaku, Shnj Sako and Kech Tokuda HMM-based sngng voce synthess can automatcally
More informationit-ken_open.key
深層学習技術の進展 ImageNet Classification 画像認識 音声認識 自然言語処理 機械翻訳 深層学習技術は これらの分野において 特に圧倒的な強みを見せている Figure (Left) Eight ILSVRC-2010 test Deep images and the cited4: from: ``ImageNet Classification with Networks et
More information医系の統計入門第 2 版 サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. このサンプルページの内容は, 第 2 版 1 刷発行時のものです.
医系の統計入門第 2 版 サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. http://www.morikita.co.jp/books/mid/009192 このサンプルページの内容は, 第 2 版 1 刷発行時のものです. i 2 t 1. 2. 3 2 3. 6 4. 7 5. n 2 ν 6. 2 7. 2003 ii 2 2013 10 iii 1987
More informationMicrosoft PowerPoint - ip02_01.ppt [互換モード]
空間周波数 周波数領域での処理 空間周波数 (spatial frquncy) とは 単位長さ当たりの正弦波状の濃淡変化の繰り返し回数を表したもの 正弦波 : y sin( t) 周期 : 周波数 : T f / T 角周波数 : f 画像処理 空間周波数 周波数領域での処理 波形が違うと 周波数も違う 画像処理 空間周波数 周波数領域での処理 画像処理 3 周波数領域での処理 周波数は一つしかない?-
More informationスライド タイトルなし
(1) - E-Mail: katto@waseda.jp Y U V R G B (1/30 ) RGB / YUV = B G R V U Y 0.31 0.52 0.21 0.32 0.28 0.60 0.11 0.59 0.30 RGB YUV CCIR 601 4:4:4 4:2:2 4:2:0 Y Y Y U V U V U V YUVUV UV 4:2:0 4:2:2 (RGB8 )
More informationPowerPoint Presentation
付録 2 2 次元アフィン変換 直交変換 たたみ込み 1.2 次元のアフィン変換 座標 (x,y ) を (x,y) に移すことを 2 次元での変換. 特に, 変換が と書けるとき, アフィン変換, アフィン変換は, その 1 次の項による変換 と 0 次の項による変換 アフィン変換 0 次の項は平行移動 1 次の項は座標 (x, y ) をベクトルと考えて とすれば このようなもの 2 次元ベクトルの線形写像
More informationVocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案
VocaListener ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案 中野倫靖, 後藤真孝 ( 産業技術総合研究所 ) 2008 年 5 月 28 日第 75 回音楽情報科学研究会 (SIGMUS) 第 128 回ヒューマンコンピュータインタラクション研究会 (SIGHCI) 現状の歌声合成の使い方 歌声合成システムを選択 [ ] Vocaloid [ ] Vocaloid2
More informationTCP/IP IEEE Bluetooth LAN TCP TCP BEC FEC M T M R M T 2. 2 [5] AODV [4]DSR [3] 1 MS 100m 5 /100m 2 MD 2 c 2009 Information Processing Society of
IEEE802.11 [1]Bluetooth [2] 1 1 (1) [6] Ack (Ack) BEC FEC (BEC) BEC FEC 100 20 BEC FEC 6.19% 14.1% High Throughput and Highly Reliable Transmission in MANET Masaaki Kosugi 1 and Hiroaki Higaki 1 1. LAN
More informationIPSJ SIG Technical Report Vol.2015-CVIM-196 No /3/6 1,a) 1,b) 1,c) U,,,, The Camera Position Alignment on a Gimbal Head for Fixed Viewpoint Swi
1,a) 1,b) 1,c) U,,,, The Camera Position Alignment on a Gimbal Head for Fixed Viewpoint Swiveling using a Misalignment Model Abstract: When the camera sets on a gimbal head as a fixed-view-point, it is
More informationDEIM Forum 2019 A7-1 Flexible Distance-based Hashing mori
DEIM Forum 2019 A7-1 Flexible Distance-based Hashing 731 3194 E-mail: mc66023@e.hiroshima-cu.ac.jp,{wakaba,s naga,inagi,yoko}@hiroshima-cu.ac.jp, morikei18@gmail.com Flexible Distance-based Hashing(FDH)
More informationIPSJ-SLP
F0 MFCC 1 2 3 1 1 1 1 MFCCF0 1 86.7% 90.2% A System for Automatic Discrimination between Singing and Speaking Voices on the Basis of Peak Interval of Spectral Change, F0, and MFCC Shimpei Aso, 1 Takeshi
More informationpp d 2 * Hz Hz 3 10 db Wind-induced noise, Noise reduction, Microphone array, Beamforming 1
72 12 2016 pp. 739 748 739 43.60.+d 2 * 1 2 2 3 2 125 Hz 0.3 0.8 2 125 Hz 3 10 db Wind-induced noise, Noise reduction, Microphone array, Beamforming 1. 1.1 PSS [1] [2 4] 2 Wind-induced noise reduction
More information2016 [1][2] H.264/AVC HEVC HEVC
HEVC 2012 (409825) 2016 [1][2] H.264/AVC HEVC HEVC Abstract As ultra high definition television is planning on test broadcasting 2016, moving picture resolution enhancement is advancing in recent years.
More information3 3) 6) 1) MPEG-7 2) MPEG-7 (A) (B) 2 9) Zils 10) (1) (2) 2.1 2
yoshii@kuis.kyoto-u.ac.jp m.goto@aist.go.jp okuno@i.kyoto-u.ac.jp 48% 82% Identification of Hihat Cymbals for Musical Audio Signals Using the Single Template Adaptation Method KAZUYOSHI YOSHII,MASATAKA
More information2. ICA ICA () (Blind Source Separation BBS) 2) Fig. 1 Model of Optical Topography. ( ) ICA 2.2 ICA ICA 3) n 1 1 x 1 (t) 2 x 2 (t) n x(t) 1 x(t
ICA 1 2 2 (Independent Component Analysis) Denoising Method using ICA for Optical Topography Yamato Yokota, 1 Tomoyuki Hiroyasu 2 and Hisatake Yokouchi 2 Optical topography is one of the promising ways
More information, ( ξ/) ξ(x), ( ξ/) x = x 1,. ξ ξ ( ξ, u) = 0. M LS ξ ξ (6) u,, u M LS 3).,.. ξ x ξ = ξ(x),, 1. J = (ξ ξ, V [ξ ] 1 (ξ ξ )) (7) ( ξ, u) = 0, = 1,..., N
1,,.,.. Maximum Likelihood Estimation for Geometric Fitting Yasuyuki Sugaya 1 Geometric fitting, the problem which estimates a geometric model of a scene from extracted image data, is one of the most fundamental
More information第 1 回バイオメトリクス研究会 ( 早稲田大学 ) THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS Proceedings of Biometrics Workshop,169
THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS Proceedings of Biometrics Workshop,169-8555 3-4-1,169-8555 3-4-1 E-mail: s hayashi@kom.comm.waseda.ac.jp, ohki@suou.waseda.jp Wolf
More information2 (2016 3Q N) c = o (11) Ax = b A x = c A n I n n n 2n (A I n ) (I n X) A A X A n A A A (1) (2) c 0 c (3) c A A i j n 1 ( 1) i+j A (i, j) A (i, j) ã i
[ ] (2016 3Q N) a 11 a 1n m n A A = a m1 a mn A a 1 A A = a n (1) A (a i a j, i j ) (2) A (a i ca i, c 0, i ) (3) A (a i a i + ca j, j i, i ) A 1 A 11 0 A 12 0 0 A 1k 0 1 A 22 0 0 A 2k 0 1 0 A 3k 1 A rk
More informationGmech08.dvi
145 13 13.1 13.1.1 0 m mg S 13.1 F 13.1 F /m S F F 13.1 F mg S F F mg 13.1: m d2 r 2 = F + F = 0 (13.1) 146 13 F = F (13.2) S S S S S P r S P r r = r 0 + r (13.3) r 0 S S m d2 r 2 = F (13.4) (13.3) d 2
More information2014 3
1 3 113 : 1 Copyright c 1 by Kobayashi Keisuke Desktop Music (DTM) DAW (Digital Audio Workstation) YAMAHA Vocaloid DTM MIDI (Musical Instruments Digital Interface) Lee (Non-negative Matrix Factorization;
More information振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫
6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫りにするために スペクトルを滑らかにする操作のことをいう 6.1 合積のフーリエ変換スペクトルの平滑化を行う際に必要な 合積とそのフーリエ変換について説明する 6.2 データ
More informationトピックモデルの応用: 関係データ、ネットワークデータ
NTT コミュニケーション科学基礎研究所 石黒勝彦 2013/01/15-16 統計数理研究所会議室 1 1 画像認識系から尐し遅れますが 最近では音声 音響データに対してもトピックモデルが利用されるようになっています 2 1. どの特徴量を利用するか? 2. 時系列性をどう扱うか? 3 どの特徴量を利用して どうやって BoW 形式に変換するかを検討する必要があります MFCC: 音声認識などで広い範囲で利用される
More information<4D F736F F D B B83578B6594BB2D834A836F815B82D082C88C60202E646F63>
単純適応制御 SAC サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. http://www.morikita.co.jp/books/mid/091961 このサンプルページの内容は, 初版 1 刷発行当時のものです. 1 2 3 4 5 9 10 12 14 15 A B F 6 8 11 13 E 7 C D URL http://www.morikita.co.jp/support
More informationスペクトルに対応する英語はスペクトラム(spectrum)です
7. ハミング窓とフラットトップ窓の等価ノイズ帯域幅 (ENBW) (1) Hamming 窓 Hamming 窓は次式で表されます MaTX にも関数が用意されています win = 0.54-0.46*cos(2*PI*[k/(N-1)); ただし k=0,1,---,n-1 N=256; K=[0:N-1]; w=0.54-0.46*cos(2*pi*k/(n-1)); mgplot_reset(1);
More informationVocaListener2(ぼかりす2): ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システム
twitter アカウント : @VocaListener twitter ハッシュタグ : #vocalis VocaListener2( ぼかりす 2) ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システムの提案 中野倫靖, 後藤真孝 ( 産業技術総合研究所 ) 21 年 7 月 28 日第 86 回音楽情報科学研究会 (SIGMUS) VocaListener1( ぼかりす 1)
More information[2] OCR [3], [4] [5] [6] [4], [7] [8], [9] 1 [10] Fig. 1 Current arrangement and size of ruby. 2 Fig. 2 Typography combined with printing
1,a) 1,b) 1,c) 2012 11 8 2012 12 18, 2013 1 27 WEB Ruby Removal Filters Using Genetic Programming for Early-modern Japanese Printed Books Taeka Awazu 1,a) Masami Takata 1,b) Kazuki Joe 1,c) Received: November
More informationディジタル信号処理
ディジタルフィルタの設計法. 逆フィルター. 直線位相 FIR フィルタの設計. 窓関数法による FIR フィルタの設計.5 時間領域での FIR フィルタの設計 3. アナログフィルタを基にしたディジタル IIR フィルタの設計法 I 4. アナログフィルタを基にしたディジタル IIR フィルタの設計法 II 5. 双 次フィルタ LI 離散時間システムの基礎式の証明 [ ] 4. ] [ ]*
More informationohpr.dvi
2003/12/04 TASK PAF A. Fukuyama et al., Comp. Phys. Rep. 4(1986) 137 A. Fukuyama et al., Nucl. Fusion 26(1986) 151 TASK/WM MHD ψ θ ϕ ψ θ e 1 = ψ, e 2 = θ, e 3 = ϕ ϕ E = E 1 e 1 + E 2 e 2 + E 3 e 3 J :
More information2008 : 80725872 1 2 2 3 2.1.......................................... 3 2.2....................................... 3 2.3......................................... 4 2.4 ()..................................
More information音情報処理I
音情報処理論 音声処理における信号処理 ~ 線形予測分析 ~ 東京大学大学院情報理工学系研究科 / 奈良先端大 猿渡洋 4 年 月 準備 :Z 変換 Z 変換 離散的な時系列の特性を解析する 手法 準備 : は離散時間波形 x x { x,..., x, x,..., x } 実数 定義 正 Z 変換 ; 時間領域から Z 領域へ ここで X x は サンプル時間遅れを表す演算子 定義 逆 Z 変換
More informationSAP11_12
第 12 回 音声音響信号処理 ( 講義のまとめ ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介 情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮 ) 音声分析 合成 認識 強調 音楽信号処理 統計的信号処理の基礎
More information図 1: HPSS の処理の手順 HPSS では信号 s(t) をフレーム長 lk で STFT して得られる振幅スペクトログラム S 上で スペクトログラム を H, P に分離し 逆 STFT することにより 定常 狭帯域的成分 h(t) と非定常 広帯域的成分 p(t) とを分離する 調波打楽
第回信号処理シンポジウム 1年11月日 日(奈良) 複数スペクトログラムに基づく信号の変動スペクトル表現と それに基づく信号の新しい分析 分離手法の検討 Multi-spectrogram-based Fluctuation Representation of Signal and Its Application to New Signal Analysis and Separation 橘秀幸 小野順貴
More informationMicrosoft Word - 02gun_08hen_02.doc
2 群 ( 画像 音 言語 ) 8 編 ( 音声 オーディオ符号化 ) 2 章有線 汎用符号化方式 ( 執筆者 : 守谷健弘 )[2009 年 12 月受領 ] 概要 ITU-T,MPEG(Moving Picture Expert Group) などで制定されてきた音声やオーディオ信号の符号化方式を紹介する. これらの符号化方式の用途は必ずしも固定されていないが, 多様な電話サービス, インターネットを通じた配信,
More informationPowerPoint プレゼンテーション
エージェントベースドシミュレーションによる店舗内回遊モデル構築に関する研究 大阪府立大学 現代システム科学域 知識情報システム学類石丸悠太郎 指導教員 森田裕之 背景 顧客の店舗内回遊シミュレーションは 店舗内でのプロモーションや商品配置の影響を実施する前に結果を予測することが可能となるため 実施前に効果を確認することでコストや時間を削減することができる 従来は 購買履歴やアンケート結果を用いたモデルを行わざるを得なかったため
More information基本 CMYK
Information Communication Technology ICT = Information and Communication Technology 04 16 26 % 5 3 554 1,717 1,4 1,397 3,001 52.5 56.1 52.2 53.6 48.1 47.6 47.9 % 506 470 506 1,482 1,708 1,530 3,238 47.4
More informationIPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f
1,a) 2 zabbix Consideration of a system to support understanding of fault occurrences based on the similarity of the time series Miyaza Nao 1,a) Masuda Hideo 2 Abstract: With the development of network
More information2
TECHNICAL DOCUMENT AES TECHNICAL COUNCIL Document ESTD1001.0.01-05 Multichannel surround sound systems and operations AES TC-MBAT Information Document: Multichannel Su rround Sound Systems and Operations.
More informationインターリーブADCでのタイミングスキュー影響のデジタル補正技術
1 インターリーブADCでのタイミングスキュー影響のデジタル補正技術 浅見幸司 黒沢烈士 立岩武徳 宮島広行 小林春夫 ( 株 ) アドバンテスト 群馬大学 2 目次 1. 研究背景 目的 2. インターリーブADCの原理 3. チャネル間ミスマッチの影響 3.1. オフセットミスマッチの影響 3.2. ゲインミスマッチの影響 3.3. タイミングスキューの影響 4. 提案手法 4.1. インターリーブタイミングミスマッチ補正フィルタ
More informationuntitled
4 1 4.1................................................. 1 4.1.1........................................ 1-1 4 17 11 30 4.1 2001 49% 2,400 47% 6,000 2001 390 8% 2005 3000 1000 IT 1 ADSL(Asymmetric Digital
More informationIPSJ SIG Technical Report Vol.2019-MUS-123 No.23 Vol.2019-SLP-127 No /6/22 Bidirectional Gated Recurrent Units Singing Voice Synthesi
Bidirectional Gated Recurrent Units Singing Voice Synthesis Using Bidirectional Gated Recurrent Units. [] (HMM) [] [3], [4] Kobe University MEC Company Ltd. (Text to Speech: TTS) [5].. 3Hz Hz c 9 Information
More informationIEEE e
2007 IEEE 802.11e LAN VoIP 2008 2 4 3606U075-2 1 5 1.1...................................... 5 1.2...................................... 5 1.3..................................... 6 2 IEEE 802.11e LAN
More information数値計算:フーリエ変換
( ) 1 / 72 1 8 2 3 4 ( ) 2 / 72 ( ) 3 / 72 ( ) 4 / 72 ( ) 5 / 72 sample.m Fs = 1000; T = 1/Fs; L = 1000; t = (0:L-1)*T; % Sampling frequency % Sample time % Length of signal % Time vector y=1+0.7*sin(2*pi*50*t)+sin(2*pi*120*t)+2*randn(size(t));
More information1 Jensen et al.[6] GRT S&P500 GRT RT GRT Kiriu and Hibiki[8] Jensen et al.[6] GRT 3 GRT Generalized Recovery Theorem (Jensen et al.[6])
Generalized Recovery Theorem Ross[11] Recovery Theorem(RT) RT forward looking Kiriu and Hibiki[8] Generalized Recovery Theorem(GRT) Jensen et al.[6] GRT RT Kiriu and Hibiki[8] 1 backward looking forward
More information(5 B m e i 2π T mt m m B m e i 2π T mt m m B m e i 2π T mt B m (m < 0 C m m (6 (7 (5 g(t C 0 + m C m e i 2π T mt (7 C m e i 2π T mt + m m C m e i 2π T
2.6 FFT(Fast Fourier Transform 2.6. T g(t g(t 2 a 0 + { a m b m 2 T T 0 2 T T 0 (a m cos( 2π T mt + b m sin( 2π mt ( T m 2π g(t cos( T mtdt m 0,, 2,... 2π g(t sin( T mtdt m, 2, 3... (2 g(t T 0 < t < T
More informationcf_19_0802
CREATOR' S FILE 6 b i z. t o p p a n. c o. j p / g a i n f o 2 vol.39 Aug.24, 2007 S H I R A I Y O S H I H I S A 19 No. 7 8 9 C R E AT O R ' S F I L E vol.39 2007824 1 101-0024 http://www.toppan.co.jp
More informationa) Extraction of Similarities and Differences in Human Behavior Using Singular Value Decomposition Kenichi MISHIMA, Sayaka KANATA, Hiroaki NAKANISHI a
a) Extraction of Similarities and Differences in Human Behavior Using Singular Value Decomposition Kenichi MISHIMA, Sayaka KANATA, Hiroaki NAKANISHI a), Tetsuo SAWARAGI, and Yukio HORIGUCHI 1. Johansson
More information15群(○○○)-8編
2 群 ( 画像 音 言語 )-5 編 ( 画像符号化 ) 3 章符号化前処理 電子情報通信学会 知識の森 (http://www.ieice-hbkb.org/) ( 執筆者 : 坂東幸浩 )[2009 年 12 月受領 ] 概要 低ビットレート向けの映像符号化では, 符号化処理に先立ち各種の前処理が行われる. この前処理の目的は, 主観画質を損なわない範囲内で, 映像信号を符号化器において符号化しやすい
More information10_08.dvi
476 67 10 2011 pp. 476 481 * 43.72.+q 1. MOS Mean Opinion Score ITU-T P.835 [1] [2] [3] Subjective and objective quality evaluation of noisereduced speech. Takeshi Yamada, Shoji Makino and Nobuhiko Kitawaki
More informationWavelet HSI / [1] JPEG2000 9/7Wavelet [2][6] 2:1 9/7Wavelet Wavelet 80 Wavelet i
17 Wavelet Image Enhancement by Wavelet Transform 1060326 2006 3 10 Wavelet HSI / [1] JPEG2000 9/7Wavelet [2][6] 2:1 9/7Wavelet Wavelet 80 Wavelet i Abstract Image Enhancement by Wavelet Transform Yuichi
More informationAAC技術解説
2009 年 11 月 4 日 MPEG-2 AAC 方式の運用に関する技術解説 AAC 調整連絡会 1. まえがき 2004 年 1 月頃より地上デジタルテレビジョン放送の5.1chサラウンド番組の視聴者から 音声再生不具合のクレームが届くようになった 放送事業者で調査した結果 送出エンコーダの AACパラメータのひとつであるTNS 符号化ツールがONの際に 地上デジタル放送開始以前に設計されたAVアンプを地上デジタル放送用受信機に接続して5.1chサラウンド番組を視聴すると
More information学習内容と日常生活との関連性の研究-第2部-第4章-1
69 V A V + A V A 2A 2 http://www.jba-hp.jp/ http://www.kbn3.com/ http://www.usba.org/ 70 (1) (1996)35 7 pp.28-33 (2) (1994) 71 () 3 1 1 99 8 1 10 1 11.3 2.5 1 100 11.4 30.9 1 72 (1) http://www.stat.go.jp/data/zensho/1999/zuhyou/a906-6.xls
More informationMicrosoft PowerPoint - 6.PID制御.pptx
プロセス制御工学 6.PID 制御 京都大学 加納学 Division of Process Control & Process Systems Engineering Department of Chemical Engineering, Kyoto University manabu@cheme.kyoto-u.ac.jp http://www-pse.cheme.kyoto-u.ac.jp/~kano/
More informationす 局所領域 ωk において 線形変換に用いる係数 (ak 画素の係数 (ak bk ) を算出し 入力画像の信号成分を bk ) は次式のコスト関数 E を最小化するように最適化 有さない画素に対して 式 (2) より画素値を算出する される これにより 低解像度な画像から補間によるアップサ E(
IR E-mail: hf@cs.chubu.ac.jp Abstract IR RGB ( ) IR IR IR RGB RGB PSNR 1 Time-Of- Flight(TOF)[1] Kinect [2] TOF LED TOF [3] [6] [4][5] 2 [6] RGB ( ) Infrared(IR) IR 2 2.1 1 す 局所領域 ωk において 線形変換に用いる係数 (ak
More informationTHE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE {s-kasihr, wakamiya,
THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. 565-0871 1 5 E-mail: {s-kasihr, wakamiya, murata}@ist.osaka-u.ac.jp PC 70% Design, implementation, and evaluation
More information1 0/1, a/b/c/ {0, 1} S = {s 1, s 2,..., s q } S x = X 1 X 2 X 3 X n S (n = 1, 2, 3,...) n n s i P (X n = s i ) X m (m < n) P (X n = s i X n 1 = s j )
(Communication and Network) 1 1 0/1, a/b/c/ {0, 1} S = {s 1, s 2,..., s q } S x = X 1 X 2 X 3 X n S (n = 1, 2, 3,...) n n s i P (X n = s i ) X m (m < n) P (X n = s i X n 1 = s j ) p i = P (X n = s i )
More informationuntitled
N N X=[ ] R IJK R X R ABC A=[a ] R B=[b ] R C=[c ] R ABC X =[ ] R = a b c X X X X X D( ) D(X X )= log + D( ) a a b b c c b c b c a c a c a b a b R X X A a t =a b c a = t a R i i = a =. a I R = a = b =
More informationWISS 2006 2 PowerPoint [3] [16] Mehrabian [10] 7% 93% [10] [19][18] Hindus [7] Lyons [9] [8] [14] TalkMan [4] [5] [6] 3 [19][18] [19] [19] 1 F0 [11] 7
WISS2006 A Presentation Training System using Speech and Image Processing. Web 1 [19] Copyright is held by the author(s). Kazutaka Kurihara and Takeo Igarashi,, Masataka Goto and Jun Ogata and Yosuke Matsusaka,,
More information2.R R R R Pan-Tompkins(PT) [8] R 2 SQRS[9] PT Q R WQRS[10] Quad Level Vector(QLV)[11] QRS R Continuous Wavelet Transform(CWT)[12] Mexican hat 4
G-002 R Database and R-Wave Detecting System for Utilizing ECG Data Takeshi Nagatomo Ikuko Shimizu Takeshi Ikeda Akio Sashima Koichi Kurumatani R R MIT-BIH R 90% 1. R R [1] 2 24 16 Tokyo University of
More information5 Armitage x 1,, x n y i = 10x i + 3 y i = log x i {x i } {y i } 1.2 n i i x ij i j y ij, z ij i j 2 1 y = a x + b ( cm) x ij (i j )
5 Armitage. x,, x n y i = 0x i + 3 y i = log x i x i y i.2 n i i x ij i j y ij, z ij i j 2 y = a x + b 2 2. ( cm) x ij (i j ) (i) x, x 2 σ 2 x,, σ 2 x,2 σ x,, σ x,2 t t x * (ii) (i) m y ij = x ij /00 y
More informationsigmus201007_fujihara.dvi
1 1 1) W-PST W-PST W-PST W-PST Singing voice conversion method by using spectral envelope of singing voice estimated from polyphonic music Hiromasa Fujihara 1 and Masataka Goto 1 This paper describes a
More informationIPSJ SIG Technical Report Vol.2015-MUS-107 No /5/23 HARK-Binaural Raspberry Pi 2 1,a) ( ) HARK 2 HARK-Binaural A/D Raspberry Pi 2 1.
HARK-Binaural Raspberry Pi 2 1,a) 1 1 1 2 3 () HARK 2 HARK-Binaural A/D Raspberry Pi 2 1. [1,2] [2 5] () HARK (Honda Research Institute Japan audition for robots with Kyoto University) *1 GUI ( 1) Python
More information