DVIOUT

Similar documents
DVIOUT

Microsoft PowerPoint - 課題1解答.pptx

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

(Taro-\202w\202x\202r\202k\202h\202c\202d\212T\227v.jtd)

参考書 (1) 中村, 山本, 吉田 : ウェーブレットによる信号処理と画像処理, 共立出版 応用の紹介とプログラムリストが中心, 理論的背景はほとんどなし 意味不明の比喩を多用 各時代 各国別に美女を探すのが窓フーリエ変換である 応用テーマ : 不連続信号検出, 相関の検出, ノイズ除去, 画像デ

PowerPoint Presentation

DVIOUT

Microsoft PowerPoint - dm1_6.pptx

AUX (MP313D-W のみ ) 交通情報 OFF AUX 端子に接続した外部オーディオ機器などを使いたいときに選びます ( U-1) 幹線道路などで放送されている交通情報を受信したいときに選びます ( L-4) 選択中の AVソースを OFF にしたいときに選びます AV ソース画面を表示する

DVIOUT

1/2

Microsoft PowerPoint - dm1_5.pptx

Microsoft PowerPoint - DigitalMedia2_3b.pptx

Microsoft Word - WindowsVista活用

WMCD/MP3/AJ 1 J CD / MP3 / WMAを聞く 各部の名称とはたらき J 2 タッチパネル部について J 2 表示部 ( 再生画面 ) について J 3 好きなフォルダを選ぶ (MP3 / WMA モードの場合 ) J 4 好きなトラックを選ぶ (CD/MP3 / WMA モード

WAVE 形式のファイルにも出力できる 3 つの波形を同時に発生可能 正弦波, 三角波, 白色雑音などを選択 16bit なので値の範囲は ~ ここに表示されるのはデジタル信号サウンドカードから出力されるのはアナログ信号 Fig.1 WaveGene の操作パネル wav フ

画像処理工学

SAP11_03

1.Sound Engine Free の起動と 設定 Sound EngineFree を起動すると右下の画面が開きます Sound Engine Free のアイコン 起動時更新のチェック のチェックを外す 通常 録音はインターネットに接続されていない環境でおこないます そのような環境で Sou

1 SmartArt の機能を使って, 要点を図形にまとめましょう Power Point2007 から, SmartArt という機能が追加されました これは, 図形を使って, 内容の要点 ( キーワード ) などを, 美しく, わかりやすく提示するための機能です この機能を使うときは, 内容に合

第 6 部情報の仕組み [FAX] FAX は 取り込んだ画像の1 点 1 点を白と黒の二つの状態で認識する 黒を1 白を 0 として置き換える FAX では1インチ 2 あたり 200 個の白 / 黒を判定している 3 だから 1インチ 1インチの画像には =40000 pixel

スライド 1

Microsoft PowerPoint - ip02_01.ppt [互換モード]

スペクトルの用語 1 スペクトル図表は フーリエ変換の終着駅です スペクトル 正確には パワースペクトル ですね この図表は 非常に重要な情報を提供してくれます この内容をきちんと解明しなければいけません まず 用語を検討してみましょう 用語では パワー と スペクトル に分けましょう 次に その意

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

2007年度版

D/MP3/I / MP3/WMA 各部の名称とはたらき I 2 タッチパネル部について I 2 表示部 ( 再生画面 ) について I 3 CD / MP3 / WMA を使う I 4 好きなフォルダを選ぶ I 4 トラックリストより好きなトラックを選び 再生させる I 5 MP3 / WMA に

<4D F736F F F696E74202D C092425F D8A7789EF89C88A778BB38EBA816A8C6791D CC82B582AD82DD2E >

PCA-ACUP の操作手順例 はじめに 本手順は PCA-ACUP を使用して再生機器からパソコンにサウンドを取り込み MP3 ファイル形式で分割保存するまでの操作手順の例を記載しております DigiOnSound5 L.E. のその他機能に関しましては まず DigiOnSound5 L.E.

NGate_mac.book

データ解析

Microsoft Word - Google アンケートを作ってみよう.docx

DVIOUT-SS_Ma

Microsoft PowerPoint - 第06章振幅変調.pptx

スペクトルに対応する英語はスペクトラム(spectrum)です

初めてのプログラミング

Microsoft PowerPoint - 画像工学2007-5印刷用


02InDesign_img.indd

インターリーブADCでのタイミングスキュー影響のデジタル補正技術

Microsoft PowerPoint - 画像工学 印刷用

Microsoft PowerPoint - 第3回2.ppt

リンクされたイメージを表示できません ファイルが移動または削除されたか 名前が変更された可能性があります リンクに正しいファイル名と場所が指定されていることを確認してください 9 2

画像類似度測定の初歩的な手法の検証

3 数値解の特性 3.1 CFL 条件 を 前の章では 波動方程式 f x= x0 = f x= x0 t f c x f =0 [1] c f 0 x= x 0 x 0 f x= x0 x 2 x 2 t [2] のように差分化して数値解を求めた ここでは このようにして得られた数値解の性質を 考

ic3_lo_p29-58_0109.indd

Microsoft Word 年度卒業研究論文_Multi Media Player制作_.docx

グラフ作成手順書

電子ブック 基本制作説明書

(Microsoft Word - 10ta320a_\220U\223\256\212w\223\301\230__6\217\315\221O\224\274\203\214\203W\203\201.docx)

計測コラム emm182号用

ドライバーのインストール <Windows の場合 > 1. 製品に付属しているインストール ソフトウェア CDをPCに挿入し CDドライブの中身を表示して LUXMAN_Audio Driver フォルダーをダブルクリックして開きます ラックスマンWebサイトにて公開しているドライバーを使用する場

Microsoft PowerPoint - network3

PowerPoint プレゼンテーション

RLC 共振回路 概要 RLC 回路は, ラジオや通信工学, 発信器などに広く使われる. この回路の目的は, 特定の周波数のときに大きな電流を得ることである. 使い方には, 周波数を設定し外へ発する, 外部からの周波数に合わせて同調する, がある. このように, 周波数を扱うことから, 交流を考える

不偏推定量

Microsoft PowerPoint - spe1_handout10.ppt

UVS12 training text 10

2.WMP で音楽の取り込みと書き込みの設定 (1) 取り込みの設定 1 メニューバー ツール オプションを開く 2 オプション画面が開いたら 音楽の取り込みタブをクリックする 3 取り込みの形式を MP3 を設定する 4 取り込み後に CDを取り出すにチェックを入れる 5 OK ボタンをクリックす

このうち ツールバーが表示されていないときは メニューバーから [ 表示 (V)] [ ツールバー (T)] の [ 標準のボタン (S)] [ アドレスバー (A)] と [ ツールバーを固定する (B)] をクリックしてチェックを付けておくとよい また ツールバーはユーザ ( 利用者 ) が変更

2009 年 11 月 16 日版 ( 久家 ) 遠地 P 波の変位波形の作成 遠地 P 波の変位波形 ( 変位の時間関数 ) は 波線理論をもとに P U () t = S()* t E()* t P() t で近似的に計算できる * は畳み込み積分 (convolution) を表す ( 付録

スライド 1

untitled

Microsoft PowerPoint - multi_media05-dct_jpeg [互換モード]

目次 1. 動画再生の機能 3 2. 動画を再生するスライドの作成 7 3. まとめ 課題にチャレンジ 19 レッスン内容 ムービーの中で動画を再生するスライドの作成 多くのデジタルカメラには動画撮影機能が搭載されています PowerPoint にはデジタルカメラで撮影した動画をスライド

<4D F736F F D20837E836A837D E82CC88D98FED E12E646F63>

FLIRTools+デモ手順書

1 2

Microsoft PowerPoint - 講義10改.pptx

YEFM286147_HW830D.pdf

:30 18:00 9:30 12:00 13:00 17:00

Microsoft PowerPoint - BCCInstallation.ppt [互換モード]

Taro-⑪JS5シンガーソングライタ

ROBO-TVR ビューア付属ソフト PMP.exe 操作ガイド ( ビューアソフト付属ソフト ) 株式会社ディーグラット 2017 年 1 月 ( 第 版 )

目次 1. デジタル押し花の作り方 3 2. デジタル押し花をきれいに仕上げる方法 まとめ 課題にチャレンジ 19 レッスン内容 デジタル押し花 マイクロソフト社のワープロソフト Word 2010( これ以降 Word と記述します ) の図ツールに搭載されている [ 背景

IT

2. フォトムービーの作成方法基本 (1) ムービーメーカーの起動 スタート画面で Movie Maker を起動します (2) 写真 ( フォト 画像 または動画 ) ファイルの読み込みフォトムービーの素材となる写真等のファイルを初めて読み込む場合は 1 図の1( ホームリボンのビ 2 デオおよび

複素数平面への誘い

PDF_ _„o“χƄo›c45−ª2“ƒ_Œ{Ł¶PDF.pdf

bit : データの最小単位 1bit = 最小状態の単位 二進一桁 = 配線一本 Byte バイト 8bits 0-255まで アルファベットは 1 バイト 256 文字以下 漢字は 普通は 2 バイト 文字以下 2

Microsoft Word - SPARQアプリケーションノートGating_3.docx

4 3. (a) 2 (b) 1 2 xy xz- x , 4 R1 R2 R1 R xz- 2(a) 2(b) B 1 B 2 B 1 B 2 2

AudioGate 4 取扱説明書

Microsoft Word - P doc

画面表示とタッチキーについて 画面表示とタッチキーについて 再生する (P.205) からの操作説明では 主にCDの画面を使って説明しています ソースによって表示内容が異なる画面もありますが 特に記載のない限り 操作方法は同じです CDの画面は オーディオ画面を例に説明しております ナビ画面での操作

この取扱説明書について USB DAC 端子に USB ケーブルでコンピューターを接続すると コンピューターからの音声信号を再生できます この機能を使って PCM を再生する場合 ドライバーソフトウェアをコンピューターにインストールする必要はありません ただし この機能を使って DSD 音源をネイテ

3) 課題 課題 1.1 基本課題 WaveGene で音響信号の測定に使用する様々な信号を発生してみよう また, ヘッドフォンをパソコンの出力端子につないで聴いてみよう ( ただし, 音量に注意! サウンドカードやヘッドフォンの効率は周波数によって異なる ある周波数では平気でも, 他の周波数では大

パソコンの中を見よう

β版 DSD再生設定

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

10. セル範囲に名前を定義します シート : 利用者リスト 1. セル A2:A5 を選択する 2. 名前ボックスに 利用者と入力 3. 続いて B2~B5 を選択 名前ボックスに続柄と入力 名前ボックスを記入するため 余分に選択するとどこまでしたか忘れますので最後のセルに下線を引いておくと解りや

資料 ISDB-T SB 信号から FM 受信機への干渉実験結果 1 実験の目的および方法 実験の目的 90~108MHz 帯のISDB-T SB 信号からFM 放送波への影響について干渉実験を行う 実験方法 FM 放送波を 89.9MHz に ISDB-T SB 信号を 90~10

工業数学F2-04(ウェブ用).pptx

YEFM indb

PowerPoint プレゼンテーション

IP 電話の品質に関するアンケート及び MOS 評価実験について 総務省総合通信基盤局 電気通信技術システム課

FORTRAN( と C) によるプログラミング 5 ファイル入出力 ここではファイルからデータを読みこんだり ファイルにデータを書き出したりするプログラムを作成してみます はじめに テキスト形式で書かれたデータファイルに書かれているデータを読みこんで配列に代入し 標準出力に書き出すプログラムを作り

SmallTown 日付オブジェクト 日付オブジェクトを使ってページ内にいろいろな仕掛けをつくってみよう 1. 日付オブジェクトとは JavaScriptではいろいろなオブジェクトを扱えますが 日付オブジェクトもその一つです 手順としては 1 日付オブジェクトを作成する2そのオブジェクトから日にちや

目次 1. フラッシュ型スライド教材を作ってみよう 2 2. 文字が順に消えていくスライド教材を作ってみよう 5 3. 文字が順に現れるスライド教材を作ってみよう 8 4. 音声とともに文字の色が変わるスライド教材を作ってみよう スライド教材を種類別にまとめてみよう 14 * 実践事例集

Transcription:

5.3 音声を加工してみよう! 5.3. 音声を加工してみよう! 129 この節では 図 5.11 の音声 あ の離散化された波 (x n ) のグラフおよび図 5.12 の音声 あ の離散フーリエ変換 ( 周波数スペクトル密度 ) の絶対値 ( X k ) のグラフを基準に 離散フーリエ変換および離散フーリエ積分を使って この離散化された波の検証や加工を行なってみましよう 6 図 5.11: 音声 あ の離散化された波 (x n ) 図 5.12: 音声 あ の離散フーリエ変換の絶対値 ( X k ) 6 音声 あ はホームページにリンクされています ( ファイル名 : a.wav) なお これらの音声は筆者のものですが 自分の音声で検証や加工を行なうと楽しさが倍増することでしょう

130 第 5 章音声を加工してみよう! 図 5.11 および図 5.12 のグラフについて 次の点に注意してください 音声 あ は 観測区間を [0, 1] (T 0 =1[ 秒 ]) とし 1 秒間に 8000 回のサンプリングを行なった離散化された波である 周波数分解能 f は f = 1/T 0 = 1 [Hz] となり 離散フーリエ変換によって周波数 3999 [Hz] から 4000 [Hz] の周波数スペクトルに変換される ( 常に 正の周波数と負の周波数を考慮する ) Mathematica のプログラムでは 配列の添え字が 1 ずれていることに注意する 5.3.1 音の主成分 図 5.12 の離散フーリエ変換 ( 周波数スペクトル密度 ) のグラフをみてみると いくつかの周波数スペクトルの山が現れていることがわかります この 1 つ 1 つの山がどのような音であるか調べてみることにしましょう なお 図 5.12 の周波数スペクトルの山の詳細を知るために 図 5.13 の 0[Hz] から 1500 [Hz] までの周波数スペクトルを拡大した周波数スペクトル密度のグラフをあげておきます 図 5.13: 図 5.12 の 0[Hz] から 1500 [Hz] までの周波数スペクトルを拡大したグラフ まず 周波数スペクトルの絶対値の最大値を含む山について調べてみましょう Mathematica で計算すると 797 [Hz] で最大値をとることがわかります 7 図 5.14 のように この周波数スペクトルの絶対値の最大値を含む山 (630~850 [Hz]) を切り取り 8 離散フーリエ積分してこの山の音を聞いてみましょう いかがでしょうか 高音ですが あ と聞こえるはずです すなわち この山 (630~850 [Hz] の周波数スペクトル ) が 音声 あ を構成する周波数スペクトルとなっていることがわかります 7 男性の声の主成分が 1000 [Hz] であることを考えると 筆者の声は平均より低い声であることがわかります 8 正の周波数に対応する負の周波数を切り取ることも忘れないでください

5.3. 音声を加工してみよう! 131 図 5.14: 周波数スペクトル 630~850 [Hz] を切り取った山 同様に 周波数スペクトルの絶対値の最大値を含む山の左隣の山 ( 図 5.15 参照 ) さらに左隣の山 ( 図 5.16 参照 ) を切り取って聞いてみましょう 図 5.15: 周波数スペクトル 450~620 [Hz] を切り取った山 図 5.16: 周波数スペクトル 300~450 [Hz] を切り取った山

132 第 5 章音声を加工してみよう! 最後の 図 5.16 の音を聞いてみると 本来 あ という音声だったはずですが い とも う とも聞こえるような気がします そこで 音声 い う え お を離散フーリエ変換して比較してみることにしましょう 音声 あ い う え お を離散フーリエ変換すると図 5.17 のようになります (0~1000 [Hz] を抜粋 ) いずれのグラフでも 山の現れる周波数が一定であることがよみとれます これは 個人の声の音色というべきもので 各個人で異なります 私たちが暮らす実社会でも このような事実を応用して 音声解析や音声認識にフーリエ変換が活用されています 音声 あ 音声 い 音声 う 音声 え 音声 お 図 5.17: 音声の比較

5.3. 音声を加工してみよう! 133 5.3.2 ノイズ除去図 5.11 の無音部分を注意深く見てみると図 5.18 のような規則的な波が現れていることがわかります このような 本来必要としない邪魔なものを ノイズ (noise; 雑音 ) と呼びます 9 フーリエ変換を利用すると このノイズを除去することができるので ノイズを除去してみましょう 10 図 5.18: 無音部分の規則的な波 ( ノイズ ) まず このノイズがどのような波であるかを調べるために 観測区間 [0, 0.25] (T 0 =0.25 [ 秒 ], f =1/T 0 =1/0.25 = 4 [Hz]) に対して離散フーリエ変換を計算します 図 5.19 のような離散フーリエ変換の絶対値のグラフが得られ Mathematica の計算結果から 60 [Hz] の周波数スペクトルだけが大きな値を示していることがわかります すなわち このノイズが 60 [Hz] の波であることがわかります ( 図 5.18 の波の個数を数えても確認できます ) 図 5.19: 無音部分の規則的な波の離散フーリエ変換の絶対値 (0~200 [Hz] を抜粋 ) *1 目盛あたり 4[Hz] であることに注意しましょう 9 この波の周波数が 60 [Hz] であることから 何らかのタイミングを取るため または 何らかのタイミングを取った際に観測機器から混入したノイズであると推測されます 普通 自然界からこのような規則的な波をノイズとして観測することは珍しいことです 10 ノイズは有音部分にも含まれているので 単に 無音部分の値を 0 にするだけでは不十分です

134 第 5 章音声を加工してみよう! 前記の検証から 図 5.20 のように 音声 あ の離散化された波を離散フーリエ変換した周波数スペクトルの内 60 [Hz] の周波数スペクトルを 0 に書き換えます ( 負の周波数も 0 にすることを忘れないでください ) 書き換えた周波数スペクトルを離散フーリエ積分すると 図 5.21 のような ノイズの除去された音声 あ の離散化された波が得られます 11 図 5.20: 60 [Hz] の周波数スペクトルを 0 に書き換え (50~70 [Hz] を抜粋 ) * 添え字が 1 ずれていることに注意しましょう 図 5.21: ノイズの除去された音声 あ の離散化された波 11 音声として聞く分にはノイズを除去しなくても体感的には変わりませんが 厳密な観測結果が必要な場合には必ずノイズを除去する必要があります ノイズが含まれたまま扱うと 計算結果に大きな誤差を生じたり 論理式に数値を代入したときに論理式を満たさないといったことが生じます

5.3. 音声を加工してみよう! 135 これから紹介することは ノイズ除去とは少々異なりますが ノイズ除去を応用したものです まず 音声 あ の離散化された波を離散フーリエ変換し 図 5.22 のように 周波数スペクトルの 1500 [Hz] から 4000 [Hz] までを 0 にします さらに これを離散フーリエ積分すると図 5.23 のような離散化された波を得ます このとき 元の音声 あ の離散化された波のグラフと見た目も変わらず 実際に音を聞いてもあまり変わらないことを確認できます 図 5.22: 1500 [Hz] から 4000 [Hz] までの周波数スペクトルを 0 に書き換え 図 5.23: 図 5.22 を離散フーリエ積分して得られた離散化された波

136 第 5 章音声を加工してみよう! このように 周波数領域において ある程度の周波数スペクトルを削っても同じような音として聞き取ることができます ( 人間の耳をごまかすことができます ) さらに 周波数領域の形で音声を保存すれば データ量を 1500 4000 =0.3875 すなわち 約 4 割に抑えることができ データ量を約 6 割減らすことができます ( 負の周波数が正の周波数の共役であることを利用すれば さらにデータ量を半分にすることができます ) もちろん 音声として再生する際は 0 を補って 離散フーリエ積分を施します 私たちが暮らす実社会でも このような事実を応用して JPEG に代表される画像圧縮 MP3 に代表される音声圧縮 MPEG に代表される動画像 音声圧縮などに利用されています これらは データの正確さよりデータ量の少なさを重視した考え方によるものです 悪い言い方をすれば 人間の目や耳をどこまでごまかせるかという観点からデータ圧縮を行なっています JPEG: ジェーペグ と読む Joint Photographic coding Experts Group の略称で 静止画像などを圧縮 伸長させる機能を実現する規格 インターネット上の画像データ ( 特に写真 ) によく使われる形式 MP3: エムピースリー と読む MPeg audio layer 3 の略で 音声データのデジタル圧縮技術 ( 名前の通り MPEG の仲間 ) オーディオ 音楽専用に使われる形式 MPEG: エムペグ と読む Moving Picture coding Experts Group の略称で リアルタイム ( 実時間 ) で動画像と音声を圧縮 伸長させる機能を実現する規格 DVD VIDEO CD デジタルテレビ放送などで使われている形式 5.3.3 ボイスチェンジャー 最後に 離散フーリエ変換を使って 男性の声を女性の声に または 女性の声を男性の声に変換してみましょう いわゆる ボイスチェンジャーを作ってみましょう 男性の声の主成分が 1000 [Hz] 女性の声の主成分が 2000 [Hz] であることを考慮すれば 周波数領域において 男性の声から女性の声への変換は周波数スペクトルを +1000 [Hz] 平行移動し 女性の声から男性の声への変換は周波数スペクトルを 1000 [Hz] 平行移動すればよいことがわかります

5.3. 音声を加工してみよう! 137 例えば 図 5.24 のように 音声 あ ( 男性の声 ) の離散化された波の離散フーリエ変換を加工 (+1000 [Hz] 平行移動 ) し 離散フーリエ積分すれば 女性のような高い音の音声を聞くことができます +1000 [Hz] 図 5.24: 男性の声から女性の声へ 逆に 図 5.25 のように 音声 あ ( 男性の声 ) の離散化された波の離散フーリエ変換を加工 ( 500 [Hz] 平行移動 ) し 離散フーリエ積分すれば 元の声よりさらに低い音の音声を聞くことができます なお 女性の声で実験すれば男性のような低い音の声を聞くことができることでしょう 500 [Hz] 図 5.25: 男性の声をより低く ( 女性の声から男性の声へ )

138 第 5 章音声を加工してみよう! 如何だったでしょうか 本テキストを通して 数学を身近に感じていただければ幸いに思います