課題 サンプリング周波数 課題 サンプリング周波数 の解答 () 以下に示す信号のサンプリング周波数値を調べよ. また, その値としている合理的な設定理由を述べよ. オーディオCD:? khz 音声通話 ( 固定電話, 携帯電話 )? khz 様々な音声信号処理でのサンプリング周波数 音声通話 ( 固定電話, 携帯電話 ): 8kHz Skype: 6KHz ( 状況により可変 ) オーディオ CD: 44.KHz DVD オーディオ音声 : 48KHz MP3: 最大 48KHz ( 可変 ) 注 : ビットレートが規定 64kbps~3kbps WAV: ビットレートが規定 4Kbps PC の音声処理 : 44.kHz~9kHz ( 標準 48kHz) ハイレゾオーデイオ : 48k, 96k, 9kHz ( 補足 ) ビットレート (bps) ビットレート ( ビット速度,bi rae) 一秒間にシステムで処理されるデジタル信号のビット数 単位 : [bps] (bi per sec), [ ビット / 秒 ] 例 : CH オーディオ信号を,44.KHz のサンプリング周波数, 6 ビットの量子化数でデジタル化した場合のビットレートは? 44.x 3 xx6 = 536 = 4.kbps 信号処理システムの bps 値の例 MP3: 3kbps( 最大 ), AAC オーディオ :56kbps( 最大 ) Wav: 4kbps ワンセグ動画 :8kbps, 地デジ HD 放送画像 :5Mbps スマホ (LE データ通信 )75-Mbps( 理論値 ),??( 実際 ) 3 4
問題 () 解答 可聴域のテスト ( 正弦波を 44.kHz でサンプリング ) 5Hz 7.5Hz ( ピアノの最低音 ) 5Hz Hz 44Hz( 時報の低い音 ) 88Hz ( 時報の高い音 ) 496Hz( ピアノの最高音 ) 6Hz Hz Hz 3Hz 4Hz 5Hz 5Hz (CD で再生可能な最大周波数 ) 色々な動物の可聴域 ( 立体視の不思議を探る 井上弘著オプトロニクス社より ) 5 演習問題問題 () 解答 音声信号の周波数帯域 ( 可聴域 ) は 個人差や年齢差もあるが 大体 Hz~,Hz (khz) と言われている 従って可聴域の最高周波数が ほぼkHz となるため ナイキスト周波数は khz=4khz である デジタルオーディオ装置開発当初, 当時の VR の映像記録部を流用し, オーディオ信号を録音しようとした. その映像信号のサンプリング周波数が 44.kHz であったため,CD のサンプリング周波数に流用された. (( 社 ) 日本音響学会 HP より hp://www.asj.gr.jp/qanda/answer/3.hml) 6 演習問題問題 () 解答 MPEG- Audio Layer-3( いわゆる MP3) は, 映像データ圧縮方式の MPEG- で利用される音声圧縮方式の一つ 人間が聞き取りくい音声 不可聴帯域を圧縮し, 音質を大きく損なうことなく約 / に圧縮している. CD, MP3 いずれのサンプリング周波数も, 可聴域の最高周波数を再現可能なナイキスト周波数である約 4kHz を超え, サンプリング後のデータ量が不要に増加しないことを考慮し,44.~48kHz が用いられている MP3 のサンプリング周波数は, 周波数特性を犠牲にしても, データ量削減を優先したい場合もあるため, 6K, 3K,.5K, 4KHz なども選択可 7 演習問題問題 () 解答 ハイレゾ音源従来の音楽用 CD のサンプリング周波数 量子化ビット数 (44. キロヘルツ 6 ビット ) を上回る 48kHz または 96kHz 4 ビット以上のデジタル音楽データ.9kHz/4 ビットのデータもあり. スタジオ録音と同じサンプリング周波数仕様 3 年頃から対応商品が市販化 原理的には, 従来音源との違いを人間が識別できないはずであるが, 官能検査では音の良さ, 響き, 心地よさなどの違いが, 一部の被験者では識別可能という結果も得られており, 更なる科学的な解明が待たれている. (hp://app-review.jp/news/4) 8
課題 () 解答 ( つづき ) 人間の声の周波数は, 声帯 声道の効果により定まる. 声帯の振動周期が ピッチ ( 声の高さ ) を与える. 声道の形が ホルマント ( 声の種類 ) を与える. ホルマントは複数個発生し 周波数の低い方から第 ホルマント (F) 第 ホルマント (F) 第 3 ホルマント (F3) で構成される この複数のホルマントによって声の種類 ( 音色 ) が決まる. 母音の第 フォルマント (F) の最高周波数 3.KHz, 子音の最高周波数は 5.~ 7.KHz 程度である. 通信が可能となる音声の下限の最高周波数は 3.5kHz 程度 ( 少なくとも母音が正しく伝わる ) となるため きりのよいナイキスト周波数として 8kHz が選ばれている. 日本語 5 母音のホルマントの位置 ( 沖電気 Web, 声の種類と発生のしくみ hp://www.oki.com/jp/rd/ss/speech.hml より ) 9 日本語音声の波形例 し の波形 ち の波形 子音部母音部子音部母音部 音声認識 ~ 周波数スペクトルで音素を判別 hp://www.geociies.jp/myonsei/index.hml 子音の最高周波数は 5KHz を超えることもあるため, 周波数の特に高い母音 + 子音の組みあわせ音 ( 例えば し や ち の音, 最高 7KHz 程度 ) は電話で正しく伝わらない場合が多い. し の子音部のスペクトル 4Hz ち の子音部のスペクトル 47Hz 問題 () 解答 可聴域のテスト ( 正弦波を 44.kHz でサンプリング ) 5Hz 7.5Hz ( ピアノの最低音 ) 5Hz Hz 44Hz( 時報の低い音 ) 88Hz ( 時報の高い音 ) 496Hz( ピアノの最高音 ) 6Hz Hz Hz 3Hz 4Hz 5Hz 5Hz (CD で再生可能な最大周波数 ) 色々な動物の可聴域 ( 立体視の不思議を探る 井上弘著オプトロニクス社より ) 音声認識 ~ 周波数スペクトルで音素を判別 hp://www.geociies.jp/myonsei/index.hml
演習問題 問題() 解答 演習問題 問題() 解答 音声信号の周波数帯域 可聴域 は 個人差や年齢 差もあるが 大体 Hz,Hz (khz)と言わ れている 従って可聴域の最高周波数が ほぼkHz となるた め ナイキスト周波数は khz=4khz である デジタルオーディオ装置開発当初 当時のVRの映 像記録部を流用し オーディオ信号を録音しようとした その映像信号のサンプリング周波数が44.kHzで あったため CDのサンプリング周波数に流用された () 量集センタ壁面を 6x9程度の解像度で クロ ーズアップ撮影した画像と 駐車場から離れて撮影した 画像とを夫々レポートに記載し なぜ離れて撮影した画 像には縞が現れたのか理由を サンプリング周波数の 観点から簡単に説明せよ ディジタル画像での エリアシング の発生が理由 情報棟 ( 社 日本音響学会HPより hp://www.asj.gr.jp/qanda/answer/3.hml) 量集センタ 3 離れて撮影した画像 4 タイル模様の横 向輝度変化の周期関数近似 壁のタイル 模様 5 mm クローズアップ画像 4 2値 周期関数.5 mm
x ().5 フーリエ級数の計算例 x - - [] 周期 C k k sin k x e d でも x() は 周期 x e e jk e k sink jk e jk jk jk jk d e j d jk k で x 7 タイル模様の複素フーリエ級数展開 ) k のとき C.9 ) k C k のとき sin k k sin.9k k 5mm,.5 mm, Ω mm k.97.93 3.847 4.747 5.68 6.498 7.363 8.3 基本 周波数 Ω の 7 倍程度の 周波数成分もタイル模様に相当含まれる 8 エリアシングが起きる撮影距離の 積 タイル模様幅 L レンズ F 撮像 : タイル模様幅 : 撮像 上模様幅 L : 撮影距離 F : レンズ焦点距離 : 撮像 画素 法 タイル模様幅 の, カメラ撮像 上での投影幅 は, F L となる. スマホカメラの焦点距離 F 3.mm, 模様 幅 5mm であるので, 投影幅 は, 5 mm L, 撮像 上の 画素の 法 は, 撮影画像の横 向解像度 9, 撮像素 法 4.8[mm] より = 4.8 9 =.5 mm よって, 撮像 上の画像のサンプリング周波数 f は, f.5.4 mm, 撮像 上でのタイル模様幅 mmなので 撮像 上の模様の基本周波数は mm, その最 周波数 f は, 先述の C の分析より, 基本周波数の7 倍程度と推察されるので f 7 L 5 mm サンプリング定理より f f の時, エリアシングが発 する. すなわちエリアシングが発 する撮影距離 L は.4 7 L4.3 3 mm 4.3m 以上離れて撮影すると, 画像にエリアシングが発 する可能性が い. 9
3 4