3 章 情報メディアのディジタル符号化
アナログ / デジタルネットワークへのアナログ / デジタル端末収容構成 デジタル端末 アナログ端末 モデム UNI アナログネットワーク UNI モデム デジタル端末 アナログ端末 デジタル端末 ディジタルネットワーク デジタル端末 アナログ端末 コーデック UNI UNI コーデック アナログ端末 UNI: ユーザ - ネットワークインタフェース User-Network Interface モデム :MODEM(Modulation/Demodulation) コーデック :CODEC(Coder/Decoder) 図 3.1
号振幅量子化レベ標本化 量子化 符号化信入力信号 標本化 量子化 量子化レベル標本化周期 時間 時間 (sampling) (quantization) 量子化誤差量子化ひずみ 符号化 00001001 00001010 00001011 00000111 時間 パルス列 時間 図 3.2
ナイキストの定理 4 最高周波数を f Maxとする原信号を標本化したのち 原信号を忠実に再生するためには 最高周波数 fmaxの2 倍以上の周波数で標本化する必要がある 電話音声 300Hz~3.4kHz 6.8kHz で標本化 8kHz で標本化すると 8 ビット 8kHz = 64kbps 8 ビット =256 諧調
モールス符号 ( 英文 ) 表 3.1
μ 則圧縮の入力信号対出力信号 量子化誤差小 小振幅 大振幅 図 3.3
μ 則圧縮の原理 (1) 7 1. 小振幅での量子化誤差小 2. 音声は 小振幅の出現頻度大 3. μ 則 y n(1 x ) sgn( x) (1 x ) 符号 0~1で考えると μが大きいほど上に凸 4. 大振幅に対して量子化ひずみ大小振幅に対して量子化ひずみ小
μ 則圧縮の原理 (2) 8 5. 音声のダイナミックレンジ ( 小振幅のところから大振幅 ) 40dBある B (db ってなに? 10 log 10 db ) A 6. SD 比 ( 信号対ひずみ雑音比 :Distortion) 音声のダイナミックレンジ 40dB = 小信号 SD 比 40dB 劣化 7. μ 則 ( 図 3.4) すべてにわたってSD 比 30dBを確保
μ 則と A 則の入力信号振幅対 S/D 比 A 則はヨーロッパの量子化の方式 図 3.4
各種音声符号化方式 表 3.2 符号化方式伝送速度 (kbps) 携帯電話 VoIP につかわれる 標本サイズ (ms) MOS ITU-T 勧告仕様制定年 PCN 64 0.125 3.1 G.711 1972 ADPCM 32 0.125 2.85 G.726 1990 LD-CELP 15 0.625 2.61 G.728 1992 CS-ACELP 8 10 2.92 G729 1996 MP-MLQ 6.3 30 2.9 G.723.1 1996 ACELP 5.3 30 2.65 G723.1 1996 PCM: Pulse Code Modulation, ADPCM:Adaptive Differential PCM, CELP: Code Excited Linear Prediction, LD-CELP: Low Delay CELP, CS-CELP: Conjugate Structure CELP, VSELP: Vector Sum Excited Linear Prediction, PSI-CELP: Pitch Synchronous Innovation CELP
オーディオ情報符号化方式緒元 表 3.3 高品質音声に使われる 方式 標本化周波数 (khz) 量子化ビット数 信号帯域 (khz) 伝送レート (kbps/ チャネル ) 備考 サブバンド ADPCM 16 4 2 50Hz- 7kHz 64 32 ITU-T G.722 ITU-T G.722.1 384kbps オーディオ符号化 32 11 50Hz-15kHz 384 ITU-T J.41 衛星テレビ音声 32 14 50Hz-15kHz 512 音楽 CD ( コンパクトディスク ) DAT (Digital Audio Tape) 44.1 16 5Hz-20kHz 705.6 48 16 5Hz-20kHz 768
NTSC テレビジョン信号の周波数スペクトラム 図 3.5
ネットワークと符号化の関係 13 風景 符号化 復号化 処理量遅延時間 帯域の節約 廃棄の発生 1 携帯電話 帯域の圧縮へのチャレンジ 2 地デジの問題 リアルタイム性の欠じょ 3 遠隔医療 完全リアルタイム性
MPEG 符号化方式のブロック構成 図 3.6
AD PCM の原理 15 音声って連続して変化している 24 差分の符号化 PCM=78 54
MPEG 方式 16 MPEG-1 動画と音声を合わせて 1.5Mbps のデータ VHS なみの品質 MPEG-2 DVD ディジタル BS CS など
画素数とは ( 解像度 ) 17
18
19
各種動画像符号化方式の特徴 表 3.5 方式 PCM ADPCM MPEG1 MPEG2 MPEG4 H.264 符号化方式 線形量子化 PCM 適応差分符号化方式フレーム内予測 離散コサイン変換 (DCT) フレーム内予測フレーム間予測 離散コサイン変換 (DCT) フレーム内予測フレーム間予測 離散コサイン変換 (DCT) フレーム内予測フレーム間予測 離散コサイン変換 (DCT) フレーム内予測フレーム間予測 動き保証なしなしありありありあり 特徴 最も単純 もっとも単純な高能率符号化圧縮率小 1.5Mbps までの動画を対象 従来テレビ並みから HDTV クラスの画像に対応 MPEG2 よりも高圧縮 MPEG4 の 2 倍以上の圧縮率 用途 参考 NTSC テレビ信号相当の画像符号化ビットレート 放送通信 100Mbps( 複合信号 ) 通信 蓄積系メディア (CD 等 ) 蓄積系 (DVD) 放送系通信系 蓄積系 放送系 通信系 インターネット 蓄積系 放送系 (TV HDTV) 通信系 インターネット 移動体通信 30-50Mbps 適用外 6-8Mbps 適用外 -1Mbps
JPEG の基本構成 色分解 + ブロック分割 R G DCT B RGB-YCC 変換 量子化 ジグザグスキャン ハフマン符号化 圧縮データ ( オプション ) ブロック合成 + 色合成 逆 DCT 逆量子化 2 次元化 ハフマン復号化 圧縮データ 図 3.7
離散コサイン変換 (DCT) の解釈 22
DCT における各要素のイメージ 23 低周波低周波高周波高周波
ジグザグスキャンの原理 24 矢印の順番でデータを読む データを羅列すると 331210110000000 後ろのほうに高周波成分が集まり 連続して 0 が発生しやすくなる 符号化で圧縮率がよくなる
ハフマン符号化 25 出現頻度と割り当てられた符号
MPEG 符号の工夫 26 動画像 (30,60 フレーム / 秒の静止画列 ) I ピクチャ (Intra-code Picture) オリジナルの画像フレームに離散コサイン変換 (DCT: discrete cosine transform) したもので 符号量は削減されているが 全画面情報をもつ P ピクチャ (Predicted Picture) 前フレームの I もしくは P ピクチャからの予想差分画像 I ピクチャより情報量小 B ピクチャ (Bi-directionary Predicted Picture) 前フレームと後続フレームから得られる予想差分画像である
MPEG の特徴 27 I ピクチャ = もとの画像を再現できる P/B ピクチャ = 差分 混雑 I ピクチャをできるだけ届ける P/B ピクチャを廃棄する
優先制御と廃棄 28 P=0 P=0 のみ廃棄 P=1 同じ方路 しきい値 Queue P=1 P=0,1 ( 書き込みを行なうバッファ ) 待つ
MPEG2 プロファイルとレベル Simple Main SNR Scalable Spatially Scalable High - 80Mbps High H:1920 V:1152 T:60 プロファイルレベル High-1440 H:1440 V:1152 T:60 Main H:720 V:576 T:30 Low H:352 V:288 T:30 - - - - - - - - 60Mbps 15Mbps 4Mbps 15Mbps 10Mbps 4Mbps 3Mbps 20Mbps 15Mbps 4Mbps 100Mbps 80Mbps 25Mbps 80Mbps 60Mbps 20Mbps 60Mbps 40Mbps 15Mbps 15Mbps 表 3.4