Microsoft PowerPoint - multi_media05-dct_jpeg [互換モード]

Similar documents
Microsoft PowerPoint - multi_media05-dct_jpeg [互換モード]

untitled

画像処理工学

Microsoft PowerPoint - ip02_01.ppt [互換モード]

Microsoft PowerPoint - 画像工学 印刷用

Microsoft PowerPoint - CSA_B3_EX2.pptx

Microsoft PowerPoint - DigitalMedia2_3b.pptx

Microsoft PowerPoint - 物情数学C(2012)(フーリエ前半)_up

Microsoft PowerPoint - dm1_5.pptx

PowerPoint Presentation

Microsoft PowerPoint - dm1_6.pptx

Microsoft PowerPoint - 第3回2.ppt

SAP11_03

DVIOUT

Information Theory

Microsoft PowerPoint - Lec14 [互換モード]

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Microsoft PowerPoint - comprog11.pptx

Microsoft PowerPoint network3.pptx

<4D F736F F F696E74202D2091E6824F82518FCD E838B C68CEB82E894AD90B B2E >

Microsoft PowerPoint - network3

参考書 (1) 中村, 山本, 吉田 : ウェーブレットによる信号処理と画像処理, 共立出版 応用の紹介とプログラムリストが中心, 理論的背景はほとんどなし 意味不明の比喩を多用 各時代 各国別に美女を探すのが窓フーリエ変換である 応用テーマ : 不連続信号検出, 相関の検出, ノイズ除去, 画像デ

横浜市環境科学研究所

パソコンシミュレータの現状

工業数学F2-04(ウェブ用).pptx

Microsoft PowerPoint - Lec15 [互換モード]

Microsoft PowerPoint - 計測工学第7回.pptx

画像類似度測定の初歩的な手法の検証

Microsoft Word - NumericalComputation.docx

スライド 1

untitled

DVIOUT

スライド 1

Microsoft PowerPoint - H21生物計算化学2.ppt

Microsoft Word - 卒業論文.doc

Microsoft Word - 簡単な計算と作図.doc

2009 年 11 月 16 日版 ( 久家 ) 遠地 P 波の変位波形の作成 遠地 P 波の変位波形 ( 変位の時間関数 ) は 波線理論をもとに P U () t = S()* t E()* t P() t で近似的に計算できる * は畳み込み積分 (convolution) を表す ( 付録

多次元レーザー分光で探る凝縮分子系の超高速動力学

構造力学Ⅰ第12回

Microsoft PowerPoint - pr_12_template-bs.pptx

RLC 共振回路 概要 RLC 回路は, ラジオや通信工学, 発信器などに広く使われる. この回路の目的は, 特定の周波数のときに大きな電流を得ることである. 使い方には, 周波数を設定し外へ発する, 外部からの周波数に合わせて同調する, がある. このように, 周波数を扱うことから, 交流を考える

FEM原理講座 (サンプルテキスト)

混沌系工学特論 #5

Microsoft PowerPoint - H22制御工学I-2回.ppt

Microsoft PowerPoint - Lec15 [互換モード]

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

線形システム応答 Linear System response

Microsoft PowerPoint - 複素数.pptx

画像解析論(2) 講義内容

数学 t t t t t 加法定理 t t t 倍角公式加法定理で α=β と置く. 三角関数

第 4 週コンボリューションその 2, 正弦波による分解 教科書 p. 16~ 目標コンボリューションの演習. 正弦波による信号の分解の考え方の理解. 正弦波の複素表現を学ぶ. 演習問題 問 1. 以下の図にならって,1 と 2 の δ 関数を図示せよ δ (t) 2

DVIOUT

今後の予定 6/29 パターン形成第 11 回 7/6 データ解析第 12 回 7/13 群れ行動 ( 久保先生 ) 第 13 回 7/17 ( 金 ) 休講 7/20 まとめ第 14 回 7/27 休講?

Microsoft PowerPoint - qcomp.ppt [互換モード]

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

Microsoft PowerPoint - H22制御工学I-10回.ppt

相関係数と偏差ベクトル

ハートレー近似(Hartree aproximation)

Microsoft PowerPoint - 配布資料・演習18.pptx

Microsoft PowerPoint - aep_1.ppt [互換モード]

PowerPoint プレゼンテーション

スライド 1

1999年度 センター試験・数学ⅡB

Microsoft PowerPoint - 10.pptx

DVIOUT

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

2015-2017年度 2次数学セレクション(複素数)解答解説

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - ce07-13b.ppt

238 愛知工業大学研究報告, 第 47 号, 平成 24 年,Vol.47,Mar,2012 DCT は画素値ブロック単位で行う 図 2.1 に DCT にお ける画像領域 ( 画素値領域 ) と周波数領域 (DCT 係数領 域 ) の対応を示す M N の画素値に対して DCT を行う と M

複素数平面への誘い

航空機の運動方程式

1. 線形シフト不変システムと z 変換 ここで言う システム とは? 入力数列 T[ ] 出力数列 一意変換 ( 演算子 ) 概念的には,, x 2, x 1, x 0, x 1, x 2, を入力すると, y 2, y 1, y 0, y 1, y 2, が出力される. 線形システム : 線形シ

Microsoft PowerPoint - 画像工学2007-5印刷用

Microsoft PowerPoint - ca ppt [互換モード]

Microsoft PowerPoint - パワエレH20第4回.ppt

2016年度 京都大・文系数学

untitled

ディジタル信号処理

Microsoft PowerPoint - 基礎・経済統計6.ppt

PowerPoint Presentation

ଗȨɍɫȮĘർǻ 図 : a)3 次元自由粒子の波数空間におけるエネルギー固有値の分布の様子 b) マクロなサイズの系 L ) における W E) と ΩE) の対応 として与えられる 周期境界条件を満たす波数 kn は kn = πn, L n = 0, ±, ±, 7) となる 長さ L の有限

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

PowerPoint プレゼンテーション

<4D F736F F F696E74202D2091E6824F82538FCD8CEB82E88C9F8F6F814592F990B382CC8CB4979D82BB82CC82505F D E95848D8682CC90B69

Microsoft Word - 卒論レジュメ_最終_.doc

(Microsoft Word - PLL\203f\203\202\216\221\227\277-2-\203T\203\223\203v\203\213.doc)

スライド タイトルなし

情報システム 第9回講義資料

基底関数ネットワーク

アルゴリズムとデータ構造

Microsoft PowerPoint - mp11-02.pptx

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

memo

経済数学演習問題 2018 年 5 月 29 日 I a, b, c R n に対して a + b + c 2 = a 2 + b 2 + c 2 + 2( a, b) + 2( b, c) + 2( a, c) が成立することを示しましょう.( 線型代数学 教科書 13 ページ 演習 1.17)

Microsoft PowerPoint - 4.pptx

第6章 実験モード解析

3 数値解の特性 3.1 CFL 条件 を 前の章では 波動方程式 f x= x0 = f x= x0 t f c x f =0 [1] c f 0 x= x 0 x 0 f x= x0 x 2 x 2 t [2] のように差分化して数値解を求めた ここでは このようにして得られた数値解の性質を 考

Microsoft PowerPoint - 第06章振幅変調.pptx

Transcription:

マルチメディア工学マルチメディアデータの解析データ圧縮 : 離散コサイン変換と JPEG 佐藤嘉伸 マルチメディア工学 : 講義計画 マルチメディアデータの解析 基礎数理 代表的解析手法 データ圧縮 : 離散コサイン変換 JPEG データ表現 : 形状の主成分分析 奈良先端科学技術大学院大学情報科学研究科生体医用画像研究室 yoshi@is.naist.jp http://icb lab.naist.jp/members/yoshi/ 講義ホームページ : 日本語ページ 授業の資料 マルチメディア工学 マルチメディアデータの解析 基礎数理 最小二乗法 直交変換 直交関数展開 代表的解析手法 データ圧縮 : 離散コサイン変換 JPEG データ表現 : 形状の主成分分析 ( データ認識 : 隠れマルコフモデル ) 音声 言語を含む時系列データに対して有効 ( 音声の独立成分分析 ) データ圧縮 :JPEG JPEG 圧縮の原理 離散コサイン変換 (DCT) アダマール変換 8 8 離散コサイン変換 離散フーリエ変換との比較 JPEG 方式 概要 画像分割 離散コサイン変換 量子化 エントロピー符号化 量子化 エントロピー符号化 ( ハフマン符号化 ) e x 直交変換 : 正規直交基底 x e' x e' e =Tx x=t T x = T 離散コサイン変換 e, e ( 恒等変換 ) - e, e' ' -

このイメージは 現在表示できません 直交変換 : 正規直交基底の例 次元ベクトル 4 次元ベクトル e k e' e k k e' k k k k 3 k 3 - ( 恒等変換 ) ( アダマール変換 ) アダマール変換の直交基底 e k,k e' k,k ( 恒等変換 ) k 3 k k 3 マトリックス e k,k k ( 恒等変換 ) e'k,k k k = = = = 3 (4 4 マトリックス = 6 次元ベクトル ) 4 - e 離散コサイン変換の直交基底 (DCT: Discrete Cosine Transform) cos i N k k cos i N (8 8 マトリックス = 64 次元ベクトル ) ' k, (, ) k i i k k k 直交条件 N N i i e' k, k ( i, i ) e' ( i (for ( k, k ) ( k', k' ) ) N for k N for k k', k' e' k,k k 3 4 5 6 7 k i N = 8 i 3 i 4, i) 5 6 7 低周波高周波低周波高周波i i i 離散コサイン変換と離散フーリエ変換の比較 離散コサイン変換が用いられる理由 離散コサイン変換の目的 画像を 空間領域 ( 直交基底 e k,k の係数 ) から周波数領域 ( 直交基底 e k,k の係数 ) に変換して 情報源のエントロピーを小さくする ( 直交基底 e k,k が三角関数系のとき 変換後の空間は周波数領域と呼ばれる ) 空間領域の画像では どの画素値も同じビット数で表現される これは どの画素においても とりうる画素値の確率分布が同じと仮定しなければならないからである エントロピーが大きい 周波数領域の画像では 一部の画素 ( 低周波成分 ) を除いて とりうる画素値の確率分布幅を大幅に小さくできる エントロピーを小さくできる 空間領域 周波数領域 周波数領域では 真中あたり ( 低周波成分 ) を除いて に近い値のみをとる確率が極めて高くなる エントロピーが小さくなる 離散コサイン変換の目的 情報源符号化の際 平均符号長は 情報源のエントロピーより小さくすることはできない すなわち エントロピーを小さくすれば 圧縮効果は高まる よって エントロピーの低減はキーポイントである 離散コサイン変換も 離散フーリエ変換も 画像を空間領域から周波数領域に変換するという点では同じである しかし 離散コサイン変換は 離散フーリエ変換より エントロピーを小さくする すなわち 低周波成分への集中度を高めることができる それは なぜか? その理由を理解するには それぞれの連続空間における数学的意味の検討が必要である

フーリエ変換 iux F( u) f ( x) e dx フーリエ変換 f ( x){cos( ux) isin( ux)} dx 関数 f(x) と直交関数系である三角関数系の複素数表記 e iux = cos(ux) i sin(ux) との内積をとる 直交変換後の関数は 周波数 u の関数 F(u) となる F(u) の実数 (Re) 成分が cos 成分 虚数 (Im) 成分が sin 成分がとなる x が実数の場合 F(u) = F*( u) である (* は複素共役 ) フーリエ変換 展開の整理 ( 連続関数の ) フーリエ変換 入力 ( 空間 ) f(x): 連続 無限 ( 定義域 - から ( 無限区間 ) の連続関数 ) 出力 ( 周波数 ) F(u): 連続 無限 ( 定義域 - から ( 無限区間 ) の連続関数 ) フーリエ級数展開 ( 周期的連続関数のフーリエ変換 ) 入力 ( 空間 ) f(x): 連続 周期 ( 周期的連続関数 ) 出力 ( 周波数 ) c n : 離散 無限 ( 離散値の無限系列 ) 離散フーリエ変換 ( 有限長の標本値系列のフーリエ変換 ) 入力 ( 空間 ) x n : 離散 有限 ( 離散値の有限系列 ) 出力 ( 周波数 ) c n : 離散 有限 ( 離散値の有限系列 ) フーリエ変換 展開の整理 ( 連続関数の ) フーリエ変換 入力 ( 空間 ) f(x): 連続 無限 ( 定義域 - から ( 無限区間 ) の連続関数 ) 出力 ( 周波数 ) F(u): 連続 無限 ( 定義域 - から ( 無限区間 ) の連続関数 ) フーリエ級数展開 ( 周期的連続関数のフーリエ変換 ) 入力 ( 空間 ) f(x): 連続 周期 ( 周期的連続関数 ) 出力 ( 周波数 ) c n : 離散 無限 ( 離散値の無限系列 ) フーリエ変換 フーリエ級数展開 離散フーリエ変換 ( 有限長の標本値系列のフーリエ変換 ) 入力 ( 空間 ) x n : 離散 周期 ( 有限 ) ( 離散値の周期的系列 ) 出力 ( 周波数 ) c n : 離散 周期 ( 有限 ) ( 離散値の周期的系列 ) 離散フーリエ変換 http://en.wikipedia.org/wiki/relations_between_fourier_transforms_and_fourier_series 離散フーリエ変換の連続空間における数学的意味 デジタル信号のフーリエ変換 ( 離散フーリエ変換 ) 入出力 : 離散 有限 ( 離散値の有限系列 ) 空間領域 x=x ii c=c kk i e x i c x e' c x c e' k e k c = Tx x = T T c x = c 周波数領域 e' k,k は三角関数系 離散フーリエ変換の連続空間における数学的意味 離散フーリエ変換の連続空間における意味 入出力 : 有限の定義域区間を周期とする ( 無限区間の ) 周期関数を一定間隔で標本化したもの 離散 周期 離散周期 ( 空間領域 ) f(x) F(u) ( 周波数領域 ) 周期離散 3

コサイン変換 F c コサイン変換 ( u) f ( x)cos( ux) dx 区間 [, ] で定義される関数 f(x) を原点に関して鏡像変換して得られる ( 偶 ) 関数 f'(x) (f'(x) = f'( x)) をフーリエ変換した結果 ( の/) と等価である iux Fc ( u) f ( x)cos( ux) dx f '( x) e dx F c (u) は実数 (Re) 成分のみとなる F c (u) = F( u) である 離散フーリエ変換 (DFT) と離散コサイン変換 (DCT) 連続空間における数学的意味 f (x) i 離散フーリエ変換 右の画像を上下左右に並べていき周期関数にしたものをフーリエ変換したものに等価 離散コサイン変換 上下左右の鏡像変換画像を並べた右の画像を さらに 上下左右に並べていき周期関数にしたものをフーリエ変換したものに等価 ( 偶関数になっていることに注意!) i f'(x) i i 離散フーリエ変換 (DFT) と離散コサイン変換 (DCT) 連続空間における数学的意味 離散フーリエ変換 i 離散コサイン変換 i i (Re) (Re) (Im) お知らせ 授業改善のためのアンケートが KOANで実施されます. 回答期間は7/6 8/3です 清川先生担当分のレポート課題をCLEに設定しました 7/6 締切に設定しています 今年度のマルチメディア工学の講義は 本日が 最終回です i 離散フーリエ変換 (DFT) と離散コサイン変換 (DCT) 連続空間における数学的意味 離散フーリエ変換 i (Re) (Im) 離散フーリエ変換 (DFT: Discrete Fourier Transform) i 離散コサイン変換 対称性のため情報は半分だけ i i さらなる対称性のため情報は /4 だけ 4

離散コサイン変換 (DCT: Discrete Cosine Transform) 離散フーリエ変換 (DFT: Discrete Fourier Transform) 不連続 ( 継ぎ目 ) がある 離散コサイン変換 (DCT: Discrete Cosine Transform) 不連続 ( 継ぎ目 ) がない 離散フーリエ変換 (DFT) 離散コサイン変換 (DCT) 連続系で解釈すれば 離散フーリエ変換は 有限の離散画像を単純に並べて周期化したものを 連続フーリエ変換したものである 画像の境界で不連続が発生する ( 本来の画像には無い高周波数成分が発生してしまう ) これにより 低周波数成分への集中が弱まりエントロピーが大きくなる 離散コサイン変換は 有限の離散画像を ( 縦 横それぞれ ) 鏡像変換しながら並べて周期化したものである 鏡像変換することにより画像境界が連続的につながる ( 離散フーリエ変換のような高成分が発生しない ) DFT DCT JPEG 方式の概要 JPEG 方式 本資料ではモノクロ画像 ( 輝度成分 ) のみを対象とする 画像を8 8 画素のブロック分割を行う 離散コサイン変換 (DCT) によりエントロピーを低減する DCTの各係数値を量子化する. 量子化した各係数値を以下の手順で符号化する 8 8の 次元的配列を ジグザグスキャンにより 低周波成分から高周波成分に並ぶよう 次元系列化にする 次元系列となった係数値に対して 差分符号化 ( 直流成分 ) ランレングス符号化を行う 5

画像 JPEG 方式の概要 8 8 画素のブロックに分割 離散コサイン変換 (DCT) 変換後各係数の量子化 ジグザグスキャンによる 次元系列化 次元系列の符号化 ジグザグスキャン 次元系列 8 8 画素ブロック ブロック毎の JPEG 方式の概要 画像を8 8 画素のブロック分割を行う 離散コサイン変換によりエントロピーを低減する DCTの各係数値を量子化する. 量子化した各係数値を以下の手順で符号化する 8 8の 次元的配列を ジグザグスキャンにより 低周波成分から高周波成分に並ぶよう 次元系列化にする 次元系列となった係数値に対して 差分符号化 ( 直流成分 ) ランレングス符号化を行う 8 8 ブロック分割 8 8 ブロック分割 8 8 ブロック 8 8 ブロック分割 8 8 ブロック分割 8 8 ブロック 8 8 ブロック 6

JPEG 方式の概要 画像を 8 8 画素のブロック分割を行う 離散コサイン変換によりエントロピーを低減する DCT の各係数値を量子化する. 量子化した各係数の値を以下の手順で符号化する 8 8の 次元的配列を ジグザグスキャンにより 低周波成分から高周波成分に並ぶよう 次元系列化にする 次元系列となった係数値に対して 差分符号化 ( 直流成分 ) ランレングス符号化を行う 離散コサイン変換 (DCT) 8 8 画素値 内積 (x, e' ) DCT 基底 k (Re) DFT (Im) x e' 直流成分 ( 平均輝度 ) k e' k,k 離散コサイン変換 (DCT) 8 8 画素値 x 離散コサイン変換 (DCT) 8 8 画素値 x 内積 (x, e' ) DCT 基底 k 内積 (x, e' ) DCT 基底 k (Re) DFT (Im) (Re) DFT (Im) e' k e' k,k e' k e' k,k 離散コサイン変換 (DCT) 8 8 画素値 x 離散コサイン変換 (DCT) 8 8 画素値 x 内積 (x, e' ) DCT 基底 k 内積 (x, e' ) DCT 基底 k (Re) DFT (Im) (Re) DFT (Im) e' k e' k,k e' k e' k,k 7

離散コサイン変換 (DCT) 8 8 画素値 (Re) DFT (Im) e' x 内積 (x, e' ) DCT 基底 k k e' k,k JPEG 方式の概要 画像を8 8 画素のブロック分割を行う 離散コサイン変換によりエントロピーを低減する DCTの各係数値を量子化する. 量子化した各係数値を以下の手順で符号化する 8 8の 次元的配列を ジグザグスキャンにより 低周波成分から高周波成分に並ぶよう 次元系列化にする 次元系列となった係数値に対して 差分符号化 ( 直流成分 ) ランレングス符号化を行う の特性 浮動小数点の数値データである 通常の画像では 高周波成分 ( 青領域 ) は 直流 ( 赤枠 ) 低周波成分 ( ピンク領域 ) にくらべはるかに小さな数値 ( 無視できる程度の数値 / ほぼゼロ ) となる 8 8 画素値 ( 境界付近が含まれている場合 ) の特性 不動小数点の数値データである 通常の画像では 高周波成分 ( 青領域 ) は 直流 ( 赤枠 ) 低周波成分 ( ピンク領域 ) にくらべはるかに小さな数値 ( 無視できる程度の数値 / ほぼゼロ ) となる 8 8 画素値 ( 濃淡値変化が小さい場合 ) 直流成分 低周波成分 直流成分 低周波成分 高周波成分 高周波成分 量子化テーブル DCTの各係数を 予め与えられた量子化テーブルの数値で割り算し 小数点以下を丸める ( 高周波数成分の多くは ゼロになる ) 量子化テーブル DCTの各係数を 予め与えられた量子化テーブルの数値で割り算し 小数点以下を丸める ( 高周波数成分の多くは ゼロになる ) 低周波成分 k 高周波成分 48..83 6 6 77 k k k [JPEG Standard Annex K] この ( 推奨 ) 量子化テーブルの値は人間の視覚特性に基づいて定められたものである すなわち 感度のよい周波数帯により小さな値が設定されている [JPEG Standard Annex K] 絶対値が小さい傾向にある高周波数成分ほど大きな値で割り算され さらに小さな値となる 8

量子化 ( 濃淡値変化が小さい場合 ) 量子化 ( 濃淡値変化が大きい場合 ) テーブル値量子化 量子化テーブル テーブル値量子化 量子化テーブル 直流成分以外 ごく一部の低周波成分を除いて ほとんどがゼロ 直流成分以外 一部の低周波成分が比較的大きナ値をもつが それでも多くの成分がゼロ JPEG 方式の概要 画像を8 8 画素のブロック分割を行う 離散コサイン変換によりエントロピーを低減する DCTの各係数値を量子化する. 量子化した各係数値を以下の手順で符号化する 8 8の 次元的配列を ジグザグスキャンにより 低周波成分から高周波成分に並ぶよう 次元系列化にする 次元系列となった係数値に対して 差分符号化 ( 直流成分 ) ランレングス符号化を行う ジグザグスキャン 直流成分を出発点として 低周波から高周波成分まで ジグザグスキャンにより 量子化されたを 次元の数値系列に変換する 量子化された c k,k k 次元系列化された c,c, c,c, c,c, c 3,c, c,c 3, c 4,c 3,c,c 3,c 4,c 5,.., c 75,c 76, c 67,c 77 直流低周波高周波 k ジグザグスキャン 8 8 画素ブロック内において濃淡変化が小さい場合 量子化 k ジグザグスキャン 8 8 画素ブロック内において濃淡変化が大きい場合 量子化 k k 次元系列化された 6,,,,,-,-, -, -,,,,......,,,, 直流低周波高周波 k 次元系列化された 49,8,8,6,4,3,-,,-,-,,-,-3,-,,,,-,,,,...,,,, 直流低周波高周波 9

JPEG 方式の概要 画像を8 8 画素のブロック分割を行う 離散コサイン変換によりエントロピーを低減する DCTの各係数値を量子化する. 量子化した各係数値を以下の手順で符号化する 8 8の 次元的配列を ジグザグスキャンにより 低周波成分から高周波成分に並ぶよう 次元系列化にする 次元系列となった係数値に対して 差分符号化 ( 直流成分 ) ランレングス符号化を行う 差分符号化 ( 直流成分 ) 隣り合う 3 つのブロックの量子化係数値系列 濃淡変化が比較的小さい場合 3 6 6 7 3 5 隣接するブロックの平均輝度値は近いので 前ブロックの直流成分との差分を用いることにより 値の可変範囲 ( エントロピー ) を低減する (6,3,7,. のかわりに (6),6,-5,.. を記憶する ) 差分符号化 ( 直流成分 ) 隣り合う 3 つのブロックの量子化係数値系列 濃淡変化が大きい場合 次元量子化 系列の特徴 ジグザグスキャンにより 次元系列化された量子化 値の例 5,-3,-9,-,,,,,,,,,,,,,,,,,,,,,,-,,,,,,-,,,,,,,,,,,,,.,, 9 5 4 49 9 43 濃淡変化が大きい場合には 必ずしも 隣接ブロックの直流成分値は近いとは言えないが それでも 成分値そのものよりも差分値の可変範囲は小さい 7,-,,,-,,,-,,,,,-,,,,,-,,,,,,,-,,,..,, が続く傾向にあるので については が続く数 ( ランレングス ) を記憶させる ( よりも が 7 回 のほうが短い ) ランレングス符号化 符号化の方針 直流成分は 差分符号化する その他の成分は 以外の値が出現した時点で その値が出現する直前までにが続いた数と その値のペアとして 符号化する 以外の値がそれ以降出現しなければ EOB として そのブロックの符号化を完了する 符号化の例 ( 直流成分以外 ) 5, -3,-9,-,,,,,,,,,,,,,,,,,,,,,,-,,,,,,-,,,,,,,,,,,,,.,, (,-3) (,-9) (,-) (,) (,) (,) (,) (,) (,) (,-) (5,-) (8,) EOB (Run, Coef) の意味 : が Run 回続いた後 ( 以外の )Coef が出現 JPEG 方式の概要 画像を8 8 画素のブロック分割を行う 離散コサイン変換によりエントロピーを低減する DCTの各係数値を量子化する. 量子化した各係数値を以下の手順で符号化する 8 8の 次元的配列を ジグザグスキャンにより 低周波成分から高周波成分に並ぶよう 次元系列化にする 次元系列となった係数値に対して 差分符号化 ( 直流成分 ) ランレングス符号化を行う

エントロピー符号 ハフマン符号と JPEG 情報源 ( シンボル列の有限空間とその上の確率分布 ) を シンボル毎の出現確率に基づいた符号語長を用いて符号化する 出現確率 大 ( 小 ) 符号語長 短 ( 長 ) を割り当てることにより高い圧縮効果を得る 平均符号長はエントロピーより小さくすることはできない エントロピー : 情報源を表現するのに必要な平均ビット数 ハフマン符号は コンパクト符号 ( 一意複号可能で平均符号長を最小化する符号 ) である JPEGにおけるハフマン符号 直流成分に対する差分符号 ( の数値 ) その他の成分 ( 交流成分 ) に対するランレングス符号 ( の数値列 ) のそれぞれに対して 異なるハフマン符号が定義される ハフマン符号の復習 前提条件 各シンボルの出現確率が既知である アルゴリズム 以下のペア化の処理を繰り返す 最も出現確率の低い つのシンボルをペアにする これら つのシンボルを新しい つのシンボルとみなす 以上の処理により 分木が構成される 分木の各分岐に / を割り当てる 根から各分岐の / を連結することにより符号を得る A. B.5 C.3 D.75 E..45.75.575. 直流 (DC) 成分差分のサイズ分類とそのハフマン符号 直流成分の差分符号化における仮定 隣接ブロックの直流成分 ( 平均輝度値 ) は近い値である 差分値 の出現頻度が最も高く 差分値の絶対値が大きくなるにしたがい 出現頻度は低下する 差分値を size 分類符号テーブルに従って符号化 Kingsbury DC Coef Difference Size Typical Huffman codes Additional Bits (in for Size binary),, 3,,,3,,, 7,, 4,4,,7 3,,,, 5, 8,8,,5 4,,,,, 3, 5,5,,3,, 47, 4,4, 47,, http://cnx.org/content/m96/latest/ 直流 (DC) 成分差分のサイズ分類とそのハフマン符号 具体例 差分値 : Size (Code ), Additional Bits Huffman Code: 差分値 : Size (), Additional Bits Huffman Code: 差分値 4: Size 3 (), Additional Bits Huffman Code 差分値 5: Size 4 (), Additional Bits Huffman Code Kingsbury DC Coef Difference Size Typical Huffman codes Additional Bits (in for Size binary),, 3,,,3,,, 7,, 4,4,,7 3,,,, 5, 8,8,,5 4,,,,, 3, 5,5,,3,, 47, 4,4, 47,, http://cnx.org/content/m96/latest/ 直流 (DC) 成分差分のハフマン符号 差分値出現頻度分布の実例 エントロピー 差分符号なし : 6.4 bits 差分符号あり : 6.7 bits Kingsbury 差分符号なし 差分符号あり http://cnx.org/content/m96/latest/ 交流 (AC) 成分のハフマン符号 交流成分は ランレングス符号 (Run, Coef) の系列 (Run, Coef) : が Run 回続いた後 係数値 Coef が出現 例 :(, 3) (, 9) (, ) (,) (,) (,) (,) (,) (,) (, ) (5, ) (8,) EOB (Run, Coef) のハフマン符号 (Run, Coef の Size) のハフマン符号と付加ビットで表現する Coef の Size 分類については DC 成分と同じ分類に基づく Kingsbury (Run,Size) Code Byte (hex) Code Word Code Word (Run,Size) Code Byte (hex) (binary) (binary) (,) (,6) 6 (,) (,3) 3 (,3) 3 (5,) 5 (EOB) (6,) 6 (,4) 4 (,7) 7 (,) (,) (,5) 5 (7,) 7 (,) (,4) 4 (,) (3,) 3 (ZRL) F (4,) 4 http://cnx.org/content/m96/latest/

交流 (AC) 成分のハフマン符号 具体例 (Run, Coef)= (, 7) : (Run Size)=(,3) + 付加ビット (Run, Coef)= (,3): (Run, Size) = (,) + 付加ビット 交流成分係数の出現頻度 (Run Size)=(,) (Run,Size) Code Word (binary) (Run Size)=(,) (,) AC Coef Size Additional Bits (in binary),, (,) (,3) (EOB) (,4) (,) (Run Size)=(,) 3,,,3,,, (,5) 7,, 4,4,,7 3,,,, (,) (,) Kingsbury http://cnx.org/content/m96/latest/ 8 8 画素ブロック分割 JPEG 方式まとめ ブロック単位の離散コサイン変換 (DCT) によるエントロピー削減 人間視覚の周波数感度特性を考慮した の量子化 ジグザグスキャンによる量子化 の 次元化 ( 直流 低周波 ~ 高周波数数成分 ) ( 直流成分の ) 差分符号化 ( 交流成分の ) ランレングス符号化 ハフマン符号化 ジグザグスキャン 8 8 画素 (,-3) (,-9) (,-) (,) (,) (,) (,) (,) (,) (,-) (5,-) (8,) EOB ハフマン符号テーブルハフマン符号 画像直交変換 JPEG 関連の有用なウェブページ 信州大学 井澤先生のホームページ http://laputa.cs.shinshu u.ac.jp/~yizawa/infsys/basic/index.htm http://laputa.cs.shinshu u.ac.jp/~yizawa/infsys/advanced/index.htm http://laputa.cs.shinshu u.ac.jp/~yizawa/infsys/ref_contents/index.htm 広島大学 浅野先生のホームページ http://kuva.mis.hiroshima u.ac.jp/~asano/kougi/a/tokuron/ スタンフォード大 Prof. Bernd Girod の Image Communication I 講義資料 http://www.stanford.edu/class/ee398a/handouts.htm JPEG Entropy Coding and D DCT by Nick Kingsbury http://cnx.org/content/m96/latest/ http://cnx.org/content/m94/latest/ Wikipedia JPEG, 離散コサイン変換