教学目的:
让学生对多媒体数据压缩编码的基本原理和算法、数据压缩编码的分类和方法、多媒体数据压缩编码的国际标准等内容的理解和掌握。 教学内容:
什么是多媒体数据压缩、为什么信息能被压缩、常用的压缩编码和算法(统计编码、预测编码、变换编码)、多媒体数据压缩编码的国际标准JPEG、MPEG-1等内容。 教学要求:
掌握:数据压缩编码的方法、常用的压缩编码和算法、JPEG的原理和实现技术。 理解:量化的原理和量化器的设计、MPEG-1的原理和实现技术。
了解:其它的国际标准等。 教学课时:2节课 教学实施: 4.3 统计编码
一.统计编码原理——信息量和信息熵 1.概念:
(1)信息:是用不确定性的量度定义的。
(2)信息量:从N个相等可能事件中选出一个事件所需要的信息度量或含量。 (3)熵:如果将信源所有可能事件信息量进行平均就得到信息的熵(熵就是平 均信息量)。
(4)信源均含有的平均信息量(熵),就是进行无失真编码的理论极限。 (5)信源中或多或少的含有自然冗余。 (6)信息源X的熵为H(X):
式(4.2) 二.哈夫曼编码
1.变字长编码定理:最佳编码定理
在变字长编码中,对于出现概率大的信息符号,编以短字长的码,对于出现 概率小的信息符号编以长字长的码,如果码字长度严格按照符号概率的大小的 相反顺序排列,则平均码字长一定小于按任何其他符号顺序排列方式得到的码 字长度。 证明:(P108)
2.Huffman编码方法用变字长最佳编码定理
(1). 把信源符号按概率大小顺序排列,设法按逆次序分配码字的长度。
1
(2). 在分配码字长度时,将出现概率最小的两个符号的概率相加合成一个概率。 (3).把这个合成概率看成是一个新组合符号地概率,重复上述做法直到最后只剩下 两个符号概率为止。
(4). 完成以上概率顺序排列后,再反过来逐步向前进行编码,每一次有三个分支各赋予 一个二进制码,对概率大的赋为零,概率小的赋为1。 2. Huffman 编码步骤
(1)信源符号按概率大小顺序排列,按逆次序分配码字的长度。 (2) 出现概率最小的两个符号概率相加合成一个新概率。
(3) 将合成概率看成一个新组合符号概率,重复上述做法,直到最后只剩下两个符 号概率为止。
(4) 反过来逐步向前编码,每层有两个分支,分别赋予0和1,构成Huffman码字。 总结:
Huffman 编码构造出的码不唯一 Huffman 编码字长参差不齐
Huffman编码在信源编码概率分布不均匀时效率高,
效率比较均匀时,效率低,不用Huffman编码。 对出现频率较高的码分配短码字;
对出现频率较低的码分配长码字。 三.算术编码 1.原理:
算术编码方法是将被编码的信息表示成实数0和1之间的一个间隔。 信息越长编码表示它的间隙就越小,表示这一间隙所须二进位就越多, 大概率符号出现的概率越大对应于区间愈宽,可用长度较短的码字表示; 小概率符号出现的概率越小对应于层间愈窄,需要长度较长的码字表示。
信息源中连续的符号根据某一模式生成概率的大小来减少间隔。可能出现的符号要比不太可能出现的符号减少范围少,因此只增加了较少的比特位 2.自适应二进制算术编码 (1)编码算法举例
设编码初始化子区间为[0,1] 设 大概率MPS, Pe 小概率LPS Qe Pe=1-Qe
编码时,设置两个专用寄存器(C,A) 初始时:令
C 寄存器的值为子区域的起始位置 A 寄存器的值为子区域的宽度
2
(该宽度恰好是已输入符号串的概率) 初始化时:C=0 A=1
随着被编码数据源输入,C和A的内容按以下规律修正: 当低概率符号LPS到来时: C=C A=AQe 当高概率符号MPS到来时: C=C+AQe A=APe=A(1-Qe) (2)解码算法举例
解码:
按 Qe Pe分成两个子区间,判断被解码的码字落在哪个区间,并赋予对应符号:c’=(0.0101)b 是被解码的值 初始值:A=1 Qe=0.001
当c’落在0-QeA之间,解码符号为 D=0;
C’=C’ A=QeA ;
当c’落在Qe A -A之间,解码符号为D=1;
C’=C’-QeA; A=A(1-Qe) 算术解码原理图P114 算术编码的特点: (1). 不需要码表;
(2). 当信源概率比较接近时,建议使用算术编码。 (3). JPEG成员对多幅图进行算术编码效率可以提高5%。
JPEG扩展系统用算术编码代替Huffman。 4.4 预测编码
一.预测编码的基本概念
预测编码是统计冗余数据压缩理论的三个重要分 支之一,用预测编码减少数据时间和空间的相关性。
预测编码基本原理 预测编码方法分类
设3
线性预测编码:DPCM非线性预测编码
1. DPCM 差分脉冲编码调制 DPCM 编/解码原理图P116
2. ADPCM自适应预测编码
这种编码方法中,量化器的步长和预测器的参数均能根据图象的局部特征作自 适应的调整。 ADPCM分成两类
1).线性自适应预测器 2) 非线性自适应预测器
引进几个和临近象素有关的值,入i和di非线性改变预测的数。所以,叫非线性的自 适应预测。 采用四点预测 三.帧间预测编码
对于序列图象,把几帧的图象存起来(大规模集成电路技术的发展) 使用帧 间相关性进一步消除图象信号的冗余度,提高压缩比。
帧间压缩方法:
条件补充法 条件次取样法。 运动补偿 帧间预测 1.条件补充法 条件象素补充法规定:
若帧间各对应象素的亮度差超过阈值,则把这些象素存到缓存区中,
并以恒定传输速度传输,而阈值以下的象素则不传送,在接收端中用上一帧相应的象素代替。 在可视电话中用条件补充法传送的象素只占全部象素的6%左右。 2.条件次取样法
条件补充法和内插法相结合叫条件次取样法。
具体做法:在时间轴采用次取样(两个取一 个就是次取样)对于未取样的当前场的 某点可以采用隔场的四邻点亮度的均值,作为该点亮度的预测值。 条件补充:S0=1/4(SA+SB+SC+SD)内 插预测值与实际值之差小于阈值后就不传。
4
3.运动补偿
(1)运动估计有下述三种方法:
块匹配法: 以象素块为准进行运动估计。 象素递归法:以象素为准进行递归的运动估计。 傅立叶变换法 1) 块匹配法
将图象分成M*N个矩形块。
在(M+2Wx)*(N+2Wy)范围内进行搜索以求得最优匹配,从而求得运动矢量估值(dx,dy) A.匹配算法
归一化相关函数 NCCF 均方误差 MSE 帧间绝对差 MAD B.搜索方法: 穷尽搜索法 二维对数法(TDL) 三步搜索法(TTS) 交叉搜索法(CSA) 4.帧间预测,采用 DPCM
(Ymn)N和(Ymn)N-1 变化很小。
统计结果表明:广播电视节目只有10%以内的象素有变化。 Y有2%的变化; UV有千分之十以内的变化。 Xmn-Xmn=emn 只传差值
4.5 变换编码 一. 变换编码的特点
利用预测编码可以去除图象数据的时间和空间的冗余。它的优点是直观、简捷、 易于实现,特别是用于硬件实现。但压缩能力有限,DPCM一般只能压缩到2~4bit/像素。 变换编码是进行一种函数变换,映射变换从信号域变换到另一个信号域。
例:有两个相邻采样值X1和X2,每一采样值用3bit编码,因此有8个幅度等级, 两个为: 8*8=64种。见P122(b) 变换编码的系统构成: 二.变换种类
5
• K-L变换 • 离散傅立叶变换 • 离余弦变换 • WALSH变换 • Har
4.5.2 K-L变换
• 它是以统计特性为基础的,也称为特征向量变换。
• 最优的正交变换:特征向量矩阵向量指向数据变化最大的方向。 •
缺点:计算过程复杂,变换速度慢。
一.协方差矩阵 (4.18) (4.22) (4.23)
二.离散K-L变换表达式
特征值和特征向量定义: 设A是n阶方矩,如果有数入和n维非零向量x,使得: AX=入x 则称:入为A的特征值;
x为A对应于特征值入的特征向量。 (4.29) (4.32) (4.38) 结论:
Y向量的平均向量为0,直流分量为0。 Y的协方差矩阵:协方差等于0 方差对角线按减序排列
4.5.3 离散余弦变换(DCT变换)
一. 二维离散傅立叶变换 正变换(4.56) 逆变换(4.57)
6
因篇幅问题不能全部显示,请点此查看更多更全内容