第6章 多媒体数据压缩改优秀课件.ppt
《第6章 多媒体数据压缩改优秀课件.ppt》由会员分享,可在线阅读,更多相关《第6章 多媒体数据压缩改优秀课件.ppt(91页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第6章 多媒体数据压缩改第1页,本讲稿共91页2本章主要内容本章主要内容6.1 数据压缩技术概述6.2 数据压缩技术原理6.3 JPEG静止图像压缩标准6.4 运动图像压缩标准MPEG第2页,本讲稿共91页36.1 6.1 数据压缩技术概述数据压缩技术概述6.1.1 数据压缩的概念 采样数据不仅仅是所代表的原始信息本身,还包含着其它一些采样数据不仅仅是所代表的原始信息本身,还包含着其它一些没必要保留的(确定的、可推知的)信息,即存在着数据冗余。没必要保留的(确定的、可推知的)信息,即存在着数据冗余。M=D-d 其中其中M表示实际媒体信息,表示实际媒体信息,D表示数字化后的采样表示数字化后的采样
2、数据,数据,d表示数据冗余量。表示数据冗余量。数据压缩数据压缩就是就是从采样数据中去除冗余从采样数据中去除冗余,即保留原始信息中变,即保留原始信息中变化的、特征性信息,去除重复的、确定的或可推知的信息,化的、特征性信息,去除重复的、确定的或可推知的信息,在实在实现更接近实际媒体信息描述的前提下,尽可能的减少描述用现更接近实际媒体信息描述的前提下,尽可能的减少描述用的信息量的信息量。第3页,本讲稿共91页46.1.2 多媒体数据的冗余随着计算机技术的高度发展以及通信、计算机和大众传媒三大技术随着计算机技术的高度发展以及通信、计算机和大众传媒三大技术的相互融合,计算机已经不再局限于数值计算、文字处
3、理的范畴,的相互融合,计算机已经不再局限于数值计算、文字处理的范畴,而成为处理图形、图像、视频、音频等多种信息的工具。但数字化而成为处理图形、图像、视频、音频等多种信息的工具。但数字化后的声音、图像、视频和音频等多媒体数据是非常庞大的。后的声音、图像、视频和音频等多媒体数据是非常庞大的。例如:例如:一页在一页在A4(216mm300mm)纸上的照片,以)纸上的照片,以300dpi(12像素像素/mm)采样,每个像素用采样,每个像素用24位真彩色信号表示,其数据量约为位真彩色信号表示,其数据量约为27MB/页,页,650MB的的CD-ROM只可放只可放24页;页;双声道立体声光盘,采样率是双声道
4、立体声光盘,采样率是44.1kHz,采样精度,采样精度16位,一秒钟数据量是位,一秒钟数据量是44.1162/8=172KB/s,一张,一张CD只能存放约只能存放约1小时的声音。小时的声音。第4页,本讲稿共91页56.1.2 多媒体数据的冗余 对于如此巨大的多媒体数据,如果不经过压缩,不仅超出对于如此巨大的多媒体数据,如果不经过压缩,不仅超出了计算机的存储和处理能力,而且在现在的通信信道的传输速率了计算机的存储和处理能力,而且在现在的通信信道的传输速率下,是无法完成大量多媒体信息的传输的,多媒体数据的高速传下,是无法完成大量多媒体信息的传输的,多媒体数据的高速传输和储藏所需要的巨大容量已经成为
5、多媒体数据通信技术的最大输和储藏所需要的巨大容量已经成为多媒体数据通信技术的最大障碍。因此,为了存储、处理和传输这些数据,必须进行压缩。障碍。因此,为了存储、处理和传输这些数据,必须进行压缩。第5页,本讲稿共91页66.1.2 多媒体数据的冗余 一般而言,多媒体数据中存在的数据冗余情况主要有以一般而言,多媒体数据中存在的数据冗余情况主要有以下几种下几种(P107):信息熵冗余空间冗余时间冗余结构冗余知识冗余视觉冗余听觉冗余纹理的统计冗余第6页,本讲稿共91页信息熵冗余 信息熵定义为一组数据所表示的信息量,即 式中,E为信息熵,N为数据的种类(或称码元)个数,Pi为第i个码元出现的概率。一组数据
6、的数据量显然等于各记录码元的二进制位数(即编码长度)与该码元出现的概率乘积之和,即 式中,D为数据量,为第i个码元的二进制位数。一般取 (如ASCII编码把所有码元都编码为7比特),这样得到的D必然大于E。这种因码元编码长度的不经济带来的冗余称为信息熵冗余或编码冗余。第7页,本讲稿共91页信息熵冗余图 26个英文字母相对频率第8页,本讲稿共91页空间冗余-同一景物表面上各采样点的颜色之间往往存在着空间连贯性,但是基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间连贯性,从而产生了空间冗余空间冗余。-可以通过改变物体表面颜色的像素存储方式来利用空间连贯性,达到减少数据量的目的
7、。第9页,本讲稿共91页时间冗余-这是序列图像(电视图像、运动图像)表示中经常包含的冗余。-序列图像一般为位于一时间轴区间内的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为时间冗余时间冗余。第10页,本讲稿共91页结构冗余-在有些图像的纹理区,图像的像素值存在着明显的分布模式,例如,方格状的地板图案等。我们称此为结构冗结构冗余余。-已知分布模式,可以通过某一过程生成图像。第11页,本讲稿共91页知识冗余-有些图像的理解与某些知识有相当大的相
8、关性。例如,人脸的图像有固定的结构。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余知识冗余。-根据已有的知识,对某些图像中所包含的物体,我们可以构造其基本模型,并创建对应各种特征的图像库,进而图像的存储只需要保存一些特征参数,从而可以大大减少数据量。知识冗余是模型编码主要利用的特性。第12页,本讲稿共91页视觉冗余-事实表明,人类的视觉系统对图像场的敏感性是非均匀和非线性的。然而,在记录原始的图像数据时,通常假定视觉系统是线性和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开来编码)更多的数据,这就是视视觉冗余觉冗余。-通过
9、大量实验,发现以下视觉的非均匀特征。视觉系统对图像的亮度和色彩度的敏感性相差很大;随着亮度的增加,视觉系统对量化误差的敏感度降低;人眼的视觉系统在图像的边缘和非边缘区域分开来处理;人类的视觉系统总是把视网膜上的图像分解成若干个空间有向的频率通道后再进一步处理。第13页,本讲稿共91页图像区域的相同性冗余-它是指在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余图像区域的相似性冗余。-在以上的情况下,记录了一个区域中各像素的颜色值,则与其相同或相近的其他区域就不在记录其中各像素的值。-向量量化方法就是针对这种冗余性的图像压缩编码方法。第14
10、页,本讲稿共91页纹理的统计冗余-有些图像纹理尽管不严格服从某一分布规律,但是它在统计的意义上服从该规律。利用这种性质也可以减少表示图像的数据量,所以我们称之为纹理的统计纹理的统计冗余冗余。第15页,本讲稿共91页思考:图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关,这是()。(A)空间冗余(B)时间冗余(C)信息熵冗余(D)视觉冗余16第16页,本讲稿共91页下列哪一种说法是正确的:A.信息量等于数据量与冗余量之和B.信息量等于信息熵与数据量之差C.信息量等于数据量与冗余量之差D.信息量等于信息熵与冗余量之和17第17页,本讲稿共91页186.1.3 数据压缩技术的发展过程
11、 20世纪40年代,人们开始系统地研究数据压缩技术;主要表现在数据压缩算法方面:首先是Claude Shannon与R.M.Fano的Shannon-Fano编码方法;编码方法;1952年,年,D.A.Huffman提出了提出了Huffman编码方法;编码方法;1968年,年,P.Elias 发展了发展了Shannon-Fano编码,构造出更为完美的编码,构造出更为完美的Shannon-Fano-Elias 编码。编码。1976年,年,J.Rissanen 提出了一种可以成功地逼近信息熵极限的编码方法提出了一种可以成功地逼近信息熵极限的编码方法算术编码。算术编码。1982年,年,Rissane
12、n 和和G.G.Langdon 一起改进了算术编码。一起改进了算术编码。1977年,年,Jacob Ziv和和Abraham Lempel提出了提出了LZ77编码算法,编码算法,78年又作了改年又作了改进,被称为进,被称为LZ78编码算法。编码算法。1984年,年,Terry Welch提出了提出了LZ78算法的变种算法算法的变种算法LZW。LZ77、LZ78、LZW三种压缩技术就是目前无损压缩领域中最为流行的、被称为三种压缩技术就是目前无损压缩领域中最为流行的、被称为“字典式编码字典式编码”的压缩技术。的压缩技术。第18页,本讲稿共91页196.1.3 数据压缩技术的发展过程(续)数据压缩标
13、准逐渐形成,有损压缩算法快速出现。数据压缩标准逐渐形成,有损压缩算法快速出现。19861986年开始制定静态图像压缩标准,年开始制定静态图像压缩标准,1994 1994 年后成为国际标准,年后成为国际标准,称为称为JPEGJPEG标准。标准。ITUITU制定的电视会议系列标准(制定的电视会议系列标准(H.261H.261、H.262H.262、H.263 H.263、H.264H.264等)以及由等)以及由ISOISO制定的视频系列标准(制定的视频系列标准(MPEG-1MPEG-1、MPEG-2MPEG-2、MPEG-MPEG-4 4)中,均采用了有损压缩原理作为其核心压缩算法。其中的)中,均
14、采用了有损压缩原理作为其核心压缩算法。其中的MPEG-4MPEG-4标准(相当于标准(相当于ITUITU的的H.263H.263和和H.263+H.263+标准)是为了适应网络标准)是为了适应网络视频的需求特点而制定的,具有更高的压缩比、支持并发数视频的需求特点而制定的,具有更高的压缩比、支持并发数据流编码、基于内容的交互操作、增强的时间域随机存取、据流编码、基于内容的交互操作、增强的时间域随机存取、容错、基于内容的尺度可变性等新特性。容错、基于内容的尺度可变性等新特性。第19页,本讲稿共91页206.1.4 数据压缩的分类1 1、按照压缩内容、按照压缩内容 分为音频数据压缩、静态图像数据压缩
15、、视频数据压缩分为音频数据压缩、静态图像数据压缩、视频数据压缩和其他数据文件压缩等四种类型。和其他数据文件压缩等四种类型。2、按照压缩方式分为对称压缩和非对称压缩两种类型。分为对称压缩和非对称压缩两种类型。3、按照压缩效果 分为有损压缩与无损压缩两种类型。普通数据文件,一般采分为有损压缩与无损压缩两种类型。普通数据文件,一般采用无损压缩,对于冗余度较小的图像,需要采用有损压缩。用无损压缩,对于冗余度较小的图像,需要采用有损压缩。第20页,本讲稿共91页214、按照算法思想 分为信息熵编码、预测编码、变换编码、混合编码以及其他分为信息熵编码、预测编码、变换编码、混合编码以及其他编码等五种,每种类
16、型包含了一些具体算法,如下图。编码等五种,每种类型包含了一些具体算法,如下图。第21页,本讲稿共91页226.1.5 数据压缩的主要指标 衡量不同压缩方法优劣的技术指标是相同的,主要包括以下几个方面。衡量不同压缩方法优劣的技术指标是相同的,主要包括以下几个方面。1 1)压缩比)压缩比:指压缩前后的数据量之比,它反映了施加某压缩算:指压缩前后的数据量之比,它反映了施加某压缩算法之后,数据量减少的比例;法之后,数据量减少的比例;2 2)恢复效果)恢复效果:指经解压缩算法对压缩数据进行处理后所得到的:指经解压缩算法对压缩数据进行处理后所得到的数据与其表示的原信息的相似程度;数据与其表示的原信息的相似
17、程度;3 3)算法简单、速度快)算法简单、速度快:主要指实现算法的复杂度。:主要指实现算法的复杂度。第22页,本讲稿共91页236.2 数据压缩技术原理6.2.1 信息熵与编码1、信息熵的概念 信息论中,编码数据量与所表示的信息量以及冗余信息之信息论中,编码数据量与所表示的信息量以及冗余信息之间的关系为:间的关系为:数据量信息量冗余量数据量信息量冗余量 信息是对所表现的事件中不确定性的描述,信息量多少与不确信息是对所表现的事件中不确定性的描述,信息量多少与不确定性的程度有关。通常,可以用概率来描述不确定性的大小。定性的程度有关。通常,可以用概率来描述不确定性的大小。某信息描述的事件状态的出现概
18、率越小,其不确定性越大,其某信息描述的事件状态的出现概率越小,其不确定性越大,其表达的信息量就越多,冗余量就越少。表达的信息量就越多,冗余量就越少。第23页,本讲稿共91页信息熵信息熵用来度量信息量的大小。对于单个事件(如字符)来说,其信息熵定义为:H(i)=-log2(Pi)(bit)(1)公式(1)表示发生概率为Pi的事件i所具有的信息熵为H(i),单位为bit(比特)。24第24页,本讲稿共91页25对于一个消息队列(如字符串)的信息熵定义为:对于一个消息队列(如字符串)的信息熵定义为:H(X)=-PH(X)=-Pi iloglog2 2(P(Pi i)=P)=Pi iH(i)H(i)(
19、2 2)其中,其中,P Pi i表示某一事件表示某一事件i i发生的概率。发生的概率。例如例如:有一字符串:有一字符串“babbdcaacbbabbdcaacb”包含包含a a、b b、c c、d d四种字符,其长四种字符,其长度为度为1010,字符,字符a a、b b、c c、d d分别出现了分别出现了3 3、4 4、2 2、1 1次,则次,则a a、b b、c c、d d在信息中出现的概率分别为在信息中出现的概率分别为0.30.3、0.40.4、0.20.2、0.10.1,它们的熵分别为:,它们的熵分别为:H(a)=-logH(a)=-log2 2(0.3)1.737(0.3)1.737(
20、bitbit)H(b)=-logH(b)=-log2 2(0.4)1.322(0.4)1.322(bitbit)H(c)=-logH(c)=-log2 2(0.2)2.322(0.2)2.322(bitbit)H(d)=-logH(d)=-log2 2(0.1)3.322(0.1)3.322(bitbit)第25页,本讲稿共91页26 每种字符的信息熵就是该字符编码所用的理想位数每种字符的信息熵就是该字符编码所用的理想位数(二进制)(二进制)。整条信息的熵就是表达整个字符串需要的。整条信息的熵就是表达整个字符串需要的位数(这里用字符出现的次数代替概率):位数(这里用字符出现的次数代替概率):H
21、(X)=-PH(X)=-Pi iloglog2 2(P(Pi i)=H(a)3+H(b)4+H(c)2+H(d)1 =H(a)3+H(b)4+H(c)2+H(d)1 =18.465(bit)=18.465(bit)若用若用ASCII编码,编码,需要多少需要多少bit?第26页,本讲稿共91页272、编码 编码实质上是对要处理的源数据或源文件按一定的规则进行变编码实质上是对要处理的源数据或源文件按一定的规则进行变换(映射),力图用尽可能少的符号代码来表示较多、较长的源符换(映射),力图用尽可能少的符号代码来表示较多、较长的源符号信息。编码方法中的码字(代码)有固定长度和可变长度两种。号信息。编码
22、方法中的码字(代码)有固定长度和可变长度两种。3、压缩模型 模型是规则和数据的集合,即:压缩算法模型是规则和数据的集合,即:压缩算法=模型模型+编码编码 第27页,本讲稿共91页284、压缩、还原 压缩是指设法去掉部分或全部冗余,从而减少文件压缩是指设法去掉部分或全部冗余,从而减少文件或数据所占的存储空间;或数据所占的存储空间;还原(解压缩)则是指利用相反的算法使文件或还原(解压缩)则是指利用相反的算法使文件或数据恢复原状。数据恢复原状。第28页,本讲稿共91页29第29页,本讲稿共91页306.2.2 无损压缩编码1、Shannon-Fano编码简称为简称为S-FS-F编码,是一种变长编码,
23、其基本思想是按信源符编码,是一种变长编码,其基本思想是按信源符号出现的概率大小进行排序,出现概率大的分配短码,反之则分号出现的概率大小进行排序,出现概率大的分配短码,反之则分配长码。具体编码过程如下:配长码。具体编码过程如下:(1 1)信源符号按概率递减顺序排列。)信源符号按概率递减顺序排列。(2 2)把符号序列分成上下两部分,使上下两部分的概率和相等或接近相等。)把符号序列分成上下两部分,使上下两部分的概率和相等或接近相等。(3 3)对上部分子序列编码为)对上部分子序列编码为“0 0”,相当于左子树,对下部分子序列编码为,相当于左子树,对下部分子序列编码为“1 1”,相当,相当于右子树。于右
24、子树。(4 4)重复上述步骤,直到每个子序列只包含一个符号为止。)重复上述步骤,直到每个子序列只包含一个符号为止。第30页,本讲稿共91页31举例:有信源字符序列S为:aaabbceeehddabafffbdddgghhabccedabdgghhaaaabbceeehddabafffbdddgghhabccedabdgghha 其长度为其长度为4040个字符,由个字符,由a a、b b、c c、d d、e e、f f、g g、h h共共8 8种字种字符构成。假设在编码之前,每种字符出现的概率已由某种模符构成。假设在编码之前,每种字符出现的概率已由某种模型统计出来,用型统计出来,用-来表示,具体
25、值分别为:来表示,具体值分别为:a-8a-8,b-6b-6,c-3c-3,d-7d-7,e-4e-4,f-3f-3,g-4g-4,h-5h-5第31页,本讲稿共91页32a-8a-8d-7d-7b-6b-6h-5h-5e-4e-4g-4g-4c-3c-3f-3f-3a-8a-8d-7d-7b-6b-6h-5h-5e-4e-4g-4g-4c-3c-3f-3f-3(a)(a)第一步第一步(b)(b)第二步第二步解:首先将信源符号按概率递减顺序排列,形成图(首先将信源符号按概率递减顺序排列,形成图(a a)所示结果,然)所示结果,然后,再把符号序列分成上下两部分,使上下两部分的概率和相等或接后,再把
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第6章 多媒体数据压缩改优秀课件 多媒体 数据压缩 优秀 课件
限制150内