《《多媒体技术教程第三版》习题解答 .docx》由会员分享,可在线阅读,更多相关《《多媒体技术教程第三版》习题解答 .docx(16页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、精品名师归纳总结多媒体技术教程(第三版) 习题解答第 1 章 绪 论1. 多媒体信息系统和多媒体运算机有什么不同?在概念上应如何看待两者之间的关系?多媒体信息系统是新一代高度集成的、功能强大的、 智能化的运算机信息系统,它是供应多媒体信息、 帮助人们对环境进行掌握和决策的系统,是基于运算机、 通信网络等现代化的工具和手段, 服务于经管领域的信息处理系统。而多媒体运算机指的是硬件设施,多媒体运算机是多媒体信息系统得以应用的平台。2. 试归纳表达多媒体关键特性以及这些特性之间的关系。多媒体的关键特性主要包括信息载体的多样性、交互性和集成性这三个方面,这既是多媒体的主要特点,也是在多媒体争论中必需解
2、决的主要问题。信息载体的多样性是相对于运算机而言的,指的就是信息媒体的多样化,有人称之为信息多维化。 多媒体的其次个关键特性是交互性,多媒体系统将向用户供应交互式使用、加工和掌握信息的手段, 为应用开创更加宽阔的领域,也为用户供应更加自然的信息存取手段。多媒体的集成性主要表现在两个方面,一是多媒体信息媒体的集成,二是处理这些媒体的设备与 设施的集成。信息载体的多样性是集成性的基础,没有多种信息媒体, 也就无法进行多媒体信息的集成化处理。 而处理多媒体的设备与设施的集成性是实现交互性的前提,没有系统、网络、软硬件设施的集成,就无法为用户交互式使用、加工和掌握信息供应平台。 3为什么说多媒体缩短了
3、人类信息沟通的路径?人类与运算机进行信息沟通的目的是什么?与以往的方法相比, 运算机在数据处理方面有了很大的改善。运算机所供应的功能强大的数据组织和构造技术,如传统数据结构中的数组、向量、队列、堆栈、树和堆等,为动态的加工和处理数据供应了基础。高效的算法和高速的网络通信,大大的加强了用文字和数据表示概念的才能并加速了它的传递过程。但人类并不是仅仅依靠文本这一类单一的数据形式来传递全部的信息和接受概念的,图像、声音等多媒体信息都是人类猎取和传递信息极为重要的渠道。图像的信息量最大,一幅画赛过千言万语,最直观、最能一目了然。而动态的影像视 频和动画就更生动、 更逼真、更接近客观世界的原型、更能反映
4、事物的本质和内涵。声音和文字也是信息的重要媒体,综合应用不仅有利于接受,也有利于储备(记忆)和保留。这就意味着必需同时启动大脑的形象思维和规律思维,才能更好的获得更多更有用的信息。因此, 通过多种感觉器官用多种信息媒体形式向人供应信息才算是更好的表达方法,它不仅加速和 改善了懂得, 并且提高了信息接受的爱好和留意力。多媒体正是利用各种信息媒体形式,集成的用声、图、文等来承载信息,也就是缩短信息传递的路径。人类与运算机进行信息沟通的目的是为了高效的猎取、传递以及使用信息。 运算机的进展使得人类的信息处理手段得到加强,高速的运算才能扩展了对数据进行重复运算的才能,大规模的储备扩展了记忆信息的范畴,
5、高速通信网使得我们可以同远在异的他乡的同事、伴侣、亲人甚至生疏人进行快速的信息交换。这些机器成为我们与他人进行沟通的中介。4. 有人说,在将来信息系统中运算机和电视将合为一体,这意味着产生了新一代的信息系可编辑资料 - - - 欢迎下载精品名师归纳总结统,是革命性的转变,而不仅仅是某种设备功能的增强。你的看法了?1运算机和电视合为一体,是多媒体信息系统应用的一个实例,将提高家庭自动化程度, 而并不是意味着新一代信息系统的产生。通过这种方式, 将转变人们长期依靠被动接收信息的情形。将交互式手段融入到人们的日常生活中。交互可以增加对信息的留意力和懂得力,延长信息在头脑中保留的时间。而在单向的信息空
6、间中, 这种接收的成效和作用就很差。借助于交互活动, 人们可以获得所关怀的内容,猎取更多的信息。 用户也可以找出想看的电视节目, 可以快速跳过不感爱好的部分,可以对某些所关怀的内容进行编排等,从而转变现在观看电视节目的方法。5. 有人说,多媒体是界面技术,即人机接口技术,你同意吗?为什么?多媒体技术包括人机接口技术,但不仅仅是人机接口技术。而人机接口技术也不仅仅在多媒体领域得到应用。人机接口技术的目的是让一般用户利用运算机完成他们在某一工作领域中的任务。随着多媒体技术及其相关技术的不断进展,人机交互的接口已经开头向更加自然,更加人性化的方向进展。 例如多模态接口, 它将手势识别、 语音识别、自
7、然语言懂得甚至面部表情识别等综合应用于人机交互。 当然, 人机交互接口不仅仅是一个人机界面的问题,对于媒体的懂得和人机通信过程可以看成是一种智能的行为,它与人类的智能活动有着亲密的关系。而多媒体技术的涵盖面更加宽泛,包括多媒体数据模型、 多媒体数据压缩技术、 多媒体内容处理与检索技术、 多媒体表现与同步技术、 多媒体人机交互接口技术、 多媒体通信与分布处理技术等等。略为全面的,多媒体技术可以定义为:以数字化为基础, 能够对多种媒体信息进行采集、编码、储备、传输、处理和表现,综合处理多种媒体信息并使之建立起有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。2第 2 章 媒体及媒体技术1为什
8、么说媒体具有不同的抽象层次?对媒体的抽象层次和性质进行小结。在获得媒体语义的过程中, 抽象起着特别重要的作用, 这种抽象是复杂的, 而且与任务有关。通常包括如干抽象层, 每一个抽象层都包含着与具体的任务和问题域有关的模型。从接近具体感官的信息表示层到接近符号的信息表示层,信息的抽象程度递增, 而数据量就递减。 语义就是在从感官数据到符号数据的抽象过程中逐步形成的。对不同媒体来说, 媒体的语义是处于不同层次上的。抽象的程度不同,语义的重点也就不同。 2媒体的空间含义是指什么?媒体的时间含义是指什么?媒体的时空综合是指什么?什么是媒体的时空“上下文”?多媒体信息的空间意义有两种说明。第一种是指表现
9、空间, 特殊是指显示空间的支配,目前在大多数争论中指的都是这一类。其次种空间意义是把环境中各种表达信息的媒体按相互的空间关系进行组织,全面整体的反映信息的空间结构,而不仅仅是零散的信息片断。媒体的时间也有两种含义。一是表现所需的时间, 这是全部媒体都需要的。其次种时间意义即同媒体的空间一样,媒体的时间也可以包含媒体在时间坐标轴上的相互关系。媒体的时间关系存在于同步、 实时等很多方面。 空间和时间组成了一个三维的时空坐标系统。时间与空间的联系构成了媒体的时空“上下文”。 3媒体的结合为什么会产生“感觉相乘”的成效?试举几个例子对此加以说明。多媒体的作用在很大程度上是媒体之间结合产生的影响。这种结
10、合可以是低层次的,如在显示窗口中供应多种媒体信息片断, 并将视觉、 听觉相互结合, 造成一种比较适合的媒体表现环境。 也可以是高层次的, 由各种媒体组成完全沉迷的虚拟空间, 但应当如何结合现在仍缺乏理论上的指导。 媒体之间可以相互支持, 也可以相互干扰。 假如媒体之间是相互支持的关可编辑资料 - - - 欢迎下载精品名师归纳总结系,就这种媒体结合所产生的成效就是“感觉相乘”效应。“感觉相乘” 的例子很多, 比如以视听并举的方式传递信息,比仅仅依靠观看或者解说能产 生更好的成效。 为了追求更强的沉迷感,虚拟现实环境的构建往往需要综合考虑视觉、听觉、触觉甚至嗅觉等多种感觉。4. 什么是媒体的语义?
11、什么是隐喻?各种媒体的信息在最低层次上都是二进制位流。 假如仅仅作为信息的简洁通道, 系统不必明白媒体的语义, 但假如要多媒体系统具有对媒体进行挑选、 合成等方面的才能, 就必需给予它媒体的语义学问, 从而使得系统能在媒体之上对媒体进行比较、 挑选和合成。 媒体被给予的媒体的语义学问即为媒体的语义。在与多媒体系统交互的过程中,人所依据的是关于这种交互的概念模型,也称心智模型(MentalModel )。这种概念模型的建立往往需要培训和体会,不易于被用户所接受。一种较好的方法是模拟人对其他事物的学问和技能,把它们挪到多媒体系统中使用,媒体的多样性为这种模拟供应了一个很好的基础,这种模拟,就是隐喻
12、技术。5. 争论声音心理学对声音的处理睬带来哪些好处?试举例加以说明。说明掩蔽、 临界频带、相位对声音的影响。各种声音可以相互掩蔽, 也就是说一种声音的显现可能使得另一种声音难于听清。纸张的沙沙声、鼓掌声、咳嗽声等往往会掩盖说话声和音乐声。一般说来,在掩蔽音条件下,要3听清被测量的测验音, 就必需提高测验音的强度。 由于声音的掩蔽成效, 可以欺诈人的听觉。在频率的某一临界区里, 各种声音强度是相互作用的, 合成声音的响度由这些频率共同打算, 但在临界区内不会转变。假如超出临界区,声音的响度不再相互作用,随频率而变。这个临界区就是临界频带,其宽度视其中心频率而定。从声音的波形来看, 声音的起点和
13、方向也要反映声音的特性,这就是声音的相位。当两个声音相同而相位完全相反时,它们将相互抵消。 当两个声音相同而且相位也相同时,声音就会得到加强。 相位的确定对于多声道声音系统的设计特别重要,它可以应用在回声的排除、会议系统的声音设计上等。6. 声音的数字化过程是怎样的?什么是声音的符号化?声音在真实世界是模拟的,时间和幅度上是连续的,声音的数字化主要包括采样、量化、编码等步骤。波形声音可以把音乐、 语音都进行数字化并表示出来,但这并没有将它看成音乐和语音。对声音的抽象化(即符号化)表示包括两种类型,一种是音乐、一种是语音。声音的符号化即将声音转变为符号序列的过程。 7声音的三维化处理所基于的原理
14、是什么?双工理论的作用在何时表达得较为明显、何时又会失效?耳廓模型的建立是为了达到什么样的目标?声音的三维化处理基于的原理是双工理论。人耳对声音定位的特性, 通过大脑的综合作用后,对有差别的声音信号进行了相对于空间位置的定位。很明显, 假如按此方法使用运算机向人耳供应不同的声音,人的大脑也会综合出声音的位置信息。双工理论过于简洁, 这一理论实际上是处于一个较抱负的状态下,即无反射、 无折射和单频率等, 但实际上人耳所处的环境比双工理论描述的环境要复杂得多。依据双工理论, 人耳应没有在垂直平面的定位才能,不能够区分前后, 由于在这些情形下两耳间声音的到达时间差ITD 和两耳间声音的强度差IID
15、都几乎为零。而实际上,人耳的确具有这方面的才能,这就是耳廓的作用。耳廓模型的建立, 主要为了模拟出人耳的听觉特性,具体来讲, 就是模拟如何解读声源的本身信号特点、 声源的空间三维位置、 声源所处的环境这3 个因素。 建立正确的耳廓模型有利可编辑资料 - - - 欢迎下载精品名师归纳总结于制造三维的虚拟听觉空间。8视觉心理学对视觉信息的处理帮助表达在哪些的方?如何利用这些心理学特性?虽然光的物理特性与心理知觉有关,但并不是线性的。 把物理波的强度加倍, 感受到的亮度却并不加倍。 对光的色调和亮度的感觉不仅和它的频率与强度有关,而且仍和它显现的背景有关,和同时显现的四周光有关。即使是最简洁的物理因
16、素也要受到神经系统的复杂分析,从而产生出复杂的心理知觉反应。将物理性质和心理知觉区分开来,就是特别重要的。 在多媒体信息系统的设计过程中,充分考虑视觉心理学特性,能供应更好的人机交互方式。 9试完整的推导出单视点坐标系中、两眼坐标系中三维空间的一点P( x,y,z)投影到 z=0平面上的二维坐标。以视点为投影中心, 将三维物体的点投影于显示器的投影平面上,便在该平面上产生三维物 体的像。下图所示是投影的示意,其中投影中心在坐标系的A 点,其坐标为A( 0,0,.d), d 为视点到投影平面的距离,也就是人眼到显示器的距离。P( x,y,z)是三维空间中一点, P在 z=0 平面上的投影坐标为Q
17、(X,Y ,0),设点 P、Q 在 y=0 上的投影分别为M 、N, M 、N在 x=0 上的投影分别为 R、O。4依据相像三角形原理有:ARAOANAMPNQM.即, zddARAOyY .从而有 Y = y/ ( 1+z / d ),同理有 X = x/ ( 1+z / d )。投影变换原理10. 如何测定手腕的转动?人体的转动和头部的转动如何测定?为了测量手部的转动,需要两个发射器,测量出两个发射器t1、t2 的空间坐标,就可以依据三角函数确定转动的角度:tg( .)=( Yt1.Yt2 ) /( Xt1.Xt2 ) tg( .)=( Zt1.Zt2 )/(Yt1.Yt2 ) tg( r
18、) =( Xt1.Xt2 ) /(Zt1.Zt2 )人体的转动和头部的转动可用类似的方法测定。区分在于发射器t1、t2 安装的位置不同。11. 通过系统制造出力的反馈成效和触觉成效可用于何处?试举例说明。通过力感反馈装置,可以直接供应力的反馈,供应使人感受到的物理力。例:虚拟手术中,手术刀的力反馈装置, 能使虚拟手术的实施者受训训练人员更加精确的实施手术。驾驶、 射击、格斗等嬉戏中,力反馈装置的引入,能大大提高玩家的沉迷感。触觉反馈能够让人体区分出不同物体的质感和纹理结构。触觉反馈可以在商品虚拟展现、数字消遣等多个领域得到应用。 12上网搜寻有关数据手套、数据头盔、数据服装等设备及技术的有关内
19、容,写出该设备的介绍性报告。略。5第 3 章 多媒体数据压缩1. 如何衡量一种数据压缩方法的好坏?多媒体数据存在哪些类型的冗余?评判一种数据压缩技术的性能好坏主要有3 个关键的指标: 压缩比、 图像质量、 压缩和解压的速度。期望压缩比要大,即压缩前后所需的信息储备量之比要大。复原成效要好,尽可能的复原原始数据。 实现压缩的算法要简洁, 压缩、解压速度快, 尽可能的做到实时压缩解压。除此之外仍要考虑压缩算法所需要的软件和硬件。一般而言,多媒体数据中存在的数据冗余类型主要有以下几种。(1) 空间冗余可编辑资料 - - - 欢迎下载精品名师归纳总结在同一幅图像中, 规章物体和规章背景的表面物理特性具
20、有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。(2) 时间冗余时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其他帧图像中的物体或场景重构出来。音频的前后样值之间也同样有时间冗余。(3) 信息熵冗余信源编码时, 当安排给第 i 个码元类的比特数byi= .lgpi时,才能使编码后单位数据量等于其信源熵, 即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特安排不能达到正确。实际单位数据量dHS ,即存在信息冗余熵。(4) 视觉冗余人眼对于图像场的留意是非匀称的,人眼并不能察觉图像场的全部变化。事实上人类视觉的一般辨论才能为 26
21、灰度等级, 而一般图像的量化采纳的是28 灰度等级,即存在着视觉冗余。(5) 听觉冗余人耳对不同频率的声音的敏锐性是不同的,并不能察觉全部频率的变化,对某些频率不必特殊关注,因此存在听觉冗余。(6) 其他冗余包括结构冗余、学问冗余等。2. 数据压缩技术可分为几大类?每类有何主要特点?依据解码后数据与原始数据是否完全一样进行分类,压缩方法可被分为有失真编码和无失真编码两大类。有失真压缩法压缩了熵,会削减信息量, 而缺失的信息是不能再复原的,因此这种压缩法是不行逆的。 无失真压缩法去掉或削减了数据中的冗余,但这些冗余值是可以重新插入到数据 中的, 因此冗余压缩是可逆的过程。有失真压缩法的冗余压缩取
22、决于初始信号的类型、前后的相关性、信号的语义内容等。由于答应肯定程度的失真,可用于对图像、声音、动态视频等数据的压缩。如采纳混合编码的JPEG 规范,它对自然景物的灰度图像,一般可压缩几倍到十几倍, 而对于自然景物的彩色图像,压缩比将达到几十倍甚至上百倍。采纳 ADPCM编码的声音数据,压缩比通常也能做到4 18 1。压缩比最为可观的是动态视频数据,采用混合编码的DVI 多媒体系统,压缩比通常可达50 1 1001。无失真压缩法不会产生失真,从信息语义角度讲, 无失真编码是泛指那种不考虑被压缩信息的性质的编码和压缩技术,它是基于平均信息量的技术,并把全部的数据当作比特序列,而不是依据压缩信息的
23、类型来优化压缩。也就是说,平均信息量编码忽视被压缩信6息语义内容。 在多媒体技术中一般用于文本、数据的压缩, 它能保证百分之百的复原原始数据。但这种方法压缩比较低,如LZW编码、行程编码和霍夫曼(Huffman )编码的压缩比一般为 21 5 1。3. DPCM 、 ADPCM编码的基本原理是什么?DCT 变换编码是如何压缩数据的?DPCM 和 ADPCM是两种典型的猜测编码。猜测编码是依据原始的离散信号之间存在着一定关联性的特点, 利用前面的一个或多个信号对下一个信号进行猜测,然后对实际值和猜测值的差(猜测误差)进行编码。假如猜测比较精确,那么误差信号就会很小(通常采纳均方误差最小)。这样一
24、来,在同等精度要求的条件下,就可以用比较少的数码进行编码,达到压缩数据的目的。DCT 变换编码压缩数据有3 个步骤:变换、变换域采样和量化。把信号映射到另一个域,使信号在变换域里简洁进行压缩,变换后的样值更独立和有序。在变换编码系统中,用于量化一组变换样值的比特总数是固定的,它总是小于对全部变换样值用固定长度匀称量化进行可编辑资料 - - - 欢迎下载精品名师归纳总结编码所需的总数, 所以量化使数据得到压缩, 是变换编码中不行缺少的一步。 为了取得中意的结果, 某些重要系数的编码位数比其他的要多, 某些系数干脆就被忽视了。 在对量化后的变换样值进行比特安排时,要考虑使整个量化失真最小。4. H
25、uffman 编码有何特点?行程编码是如何编码的?Huffman 编码是一种对统计独立信源能达到最小平均码长的编码方法, 即正确码, 它完全依据字符显现概率来构造, 各码字长度严格依据所对应符号显现概率的大小逆序排列, 具有即时性和惟一可译性。行程编码有多种编码方式,对于 0 显现较多, 1 较少显现(或反之)的信源数据,可以对 0的连续长度(或 1 的连续长度)进行编码,1(或 0)保持不变。而对于0、1 交替显现的数据,可以分别对 0 的连续长度和 1 的连续长度编码。这种编码适合于0、1 成片显现的数据的压缩。 为了保证解压缩时保持颜色同步,全部的数据行以白色行程代码字集开头。假如实际的
26、扫描线从黑色行程开头,那么假设起始有白色的0 行程。黑色或白色行程由规定的代码字来定义。 代码字有两种类型:终止代码字和组成代码字。每个行程由 0 个或更多的组成代码字和一个确定的终止代码字来表示。在0 63 范畴内的行程由相应的终止代码字编码。64 2623(2560+63)范畴内的行程第一由组成代码字编码,它表示最接近、但不大于所要求的行程, 后再跟终止代码字。行程大于或等于 2624 时, 第一由组成代码 2560 编码。假如行程的剩余部分仍大于2560,就产生附加的组成代码2560,直到行程的剩余部分少于2560, 再按前述方法编码。 假如一行的行程总量不等于图像宽度域中的值,就被认为
27、是不行复原的 错误。5. 常见的声音压缩规范有哪些?它们分别采纳什么压缩方法? 常见的声音压缩规范有:(1) 电话质量的语音压缩规范国际上从 ITU-T 最初的 G.711 使用 PCM 编码规范开头, 已制定了一系列的语音压缩编码的 规范。 这些压缩规范中充分利用了线性猜测技术、矢量量化技术和综合分析技术,典型的规范和算法有 G.721 采纳 ADPCM 、码本鼓励线性猜测编码(CELP )、短时延码本鼓励线性猜测编码( LD-CELP )、长时线性猜测规章码鼓励(RPE-LTP )、矢量和鼓励线性猜测编码(VSELP )等。下表为 ITU 建议的用于电话质量的语音压缩规范。7ITU 建议的
28、用于电话质量的语音压缩规范规范说 明G.711采纳 PCM,采样速率为8kHz ,量化位数为 8bit ,对应的比特流速率为64kbit/s 。使用了非线性量化技术G.721将 64kbit/s 的比特流转换成 32kbit/s 的流,基于 ADPCM 。每个数值差分用4 位编码,采样率为 8kHzG.723一种以 24kbit/s 运行的基于 ADPCM 的有损压缩规范G.728采纳 LD-CELP压缩技术。比特率为16kbit/s,带宽限于 3.4kHz 。音质与 G.721 规范相当(2) 调幅广播质量的音频压缩规范调幅广播质量音频信号的频率范畴是50Hz 7kHz ,又称“ 7kHz
29、音频信号”,当使用 16kHz的抽样频率和14bit 的量化位数时,信号速率为224kbit/s 。采纳 G.722 规范进行压缩。可编辑资料 - - - 欢迎下载精品名师归纳总结(3) 高保真立体声音频压缩规范目前国际上比较成熟的高保真立体声音频压缩规范为“MPEG 音频”。6. 常用的图像和视频压缩规范有哪些?它们分别采纳什么压缩方法?静止图像压缩规范有JPEG 规范和 JPEG 2000 规范等,其中JPEG 的压缩方法包括:(1) JPEG 的无损猜测编码算法(2) JPEG 的基于 DCT 的有损编码算法而 JPEG 2000 的压缩改用以离散小波变换算法为主的多解读编码方式, 仍将
30、彩色静态画面采纳的 JPEG 编码方式、 2 值图像采纳的 JBIG( Joint Binary Image Group )编码方式及低压缩率采纳 JPEGLS 统一起来,成为对应各种图像的通用编码方式。视频压缩规范有MPEG压缩规范、 H.26L视频编码规范等。MPEG压缩规范中, MPEG-1是以两个基本技术为基础的。一是基于1616 子块的运动补偿,可以削减帧序列的时域冗余度。二是基于DCT 的压缩技术,削减空域冗余度。MPEG-2 规范的压缩编码系统编码有两种方法,其编码输出包括传送流和程序流两种定义流。传送流和协议ISO/IEC11172-1系统定义的流相像。程序流是一种用来传送和储
31、存一道程序的编码数据或其数据的数据流。MPEG-4 采纳基于内容的压缩编码,将一幅图像依据内容分块,如图像的场景、画面上的物体被分割成不同的子块,将感爱好的物体从场景中截取出来,进行编码处理。H.26L 是一种高效的压缩方法,它集中了以往规范的优点,并吸取了规范制定中积存的体会。H.26L 供应包传输网中处理包丢失所需的工具。H.26L 在系统层面上提出了一个新的概念,在视频编码层( Video Coding Layer ,VCL )和网络适配层( Network Adaptation Layer ,NAL )之间进行概念性分割, 前者是视频内容的核心压缩内容的表述,后者是通过特定类型网络进行
32、传送的 表述。这样的结构便于信息的封装和对信息进行更好的优先级掌握。7. JPEG 规范的基本系统中压缩过程有哪几步?每步是如何工作的? JPEG 基本系统只采纳次序工作方式,其编码的简化框图如下图所示。有损压缩编码框图8压缩过程如下: 块预备。 块预备是将一帧图像分成8 8 的数据块。 假设一个彩色图像由3 种重量: 光亮度 Y 和两个色差 U 和 V 表示,图像的大小为480 行,每一行有640 个像素。假如假设色度分解为 41 1,就亮度重量就是一个640 480 的数值矩阵,色差重量是一个320 240 的数值矩阵。 DCT 变换。 JPEG 将源数据图像分成88 大小的子块后,进行D
33、CT 变换。 量化。为了达到压缩数据的目的,DCT 系数需作量化。 JPEG 的量化采纳线性匀称量化器。 DCT 系数的编码。 JPEG 中对 DC 系数采纳 DPCM 编码,即对相邻块之间的DC 系数的差值进行编码。 熵编码。 JPEG 建议使用两种基于统计特性的熵编码:Huffman 编码和自适应二进制算术编码。可任选一种编码对第一个字节进行编码,其次个幅值字节不进行编码,仍旧直接传送。8. MPEG规范中削减时间冗余量的方法有哪些?为了削减时间冗余量, MPEG 将 1/30s 的时间间隔的帧序列电视图像,以3 种类型的图像格式表示:内码帧( I)、猜测帧( P)和插补帧( B)。帧间的
34、信息用运动补偿的方法确定。运 动补偿有两种算法,分别是运动补偿猜测法和运动补偿插补法。(a) 运动补偿猜测法画面上的运动部分在帧与帧之间必定有连续性,猜测法依据这一特性,将当前的图像画面看作是前面某时刻图像的位移,位移的幅度和方向在图像画面的各处可有不同。因此, 利用反可编辑资料 - - - 欢迎下载精品名师归纳总结映运动的位移信息和前面某时刻的图像,可以猜测出当前的图像。(b) 运动补偿插补法用插补的方法进行运动的补偿,可以大幅度的压缩运动图像的信息。在时域中插补运动补偿是一个多辨论率技术,可以以1/10s 或 1/15s 的时间间隔取出参考子图,然后对这两个参考子图之间的图像,依据运动的规
35、律得到1/30s 时间间隔的各个插补子图。只要对参考子图及反映运动规律的信息进行编码,就可以得到帧率为30 帧/秒的全运动视频图像。9. MPEG规范系列已有哪些压缩规范?各有什么特点?适合用于什么场合下的数据压缩?MPEG( Motion Picture Experts Group ),已推出了 MPEG(或 MPEG-1 )、MPEG-2 、MPEG-4 等系列规范。(1) MPEG-1 压缩规范MPEG-1 规范(ISO/IEC11172- )的目标是以约 1.5Mbit/s 的速率传输电视质量的视频信号, 亮度信号的辨论率为360 240,色度信号的辨论率为180 120,每秒 30
36、帧。MPEG-1 视频压缩技术是以两个基本技术为基础的。一是基于1616 子块的运动补偿,可以削减帧序列的时域冗余度。二是基于DCT 的压缩技术,削减空域冗余度。在MPEG 中, 不仅在帧内使用 DCT ,而且对帧间猜测误差也作DCT ,以进一步削减数据量。MPEG-1 规范包括 MPEG 系统( ISO/IEC11172-1 )、MPEG 视频( ISO/IEC11172-2 )、MPEG音频( ISO/IEC11172-3 )和测试验证(ISO/IEC11172-4 ) 4 部分内容。所以 MPEG 涉及的问题是视频压缩、音频压缩及多种压缩数据流的复合和同步问题。(2) MPEG-2 压缩
37、规范MPEG-2 规范的系统功能是将一个或更多的音频、视频或其他的基本数据流合成单个或多个数据流,以适应于储备和传送。MPEG-2 系统支持五项基本功能分别是:解码时多9压缩流的同步、 将多个压缩流交错成单个的数据流、解码时缓冲器初始化、 缓冲区经管和时间识别。 MPEG-2 规范的压缩编码系统是将视频和音频编码算法结合起来开发的。MPEG-2 视频体系的视频重量的位速率范畴大约为2Mbit/s 15Mbit/s 。MPEG-2 视频体系要求保证与MPEG-1视频体系向下兼容,并且同时应力求满意数字储备媒体、可视电话、数字电视、 高清楚度电视 ( HDTV )、通信网络等领域的应用。 辨论率有
38、低 ( 352 288)、中(720480)、次高( 1440 1080)、高( 1920 1080)等不同档次,压缩编码方法也从简洁到复杂有不同等级。MPEG-2规范具体的表达了数字储备媒体和数字视频通信中的图像信息的编码描述和解码过程。它支持固定比特率传送、可变比特率传送、随机拜访、信道跨过、分级解码、比特流编辑以及一些特殊功能, 例如: 快进播放、 快退播放、 慢动作、 暂停和画面凝固等。MPEG-2视频规范与 ISO/IEC11172-2 向前兼容, 并与 EDTV 、HDTV 和 SDTV 格式向上或向下兼容。MPEG-2 规范包括 MPEG 系统、 MPEG 视频、 MPEG 音频
39、和一样性 4 部分内容,是运动图像及其伴音的通用编码国际规范。 MPEG-2 规范克服并解决了 MPEG-1 规范不能满意的日益增长的多媒体技术、数字电视技术、多媒体辨论率和传输率等方面技术要求的缺陷。(3) MPEG-4 压缩规范MPEG-4 采纳基于内容的压缩编码,将一幅图像依据内容分块,将感爱好的物体从场景中截 取出来, 进行编码处理。 MPEG-4 具有高速压缩、 基于内容交互和基于内容分级扩展等特点, 并且具有基于内容方式表示的视频数据。MPEG-4 在信息描述中首次采纳了对象(Object ) 的概念。视频对象的构成依靠于具体应用和系统环境。MPEG-4 规范满意了随着网络和通信技
40、术的迅猛进展、交互式运算机和交互性电视的逐步应可编辑资料 - - - 欢迎下载精品名师归纳总结用和视频音频数据的综合服务的进展,对运算机多媒体数据压缩编码的越来越高的要求。10. H.26L 规范的压缩编码有什么特点?(1) 帧内猜测为了提高压缩效率, 在帧内编码时也供应了多种猜测编码模式。对于亮度块支持两种形式的 帧内猜测编码, 即 9 种 4 4 块猜测模式和 4 种 16 16 宏块猜测模式, 使猜测更精确, 编码效率更高。(2) 帧间猜测补偿运动补偿块的大小范畴从 1616 到 44 有多种挑选。并支持 1/4 像素精度运动猜测。支持多参考帧, 最多可以到 5 个参考帧, 由此可以更有
41、利于帧间猜测, 削减帧间猜测所得残差编码的比特数,提高编码效率。(3) 具有块滤波器在猜测环中加入了去块效应滤波器,对相邻块的边界像素进行滤波,从而降低块的边界效应, 边界处连接更自然,图像更细腻,主观质量更好。(4) 变换编码采纳 4 4 块的整数变换作为基本变换编码,算法简洁,速度快,无运算偏差。(5) 熵编码采纳两种熵编码方式,一种是基于通用变长编码(UVLC ),另一种是基于上下文的自适应二进制算术编码( CABAC ),提高了压缩率。10第 4 章 多媒体硬件环境1. 试述光储备的类型及主要原理。常用的光储备系统有只读型、一次写型和可重写型光储备系统3 类。只读型光盘包括 LV 和
42、CD-ROM ( Compact Disc-Read Only Memory)等。 CD-ROM只读式压缩光盘, 其技术来源于激光唱盘, 外形也类似于激光唱盘,能够储备 650MB 左右的数据。用户只能从 CD-ROM 读取信息,而不能往盘上写信息。CD-ROM 中的内容在光盘生成时就已经打算,而且不行转变。CD-ROM盘常用于储备固定的软件、数据和多媒体演示节目。CD-ROM 驱动器除了能读出CD-ROM 盘外, 仍可以用于读取激光唱盘以及柯达激光照片的信息。一次写( Write Once Read Many ,WORM )光储备系统可一次写入, 任意多次读出。 与 CD-ROM相比,它具有
43、由用户自己确定记录内容的优点。可重写光盘( Rewritable或 Erasable, E-R/W )像硬盘一样可任意读写数据。它又分磁光型(Magnetic Optical , MO )和相变型( Phase Change,PC)两种形式。2. CD-ROM 、CD-R 、CD-RW 三种光驱的差别有哪些?CD-ROM 是只读型光盘的缩写, 其驱动器由光头、 聚焦伺服、 道跟踪伺服、 CLV 伺服、EFM 解调、错误检测和校正处理 6 个部分组成。 CD-ROM 驱动器除了能读出 CD-ROM 盘外,仍可以用于读取激光唱盘以及柯达激光照片的信息。CD-R 是一次写、多次读的可刻录光盘系统。C
44、D-R 刻录是将刻录光驱的写激光聚焦后,通过 CD-R 空白盘的聚碳酸脂层照耀到有机染料(通常是箐蓝或酞箐蓝染料)的表面上, 激光照耀时产生的热量将有机染料烧熔,并使其变成光痕。CD-RW 是一种可改写的 CD ,其中 RW 是 ReWritable 的缩写。 CD-RW 的改写性是其最大优点,反射率仅为 15%-20% ,比较小,因而旧的CD-ROM 驱动器不能读出。3. 什么是 MIDI ?它与波形音频的本质区分是什么?MIDI ( Musical Instrument Digital Interface)是指乐器数字接口,是数字音乐的国际规范。任何电子乐器,只要有处理MIDI消息的微处理
45、器,并有合适的硬件接口,都可以成为一个可编辑资料 - - - 欢迎下载精品名师归纳总结MIDI 设备。 MIDI 消息是乐谱的一种数字式描述。与波形声音相比, MIDI 数据不是声音而是指令, 所以它的数据量要比波形声音少得多。 MIDI 的另一个特点是, 由于数据量小, 所以可以在多媒体应用中与其他波形声音协作使用, 形成伴乐的成效。对 MIDI 的编辑也很敏捷,在音序器的帮忙下,用户可以自由的转变音调、音色等属性,直到找到自己想要的成效。波形文件就很难做到这一点。但是, MIDI 的声音尚不能做到在音质上与真正的乐器完全相像,在质量上仍需要进一步提高。 MIDI 也无法模拟出自然界中其他非乐曲类声音。4. 视频卡与音频卡的核心部件是什么?视频卡与音频卡的核心部件是编解码芯片,主要完成视频或音频信号的模数/数模转换,压缩/ 解压缩等功能。从结构上分,音频卡可分为模数转换电路和数模转换电路两部分,模数转换电路负责将麦克风等声音输入设备采到的模拟声音信号转换为电脑能处理的数字信号。而数模转换电路负责将电脑使用的数字声音信号转换为喇叭等设备能使用的模拟信号。一般音频卡由以下部件组成: MIDI 输入 /输出电路。 MIDI 合成器芯片,用来把CD 音频输入与线输入相混合电11路。带有脉冲编码调制电路的模数转换器,用于把模拟信号转换为数字信号以生成波形文件。 用来压缩和解
限制150内