《数字媒体及应用》PPT课件.ppt
《《数字媒体及应用》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数字媒体及应用》PPT课件.ppt(41页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第五章第五章 数字媒体及应用数字媒体及应用计算机基础计算机基础计算机基础计算机基础学习目标和要求学习目标和要求 掌握掌握ASCIIASCII字符的编码的规则和特点字符的编码的规则和特点 掌握掌握中文信息存储的特点,中文信息存储的特点,GB2312国标字符国标字符集的构成、集的构成、区位码、机内码和国标码及其关系区位码、机内码和国标码及其关系了解了解BIG5、GBK、GB18030、Unicode等编码等编码了解文本在计算机中的处理过程及相关原理了解文本在计算机中的处理过程及相关原理计算机基础计算机基础计算机基础计算机基础了解图像(了解图像(imageimage)、图形()、图形(graphic
2、sgraphics)的概念)的概念和特点,和特点,熟悉熟悉图像信息在计算机内的表示和处理图像信息在计算机内的表示和处理了解声音、视频信息的表示和应用了解声音、视频信息的表示和应用一、字符编码一、字符编码1 1、西文字符的编码、西文字符的编码 西文信息是由字母、数字、标点符号及一些特殊符西文信息是由字母、数字、标点符号及一些特殊符号组成的号组成的,它们的集合统称为西文字符集。它们的集合统称为西文字符集。ASCIIASCII字符集和字符集和ASCIIASCII码码l 标准标准ASCII(ISO0646):):7位编码,从位编码,从0000000到到1111111,共共128种编码,可用来表示种编码
3、,可用来表示128个不同的字符。个不同的字符。95个可打印字符(常用字母、数字、标点符号等)个可打印字符(常用字母、数字、标点符号等)33个控制字符个控制字符用一个字节存放一个字符的用一个字节存放一个字符的ASCIIASCII码,高位为码,高位为0 0。5.1 文本与文本处理文本与文本处理计算机基础计算机基础计算机基础计算机基础ASCII码的排放顺序:码的排放顺序:1.数字、字母均按自然顺序排列。数字、字母均按自然顺序排列。2.大小写字母的比较,小写字母大于大写字母。大小写字母的比较,小写字母大于大写字母。(A+32=a 65+32=97)3.字母与数字比较,数字字母与数字比较,数字(0-9)
4、的代码均小于字母的代码均小于字母(A-Z)的代码的代码4.空格比数字,标点,字母等常见符号都小。空格比数字,标点,字母等常见符号都小。扩展扩展ASCII码(码(ISO2022)八位二进制表示一个字符,共有八位二进制表示一个字符,共有256个字符,前个字符,前128个等同于标准个等同于标准ASCII,后,后128个均为高位为个均为高位为1的编码的编码形式。形式。2 2、汉字字符的编码、汉字字符的编码 GB2312 GB2312汉字编码汉字编码 GBK GBK汉字内码扩展规范汉字内码扩展规范 GB18030 GB18030编码编码 BIG5BIG5编码编码 UCS/Unicode UCS/Unic
5、ode编码编码 国国家家标标准准局局 19811981年年信信息息交交换换用用汉汉字字编编码码字字符符集集基基本集本集(1 1 1 1)GB2312GB2312GB2312GB2312汉字编码汉字编码汉字编码汉字编码 6763 6763个常用汉字和个常用汉字和682682个非汉字字符个非汉字字符 7445 7445 组成:组成:第一部分:字母、数字和各种符号共第一部分:字母、数字和各种符号共682682个个(统(统称为称为GB2312GB2312图形符号)图形符号)第二部分:第二部分:一级常用汉字一级常用汉字,共,共37553755个,个,按汉语拼音排列按汉语拼音排列 第三部分:第三部分:二级
6、常用字,二级常用字,共共30083008个,个,按偏旁部首排列按偏旁部首排列 汉字区位码:汉字区位码:汉字在代码表中的行号、列号汉字在代码表中的行号、列号 这是一个这是一个二维代码表二维代码表,有,有94行、行、94列列,汉字在代汉字在代码表中的位置用它所处的行号、列号表示:码表中的位置用它所处的行号、列号表示:行号行号 区号区号列号列号 位号位号采用采用双字节双字节编码。编码。例如:例如:“大大”字的区号字的区号2020,位号,位号8383,区位码是,区位码是20 20 8383 用用2 2个字节表示为:个字节表示为:00010100 0101001100010100 01010011 国标
7、码国标码:问题:问题:信信息息通通信信中中,汉汉字字的的区区位位码码与与通通信信使使用用的的控控制制码码(00H00H1FH1FH)发生冲突。发生冲突。解决方案:解决方案:为为了了避避免免冲冲突突,每每个个汉汉字字的的区区号号和和位位号号必必须须分分别别加加上上3232得得到的代码称为汉字的到的代码称为汉字的“国标交换码国标交换码”,用于汉字的传输和交换。,用于汉字的传输和交换。例如例如:“:“大大”字的区号字的区号2020,位号,位号8383区位码区位码 20 83 20 83 二进制表示为:二进制表示为:00010100 0101001100010100 01010011国标交换码国标交换
8、码52 115 52 115 二进制表示为二进制表示为 00110100 01110011 00110100 01110011 机内码:机内码:问题:问题:文文本本中中的的汉汉字字与与西西文文字字符符经经常常是是混混合合在在一一起起使使用用的的,汉汉字字信信息息如如不不予予以以特特别别的的标标识识,它它与与单单字字节节的的标标准准ASCIIASCII码码就就会会混混淆淆不不清。清。解决方法:解决方法:使使表表示示GB2312GB2312汉汉字字国国标标码码的的两两个个字字节节最最高高位位都都置置为为“1 1”。这种汉字编码这种汉字编码,称为称为GB2312GB2312汉字的汉字的“机内码机内码
9、”,存储在计算机中。存储在计算机中。例如:例如:“大大”字字 区位码区位码 20 83 20 83 国标交换码国标交换码 52 115 52 115 二进制表示为二进制表示为 00110100 01110011 00110100 01110011 机内码机内码 180 243 180 243 二进制表示为二进制表示为 10110100 1111001110110100 11110011(B4F3HB4F3H)(1)Q132G1 Q232G2 (区位码(区位码 国标码国标码)总结:区位码总结:区位码,国标码国标码,机内码之间的转换机内码之间的转换假设某个汉字国标码假设某个汉字国标码G1 G2G1
10、 G2(G1 G1 表示第一个字节,表示第一个字节,G2G2表示第表示第二个字节二个字节),区位码),区位码 Q1 Q2 Q1 Q2,机内码,机内码 J1 J2 J1 J2,则:,则:(2)G1128J1 G2128J2 (国标码(国标码 机内码)机内码)19951995年颁布,全称年颁布,全称汉字内码扩展规范汉字内码扩展规范 总计总计2394023940个码位,共收入个码位,共收入2100321003个汉字和个汉字和883883图图形符号形符号 特点:特点:u 双字节编码双字节编码u 简体和繁体汉字在同一个字符集中简体和繁体汉字在同一个字符集中 Windows中文版操作系统、中文版操作系统、
11、Office简体中文版都提简体中文版都提供供GBK汉字的支持。汉字的支持。(2 2 2 2)GBK汉字内码扩充规范(汉字内码扩充规范(GBK-95)目目的的 :建建立立统统一一的的多多文文本本处处理理环环境境,实实现现所所有有字字符符在同一字符集中统一编码在同一字符集中统一编码 优优点点:编编码码空空间间极极大大,能能容容纳纳足足够够多多的的各各种种字字符符集集(1313亿字符)亿字符)缺点缺点:4 4字节的字符编码使存储空间浪费严重字节的字符编码使存储空间浪费严重 实实际际做做法法:UCS-2UCS-2为为其其子子集集,采采用用双双字字节节编编码码,共共有字符有字符4919449194个个(
12、3 3 3 3)UCS/Unicode(UCS/Unicode(UCS/Unicode(UCS/Unicode(通用多通用多通用多通用多8 8 8 8位编码字符集位编码字符集位编码字符集位编码字符集)编码编码编码编码 使用范围使用范围:通行于台湾、香港地区的一个繁体字编码通行于台湾、香港地区的一个繁体字编码 方案,方案,俗称俗称“大五码大五码”。收录内容收录内容:13461 13461个汉字和符号个汉字和符号符号符号408408个个常用汉字常用汉字54015401个个次常用汉字次常用汉字76527652个个(4 4 4 4)BIG5BIG5BIG5BIG5编码编码编码编码计算机基础计算机基础计
13、算机基础计算机基础目的目的:与与GB2312GB2312和和GBKGBK兼容兼容,向向UCS/UnicodeUCS/Unicode过渡。过渡。内容内容:规定了信息交换用的基本图形、字符及其二进制编码规定了信息交换用的基本图形、字符及其二进制编码的十六进制表示的十六进制表示,同时收录了主要的少数民族文字。同时收录了主要的少数民族文字。编码方式编码方式:在在GB2312GB2312和和GBKGBK的基础上进行了扩充,的基础上进行了扩充,采用单字节采用单字节/双双字节字节/四字节三种方式编码四字节三种方式编码,码位数,码位数160160多万。多万。(5 5 5 5)GB18030GB18030GB1
14、8030GB18030汉字编码标准汉字编码标准汉字编码标准汉字编码标准二、二、二、二、文本处理文本处理文本处理文本处理1、文本:文本是基于特定字符集的、具有上下文相关性、文本:文本是基于特定字符集的、具有上下文相关性的一个字符流,每个字符都使用二进制编码表示。的一个字符流,每个字符都使用二进制编码表示。2、文本在计算机中的处理过程、文本在计算机中的处理过程文本展现文本处理(文本处理软件)文本准备电子文本文本编辑(编辑器)格式化的电子文本文本存储与传输计算机基础计算机基础计算机基础计算机基础文本准备文本准备自动识别输入自动识别输入印刷体印刷体识别识别脱机手写体脱机手写体识别识别文本信息的输入文本
15、信息的输入人工输入人工输入键盘键盘输入输入联机联机手写输入手写输入语音语音输入输入 输入码:输入码:中文输入法输入的汉字编码。中文输入法输入的汉字编码。数字编码、字音编码、字形编码、形音编码数字编码、字音编码、字形编码、形音编码定定义义:是是由由一一连连串串的的字字符符组组成成的的,几几乎乎不不包包含含任任何何其其他他格式信息格式信息和和结构信息结构信息,称为纯文本。,称为纯文本。后缀名后缀名.txt txt 特特性性:文文件件体体积积小小,几几乎乎所所有有的的文文字字处处理理软软件件都都能能识识别和处理;不能插入图片、表格、超链接等别和处理;不能插入图片、表格、超链接等.简单文本(纯文本)简
16、单文本(纯文本)简单文本(纯文本)简单文本(纯文本)3 3、文本的分类文本的分类 按是否具有编辑排版格式分:按是否具有编辑排版格式分:丰富格式文本丰富格式文本丰富格式文本丰富格式文本 有格式控制和结构说明信息的文本,如设定字型、字号、有格式控制和结构说明信息的文本,如设定字型、字号、有格式控制和结构说明信息的文本,如设定字型、字号、有格式控制和结构说明信息的文本,如设定字型、字号、颜色等。如:颜色等。如:颜色等。如:颜色等。如:WordWordWordWord的的的的docdocdocdoc格式、格式、格式、格式、Adobe Acrobat Adobe Acrobat Adobe Acroba
17、t Adobe Acrobat 的的的的pdfpdfpdfpdf格式等都格式等都格式等都格式等都是丰富格式文本。是丰富格式文本。是丰富格式文本。是丰富格式文本。RTFRTF格式:格式:格式:格式:一些公司联合提出的一种中间格式。为了便于一些公司联合提出的一种中间格式。为了便于一些公司联合提出的一种中间格式。为了便于一些公司联合提出的一种中间格式。为了便于不同的丰富格式文本能在不同的软件和系统中交换使用不同的丰富格式文本能在不同的软件和系统中交换使用不同的丰富格式文本能在不同的软件和系统中交换使用不同的丰富格式文本能在不同的软件和系统中交换使用 按文本内容的组织方式分:按文本内容的组织方式分:线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字媒体及应用 数字 媒体 应用 PPT 课件
限制150内