字符编码教学资料.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《字符编码教学资料.ppt》由会员分享,可在线阅读,更多相关《字符编码教学资料.ppt(49页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、1字字 符符 编编 码码第一页,共49页。2提提 纲纲一 计算机中字符的表示(biosh)(ASCII码)二 计算机中中文字符的表示(biosh)第二页,共49页。3概 述在计算机中,各种信息都是以二进制编码的形式存在在计算机中,各种信息都是以二进制编码的形式存在 不管是文字、图形、声音、动画,还是电影等信息,不管是文字、图形、声音、动画,还是电影等信息,在计算机中都是以和组成的二进制代码表示在计算机中都是以和组成的二进制代码表示计算机之所以能区别计算机之所以能区别(qbi)这些不同的信息,是因为这些不同的信息,是因为它们采用的编码规则不同它们采用的编码规则不同 比如:同样是文字,英文字母与汉
2、字的编码规则就比如:同样是文字,英文字母与汉字的编码规则就不同,前者采用单字节的不同,前者采用单字节的ASCII码,后者采用双字节的码,后者采用双字节的汉字内码汉字内码但随着需求的变化,这两种编码有被统一的但随着需求的变化,这两种编码有被统一的UNICODE码(由码(由Unicode 协会开发的能表示几乎世界上所有书写协会开发的能表示几乎世界上所有书写语言的字符编码标准)所取代的趋势语言的字符编码标准)所取代的趋势第三页,共49页。一、计算机中字符(z f)的表示(ASCII码)wASCII(American Standard Code for Information Interchange,
3、美国标准信息(xnx)交换码)规定了常用的数字、字符的编码。标准ASCII码采用7位二进制编码,对应的ISO标准为ISO646标准,最多可以表示128个字符。每个字符可以用一个字节表示,字节的最高位为0。第四页,共49页。5ASCII码表(二进制)高高3位位低低4位位00000101001110010111011100000000NULDLESP0Pp00010001SOHDC1!1AQaq00100010STXDC22BRbr00110011ETXDC3#3CScs01000100EOTDC4$4DTdt01010101ENQNAK%5EUeu01100110ACKSYN&6FVfv0111
4、0111BELETB7GWgw10001000BSCAN(8HXhx10011001HTEM)9IYiy10101010LFSUB*:JZjz10111011VTESC+;Kk11001100FFFS,Nn11111111SIUS/?O_oDEL第五页,共49页。基本(jbn)ASCII码字符的分类n显示显示(xinsh)字字符符n范围为范围为33126,共,共94个,指能从键盘个,指能从键盘输入、可以显示输入、可以显示(xinsh)和打印和打印的字符。的字符。n n控制字符控制字符n 范围是范围是032和和127,共共34个,主要用于个,主要用于控制输入控制输入(shr)、输出设备。输出设备
5、。6第六页,共49页。字符字符ASCII编码编码十进制值十进制值控制字符0000,00000010,0000和0111,1111032,12732,1270 90 900110011,0000000000110011,10011001 48485757AZAZ01000100,0001000101010101,101010106590a za z0110,00010111,101097122符号其余32个基本ASCII码字符(z f)的内容第七页,共49页。解读基本ASCII码字符(z f)内容w第032号及第127号共34个,为非打印(d yn)字符,是控制字符或通讯专用字符,如控制符:LF
6、(换行)、CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等。w第33126号共94个可打印字符,其中第4857号为09十个阿拉伯数字;6590号为26个大写英文字母,97122号为26个小写(xioxi)英文字母,第127个(126号)为“”,其余为一些标点符号、运算符号等。第八页,共49页。从键盘上按键从键盘上按键(n jin)(n jin)输入输入“CHINA”“CHINA”的字串,传送进计算机的,的字串,传送进计算机的,则是则是0100001101000011、0100100001001000、010010010
7、1001001、0100111001001110、0100000101000001这五这五个二进制数字串。个二进制数字串。比较字符比较字符ASCIIASCII码值的大小码值的大小 空格标点符号数字大写字母小写字母空格标点符号数字大写字母小写字母十进制数字符号的十进制数字符号的ASCIIASCII码值与其二进制值的区别码值与其二进制值的区别第九页,共49页。10ASCIIASCII码表示码表示(biosh)vs.(biosh)vs.二进制二进制表示表示(biosh)(biosh)int型数 10000的表示(biosh)内存存储(cn ch)形式0010011100010000二进制形式0011
8、000100110000001100000011000000110000ASCII形式文本存储形式1 0 0 0 0213+210+29+28+24=8192+1024+512+256+16第十页,共49页。关于(guny)最高位若在该位置若在该位置1 1,可表示一些特,可表示一些特殊的符号(图形殊的符号(图形(txng)(txng)符)符)由于由于ASCIIASCII码只用了字节的码只用了字节的七个位,最高位并不使用,七个位,最高位并不使用,所以后来又将最高的一个位所以后来又将最高的一个位也编入这套编码码中,成为也编入这套编码码中,成为八个位的延伸八个位的延伸ASCII(Extended A
9、SCII)ASCII(Extended ASCII)码,码,这套内码加上了许多外文和这套内码加上了许多外文和表格等特殊符号,成为目前表格等特殊符号,成为目前常用的编码。常用的编码。若将传送数据的该位置若将传送数据的该位置1 1,则用于数据传输校验则用于数据传输校验虽然标准虽然标准ASCIIASCII码是码是7 7位编位编码,但由于计算机基本处理码,但由于计算机基本处理单位为字节(单位为字节(1byte=1byte=8bit8bit),所以一般仍以一个),所以一般仍以一个(y)(y)字节来存放一个字节来存放一个(y(y)ASCII)ASCII字符。每一个字符。每一个(y(y)字节中多余出来的一位
10、字节中多余出来的一位(最高位)在计算机内部通(最高位)在计算机内部通常保持为常保持为0 0(在数据传输时(在数据传输时可用作奇偶校验位)。可用作奇偶校验位)。11第十一页,共49页。12关于关于(guny)(guny)数据传输的奇偶校验数据传输的奇偶校验 在计算机的存储单元中,一个ASCII码值占一个字节(z ji)(8个二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节(z ji)中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节(z ji)中1
11、的个数必须是偶数,若非偶数,则在最高位b7添1。第十二页,共49页。第十三页,共49页。14ASCII码表基本(jbn)集(2,10,8,16进制)第十四页,共49页。ASCII码表的扩展(kuzhn)集EASCIIl l扩展扩展ASCIIASCII编码编码(Extended ASCII,(Extended ASCII,延伸美国标准信息交换码延伸美国标准信息交换码)是将是将基本基本ASCIIASCII码由码由7 7位扩充位扩充(kuchng)(kuchng)为为8 8位,表示位,表示256256个字符。个字符。l l 基本基本ASCIIASCII码码:最高位为最高位为0 0,称为基本,称为基本
12、ASCIIASCII码;码;l l 扩充扩充(kuchng)(kuchng)的的ASCIIASCII码:最高位为码:最高位为1 1,扩充,扩充(kuchng)(kuchng)部部分编码范围为分编码范围为10000000111111111000000011111111,相应的十进制数为,相应的十进制数为128255128255l l 用用ASCIIASCII码组成的文件,称为码组成的文件,称为“文本文件文本文件”,”,其扩展名为其扩展名为.TXT.TXT。15第十五页,共49页。16ASCII码表的扩展(kuzhn)集第十六页,共49页。17ASCII码表基本(jbn)集+扩展集(16进制)Mi
13、crosoft WindowsIBM PC DOS第十七页,共49页。18二、计算机中中文字符的表示二、计算机中中文字符的表示汉字汉字(Hnz)(Hnz)交换码交换码 又称又称又称又称“国标码国标码国标码国标码”,即,即,即,即GB2312-1980,GB2312-1980,GB2312-1980,GB2312-1980,是中华人民共和国国家是中华人民共和国国家是中华人民共和国国家是中华人民共和国国家标准汉字交换编码。标准汉字交换编码。标准汉字交换编码。标准汉字交换编码。汉字信息在计算机内部也是以二进制方式存放。由于汉字数汉字信息在计算机内部也是以二进制方式存放。由于汉字数汉字信息在计算机内部
14、也是以二进制方式存放。由于汉字数汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个字节的量多,用一个字节的量多,用一个字节的量多,用一个字节的128128128128种状态不能全部表示出来,因此在种状态不能全部表示出来,因此在种状态不能全部表示出来,因此在种状态不能全部表示出来,因此在1981198119811981年我国颁布年我国颁布年我国颁布年我国颁布(bnb)(bnb)(bnb)(bnb)的信息交换用汉字编码字符集的信息交换用汉字编码字符集的信息交换用汉字编码字符集的信息交换用汉字编码字符集基本集,基本集,基本集,基本集,即准即准即准即准GB2312-80GB2312-80
15、GB2312-80GB2312-80方案中规定用两个字节的十六位二进制表示一个方案中规定用两个字节的十六位二进制表示一个方案中规定用两个字节的十六位二进制表示一个方案中规定用两个字节的十六位二进制表示一个汉字,每个字节都只使用低汉字,每个字节都只使用低汉字,每个字节都只使用低汉字,每个字节都只使用低7 7 7 7位(与位(与位(与位(与ASCIIASCIIASCIIASCII码相同),即有码相同),即有码相同),即有码相同),即有128128=16384128128=16384128128=16384128128=16384种状态。种状态。种状态。种状态。第十八页,共49页。19二、计算机中中
16、文二、计算机中中文(zhngwn)(zhngwn)字符字符的表示的表示汉字交换码汉字交换码 由于由于ASCII码的码的34个控制代码在汉字系统中也要使用,个控制代码在汉字系统中也要使用,为不致为不致(bzh)发生冲突,不能作为汉字编码,发生冲突,不能作为汉字编码,128除去除去34只剩只剩94种,所以汉字编码表的大小是种,所以汉字编码表的大小是9494=8836,用以表,用以表示国标码规定的汉字示国标码规定的汉字6763个(一级汉字,是最常用的汉字,个(一级汉字,是最常用的汉字,按汉语拼音字母顺序排列,共按汉语拼音字母顺序排列,共3755个;二级汉字,属于次个;二级汉字,属于次常用汉字,按偏旁
17、部首的笔划顺序排列,共常用汉字,按偏旁部首的笔划顺序排列,共3008个),数个),数字、字母、符号等字、字母、符号等682个,共个,共7445个。个。第十九页,共49页。20二、计算机中中文字符的表示二、计算机中中文字符的表示汉字汉字(Hnz)(Hnz)交换码交换码 国家标准将每个汉字和图形符号的两个字节分别用两位的十进制编码(不足补),前字节的编码称为区码,后字节的编码称为位码,排列在一个94行94列的二维代码表中,形成区位码表。如“保”字在二维代码表中处于(chy)17区第03位,区位码即为1703D。把区位码按一定的规则转换成的二进制代码叫做信息交换码(简称国标码)。第二十页,共49页。
18、21二、计算机中中文字符的表示二、计算机中中文字符的表示汉字汉字(Hnz)(Hnz)交换码交换码w国标码并不等于区位码,它是由区位码稍作转换得到,其转换国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,方法为:先将十进制区码和位码转换为十六进制的区码和位码,这样就得了一个与国标码有一个相对这样就得了一个与国标码有一个相对(xingdu)位置差位置差(20H)的代码;再将这个代码的第一个字节和第二个字节分)的代码;再将这个代码的第一个字节和第二个字节分别加上别加上20H,就得到国标码。,就得到国标码。w如:如:“保保”字的国标码为(字的
19、国标码为(3123)H,它是经过下面的转换得,它是经过下面的转换得到的:到的:w w w国标码很少直接使用。国标码很少直接使用。第二十一页,共49页。22GB码简介(jin ji)w国标码(GB)是指1981年我国公布的国家标准信息交换用汉字编码字符集基本集,包含:简化汉字,符号,字母(zm),日文假名,共7445个字符;其中包含了6763个汉字,并分作两级:一级为常用字,3755个,按照拼音排序二级为次常用字,3008个,按照部首排序。第二十二页,共49页。23GB码的编码(bin m)空间w一个字符的国标码由两个部分组成,分别是该字符的区号和位号。wGB码规定(gudng)共有94个区,每
20、个区中有94个位。编码空间为:94*94=8836 个码位1 9 区是西文字母、数字、日文假名、图形符号1687区是汉字区,其中 16 55 区 是一级汉字(40*94-5=3755个)56 87 区 是二级汉字(32*94=3008个)1015,8894区是用户自定义区第二十三页,共49页。24GB码区位(q wi)示例01区78位第二十四页,共49页。25GB码区位(q wi)示例(续)第二十五页,共49页。26GB码区位(q wi)示例(续)第二十六页,共49页。27GB码区位(q wi)示例(续)第二十七页,共49页。28GB码区位(q wi)示例(续)第二十八页,共49页。29二、计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 字符 编码 教学 资料
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内