知识小贴士3-4 字符集与字符编码——人类伟大的创想.pdf
《知识小贴士3-4 字符集与字符编码——人类伟大的创想.pdf》由会员分享,可在线阅读,更多相关《知识小贴士3-4 字符集与字符编码——人类伟大的创想.pdf(2页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、科普知识 细节决定成败:知识小贴士 计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进 制数转换之后的结果。通俗的说,按照何种规则将字符存储在计算机中,如a用什么表示,称为 编码;反之,将存储在计算机中的二进制数解析显示出来,称为解码,如同密码学中的加密和解 密。在解码过程中,如果使用了错误的解码规则,则导致a解析成b或者乱码。 字符集(字符集(CharsetCharset) :是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称, 包括各国家文字、标点符号、图形符号、数字等。 字符编码(字符编码(Character EncodingCharacter
2、 Encoding) :是一套法则,使用该法则能够对自然语言的字符的一个集合 (如字母表或音节表) ,与其他东西的一个集合(如号码或电脉冲)进行配对。通常人们用符号集合 (一般情况下就是文字)来表达信息。 常见字符集名称:ASCII 字符集、GB2312 字符集、BIG5 字符集、GB18030 字符集、Unicode 字符 集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种 文字。 ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是 基于拉丁字母的一套电脑编码系统。它主
3、要用于显示现代英语,而其扩展版本 EASCII 则可以勉强显 示其他西欧语言。它是现今最通用的单字节编码系统(但是有被 Unicode 追上的迹象) ,并等同于国 际标准 ISO/IEC 646。ASCII 字符集主要包括控制字符(回车键、退格、换行键等) ;可显示字符(英 文大小写字符、阿拉伯数字和西文符号) 。它最大缺点是只能显示 26 个基本拉丁字母、阿拉伯数目 字和英式标点符号,因此只能用于显示现代美国英语。因此现在的苹果电脑已经抛弃 ASCII 而转用 Unicode。 计算机发明之后的很长一段时间, 只用应用于美国及西方一些发达国家,ASCII 能够很好满足用 户的需求。但是当中国
4、也有了计算机之后,为了显示中文,必须设计一套编码规则用于将汉字转换 为计算机可以接受的数字系统的数。中国专家把那些 127 号之后的奇异符号们(即 EASCII)取消掉, 规定:一个小于 127 的字符的意义与原来相同,但两个大于 127 的字符连在一起时,就表示一个汉 字, 前面的一个字节 (他称之为高字节) 从 0 xA1 用到 0 xF7, 后面一个字节 (低字节) 从 0 xA1 到 0 xFE, 这样我们就可以组合出大约 7000 多个简体汉字了。 在这些编码里, 还把数学符号、 罗马希腊的字母、 日文的假名们都编进去了,连在 ASCII 里本来就有的数字、标点、字母都统统重新编了两
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构
限制150内