字元编码 编辑
字符编码、字集码是把字符集中的字符编码为指定集合中某一对象,以便文本计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码ASCII。其中,ASCII将字母、数字和其它符号编号,并用7位元二进制来表示这个整数。通常会额外使用一个扩充的位元,以便于以1个字节的方式存储。
1
相关
UTF-8是一种针对Unicode的可变长度字元编码,也是一种前缀码。它可以用一至四个字节对Unicode字符集中的所有有效编码点进行编码,属于Unicode标准的一部分,最初由肯·汤普逊和罗布·派克提出。由于较小值的编码点一般使用频率较高,直接使用Unicode编码效率低下,大量浪费内存空间。UTF-8就是为了解决向后兼容ASCII码而设计,Unicode中前128个字符,使用与ASCII码相同的二进制值的单个字节进行编码,而且字面与ASCII码的字面一一对应,这使得原来处理ASCII字元的软件无须或只须做少部分修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他储存装置或传送文字优先采用的编码方式。
代码页437是始祖IBM PC或MS-DOS使用的字元编码。又名为CP437、OEM 437 PC-8、或MS-DOS Latin US。该字集包含ASCII由32–126的字码、附加符号、一些希腊字母、图示以及制图符号。其有时也称为“OEM字型”或“high ASCII”或“EASCII”。
本条目列出Unix输入法。输入法是一个输入字元编码内的字词和符号的方法。
本条目列出Unix输入法。输入法是一个输入字元编码内的字词和符号的方法。
中文标准交换码,编号CNS 11643,旧名国家标准中文交换码,是中华民国政府为资讯交换而制定的标准字元编码方案,与CCCII同属于中文交换码。CSIC基于ISO 2022定义,和ASCII相容。EUC是其EUC版本。
中文标准交换码,编号CNS 11643,旧名国家标准中文交换码,是中华民国政府为资讯交换而制定的标准字元编码方案,与CCCII同属于中文交换码。CSIC基于ISO 2022定义,和ASCII相容。EUC是其EUC版本。
中文标准交换码,编号CNS 11643,旧名国家标准中文交换码,是中华民国政府为资讯交换而制定的标准字元编码方案,与CCCII同属于中文交换码。CSIC基于ISO 2022定义,和ASCII相容。EUC是其EUC版本。
代码页437是始祖IBM PC或MS-DOS使用的字元编码。又名为CP437、OEM 437 PC-8、或MS-DOS Latin US。该字集包含ASCII由32–126的字码、附加符号、一些希腊字母、图示以及制图符号。其有时也称为“OEM字型”或“high ASCII”或“EASCII”。
代码页437是始祖IBM PC或MS-DOS使用的字元编码。又名为CP437、OEM 437 PC-8、或MS-DOS Latin US。该字集包含ASCII由32–126的字码、附加符号、一些希腊字母、图示以及制图符号。其有时也称为“OEM字型”或“high ASCII”或“EASCII”。
双字节字元集是指电脑的字元编码中,使用了两个字节的所有字元集合。这种字元集以汉语、日语和韩语的字元最具代表性,所以有时也专指CJK的字元集。