字元编码 - The mini wiki

UTF-8是一种针对Unicode的可变长度字元编码，也是一种前缀码。它可以用一至四个字节对Unicode字符集中的所有有效编码点进行编码，属于Unicode标准的一部分，最初由肯·汤普逊和罗布·派克提出。由于较小值的编码点一般使用频率较高，直接使用Unicode编码效率低下，大量浪费内存空间。UTF-8就是为了解决向后兼容ASCII码而设计，Unicode中前128个字符，使用与ASCII码相同的二进制值的单个字节进行编码，而且字面与ASCII码的字面一一对应，这使得原来处理ASCII字元的软件无须或只须做少部分修改，即可继续使用。因此，它逐渐成为电子邮件、网页及其他储存装置或传送文字优先采用的编码方式。

代码页437是始祖IBM PC或MS-DOS使用的字元编码。又名为CP437、OEM 437 PC-8、或MS-DOS Latin US。该字集包含ASCII由32–126的字码、附加符号、一些希腊字母、图示以及制图符号。其有时也称为“OEM字型”或“high ASCII”或“EASCII”。

本条目列出Unix输入法。输入法是一个输入字元编码内的字词和符号的方法。

中文标准交换码，编号CNS 11643，旧名国家标准中文交换码，是中华民国政府为资讯交换而制定的标准字元编码方案，与CCCII同属于中文交换码。CSIC基于ISO 2022定义，和ASCII相容。EUC是其EUC版本。

代码页437是始祖IBM PC或MS-DOS使用的字元编码。又名为CP437、OEM 437 PC-8、或MS-DOS Latin US。该字集包含ASCII由32–126的字码、附加符号、一些希腊字母、图示以及制图符号。其有时也称为“OEM字型”或“high ASCII”或“EASCII”。

双字节字元集是指电脑的字元编码中，使用了两个字节的所有字元集合。这种字元集以汉语、日语和韩语的字元最具代表性，所以有时也专指CJK的字元集。