字符集 编辑
字符编码、字集码是把字符集中的字符编码为指定集合中某一对象,以便文本计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码ASCII。其中,ASCII将字母、数字和其它符号编号,并用7位元二进制来表示这个整数。通常会额外使用一个扩充的位元,以便于以1个字节的方式存储。
2
相关
国际化域名编码是一种表示Unicode码和ASCII码的有限的字符集。例如中文“上海”会被编码为“fhqz97e”。
GB/T 2312,GB/T 2312–80 或 GB/T 2312–1980 是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,通常简称GB,又称国家标准代码,由中国国家标准化管理委员会于1980年发布,1981年5月1日实施。GB/T 2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB/T 2312。
外字,在中文信息处理中是指给定字符集之外的汉字。源自日语的“表外汉字”。与拉丁语言不同,在东亚表意文字系统如中文、日文中,没有固定数量的字符集。一般字符集只含有8,000到15,000的常用字,另外数万个非常用字、生僻字,往往没有在各国的标准中给予编码。另外一个情况是异体字:一个表意文字在不同的历史时期、地域产生了不同的字形,而一些地名人名等专有名字必须要使用传统的写法,需要使用这些冷僻字形,造成了生僻字问题,日语中称为“外字”问题。
GB/T 2312,GB/T 2312–80 或 GB/T 2312–1980 是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,通常简称GB,又称国家标准代码,由中国国家标准化管理委员会于1980年发布,1981年5月1日实施。GB/T 2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB/T 2312。
外字,在中文信息处理中是指给定字符集之外的汉字。源自日语的“表外汉字”。与拉丁语言不同,在东亚表意文字系统如中文、日文中,没有固定数量的字符集。一般字符集只含有8,000到15,000的常用字,另外数万个非常用字、生僻字,往往没有在各国的标准中给予编码。另外一个情况是异体字:一个表意文字在不同的历史时期、地域产生了不同的字形,而一些地名人名等专有名字必须要使用传统的写法,需要使用这些冷僻字形,造成了生僻字问题,日语中称为“外字”问题。
表意文字小组是Unicode联盟和ISO/IEC JTC1/SC2/WG2之下的一个文字整理小组,负责整理及统合中日韩统一表意文字,以加入 Unicode 和 ISO/IEC 10646 字符集,其前身为 CJK-JRG。表意文字小组会员来自中国大陆、台湾、香港、澳门、日本、韩国、朝鲜、越南、新加坡和美国的政府或电脑业界代表。
大五码是使用繁体中文社群中最常用的电脑汉字字符集标准,共收录13,060个汉字。
大五码是使用繁体中文社群中最常用的电脑汉字字符集标准,共收录13,060个汉字。
大五码是使用繁体中文社群中最常用的电脑汉字字符集标准,共收录13,060个汉字。
大五码是使用繁体中文社群中最常用的电脑汉字字符集标准,共收录13,060个汉字。