1。西方编码就像莫尔斯电码,用点和破折号来表示英文字母表中的字母。计算机使用一系列预先指定的位,即代码,来表示字母、符号和数字。以下是西方语言中一些常用的编码方法。/p >,

1)\tASCII代码目前,计算机中使用最广泛的字符代码是ASCII码,即美国信息交换标准代码。它包括32个通用控制字符、0个十进制代码、52个英文大小写字母和34个ASCII特殊符号,共128个元素,由7位二进制数编码。一般用一个字节(即8个二进制位)表示一个ASCII字符,规定最高位始终为0。表1-3是ASCII码编码表。

2)扩展ASCII码(extended ASCII)由于标准ASCII字符集的字符数量有限,在实际应用中往往无法满足要求。为此,国际标准化组织将ASCII字符集扩展为8位代码,并扩展了ASCII代码。这样,ASCII码的字符集可以扩展128个字符,即8位扩展ASCII码可以提供256个字符的代码。这些扩展字符的代码都是8位代码(即十进制数128255),称为扩展ASCII码。扩展ASCII码添加的字符包括框架文本、圆圈和其他图形符号。

]、“method key forshow”:0.0 }、{“name”:“2。汉字编码”、“名称敏感”:0、“步骤”:[

所谓汉字编码,就是采用科学可行的方法,为每个汉字编一个唯一的代码,供计算机识别。为了在不同设备之间交换信息,还需要制定汉字的编码标准。目前主要有三种汉字编码:GB 2312-80、B1G5和GBK。/p >,

1) \ tgb2312-80(国标代码)gb2312-80(简称国标代码)我国1981年公布的《通用汉字集(基本集)及其互换码标准》规定,每个汉字编码由两个字节组成。第一个字节的范围从a1h到ff: h,共94种,第二个字节的范围也从a1h到feh,共94种。有了这两个字符,可以定义94 x 94 =8836个汉字。实际上,定义了6763个汉字和682个符号。汉字分为两级,即3755个一级(常用)汉字(按汉语拼音排序)和3008个二级(次常用)汉字(按部首排序)。微软视窗3。2操作系统采用gb2312-80作为基本汉字编码。

2)\tBIG5代码B1G5代码主要是一个繁体汉字编码字符集。B1G5码的编码规则是每个汉字码由两个字节组成,第一个字节来自A1H〜F9H,共89种,第二个字节来自40H〜7EH和A1H〜FEH,共157种。也就是说,用这两个音节可以定义89×157 = 13973种汉字,其中常用的有5401种,常用的有7652种,其余的都是一些特殊的字符。

3)\tGBK码GBK是gb2312-80的扩展,与gb2312-80兼容,所以gb2312-80中的汉字编码与GBK相同。GBK中的每个汉字仍然包含两个字节,第一个字节来自0x81〜OxFE(即129254),第二个字节来自0x40〜OxFE(即64254)。GBK有23940个码位,包括21003个汉字。微软简体中文视窗95以GBK作为汉字编码。

]、“method key forshow”:0.0 }、{“name”:“3。unicode编码," " namesensitive": 0," steps": [

unicode(统一代码、通用代码、单代码)使用650000的16位二进制数。例如,Unicode代码将俄国古斯拉夫字母中的大写字母“A”显示为0000 0100 0001 0000::另一个例子是,上一篇文章中描述的GBK可以对应Unicode,Unicode不能显示汉字编码。

版权信息:本站所有资源仅供学习与参考,请勿用于商业用途,如有侵犯您的版权,请及时联系客服,我们将尽快处理。

上一篇: C语言中= =是什么意思?

下一篇: 如何用C语言输入字符并输出其ASCII码?(c版)(如何用c语言输出ascii码)

用户评论 (0)

暂无评论

嘿,我来帮您!