通讯!gb2312和utf8的区别_gb2312

互联网   2023-02-08 13:03:16

你们好,最近小活发现有诸多的小伙伴们对于gb2312和utf8的区别,gb2312这个问题都颇为感兴趣的,今天小活为大家梳理了下,一起往下看看吧。

1、名字的由来

2、GB2312又称GB2312-80字符集,全称为《信息交换用汉字编码字符集基本集》,由原国家标准总局发布,1981年5月1日实施。


(相关资料图)

3、特性

4、GB2312是中国国家标准的简体中文字符集。其汉字已经覆盖了99.75%的使用频率,基本满足了计算机处理汉字的需要。它在中国大陆和新加坡被广泛使用。

5、包括内容

6、GB2312包含7445个图形字符,包括简体汉字和通用符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语音标和汉语拼音字母。包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日本平假名和片假名字母以及俄罗斯西里尔字母。

7、技术特征

8、(1)分区表示法:

9、在GB2312中,将接收到的汉字进行“分区”,每个分区包含94个汉字/符号。这种表示也称为位置代码。

10、每个区域包含的字符如下:01-09区域为特殊符号;16-55区为一级汉字,按拼音排序;区域56-87为二级汉字,按部首/笔画排序;区域10-15和88-94没有编码。

11、(2)双字节表示

12、两个字节中,第一个字节是第一个字节,最后一个字节是第二个字节。习惯上称第一个字节为“高字节”,第二个字节为“低字节”。

13、0xA1-0xF7(将0xA0添加到区号01-87)用于“高字节”,0xA1-0xFE(将0xA0添加到01-94)用于“低字节”。

14、编码示例

15、以GB2312字符集的第一个汉字“啊”为例。它的区号是16,位置代码是01,所以区号是1601。在大多数计算机程序中,高字节和低字节分别加0xA0,得到程序的汉字处理码0xB0A1。计算公式为:0xB0=0xA0 16,0xA1=0xA0 1。

以上就是gb2312这篇文章的一些介绍,希望对大家有所帮助。

相关资讯
最新资讯