请解释一下unicode,utf-8,gb2312这些编码的含义
来源:学生作业帮 编辑:作业帮 分类:综合作业 时间:2024/11/08 00:46:08
请解释一下unicode,utf-8,gb2312这些编码的含义
字符集与编码 各个国家和地区所制定的不同 ANSI 编码标准中,都只规定了各自语言所需的“字符”.比如:汉字标准(GB2312)中没有规定韩国语字符怎样存储.这些 ANSI 编码标准所规定的内容包含两层含义:1.使用哪些字符.也就是说哪些汉字,字母和符号会被收入标准中.所包含“字符”的集合就叫做“字符集”.2.规定每个“字符”分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做“编码”.各个国家和地区在制定编码标准的时候,“字符的集合”和“编码” 一般都是同时制定的.因此,平常我们所说的“字符集”,比如:GB2312,GBK,JIS 等,除了有“字符的集合”这层含义外,同时也包含了“编码” 的含义.“UNICODE 字符集”包含了各种语言中使用到的所有“字符”.用来给 UNICODE 字符集编码的标准有很多种,比如:UTF-8,UTF-7,UTF-16,UnicodeLittle,UnicodeBig 等.1、ISO-8859-1:最简单的编码规则,每一个字节直接作为一个 UNICODE 字符.比如,[0xD6,0xD0] 这两个字节,通过 iso-8859-1 转化为字符串时,将直接得到 [0x00D6,0x00D0] 两个 UNICODE 字符,即 "".反之,将 UNICODE 字符串通过 iso-8859-1 转化为字节串时,只能正常转化 255 范围的字符.2、GB2312,BIG5,Shift_JIS,ISO- 8859-2 把UNICODE 字符串通过 ANSI 编码转化为“字节串”时,根据各自编码的规定,一个 UNICODE 字符可能转化成一个字节或多个字节.反之,将字节串转化成字符串时,也可能多个字节转化成一个字符.比如,[0xD6,0xD0] 这两个字节,通过 GB2312 转化为字符串时,将得到 [0x4E2D] 一个字符,即 '中' 字.“ANSI 编码”的特点:1.这些“ANSI 编码标准”都只能处理各自语言范围之内的 UNICODE 字符.2.“UNICODE 字符”与“转换出来的字节”之间的关系是人为规定的.3、UTF-8,UTF-16,UnicodeBig 与“ANSI 编码”类似的,把字符串通过 UNICODE 编码转化成“字节串”时,一个 UNICODE 字符可能转化成一个字节或多个字节.与“ANSI 编码”不同的是:1.这些“UNICODE 编码”能够处理所有的 UNICODE 字符.2.“UNICODE 字符”与“转换出来的字节”之间是可以通过计算得到的.不知道我讲的清不清楚.
请解释一下unicode,utf-8,gb2312这些编码的含义
Unicode、UCD2、UCS4、UTF-32、UTF-16、UTF-8、GB2312、GBK、GB18030 区别与
Unicode(utf-8)
已知汉字"大"的UNICODE代码点是U+5927,则其UTF-8编码的3字节序列用十六进制表示为?
GB2312,GBK,GB18030,UNICODE中哪一种编码收了最多汉字?
请人解释一下这些术语的含义:
Java的字符类型采用的是Unicode编码方案,每个Unicode码占用____个比特位.A、8 B、16 C、32
请帮我解释一下这些表情的含义谢谢您!
什么是unicode big endion编码,
请解释一下“心旷神怡”的含义
计算机中汉字编码 为什么不用Unicode,要用GB2312?
帮我解释一下这些词的含义,