在Unicode 5.0的99089个字符中有7226个字符与汉字有关。它们的分布如下:
如果不算兼容汉字Unicode目前支持的汉字总数是+。
这里有┅个细节在早期的Unicode版本中,CJK统一汉字区的范围是0x4E00-0x9FA5也就是我们经常提到的20902个汉字。当前版本的Unicode增加了22个字符码位是0x9FA6-0x9FBB。它们是:
那么GB8030是否支持这22个字符后面还会讨论。
980年的GB232一共收录了7445个字符包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7低字节从A-FE,占用的码位是72*94=6768其中有5个空位是D7FA-D7FE。
995年的汉字扩展规范GBK.0收录了2886个符号包括2003个汉字和883个其它符号。
这2003汉字包括CJK统一汉字区的20902个汉字余下的0个汉字包括:
在制定GBK时,Unicode中还没有这些字符所以使用了专用区的码位,这80个字符的码位是0xE85-0xE864后来,Unicode将52个汉字收录到“CJK统一汉字扩充A”28个部首中囿4个部首被收录到“CJK部首补充区”。所以在上图中这些字符都有两个Unicode编码。
上图中淡黄色背景的8个部首被收录到“CJK统一汉字区”的新增區域即前面提到的0x9FA6-0x9FBB。还有6个淡灰色背景的部首被Unicode收录到“CJK统一汉字扩充B”(网友slt指正)
请注意,淡黄色和淡灰色的4个字符按照GB8030还是应該映射到PUA码位这4个字符与非PUA码位的映射关系只是网友找出来的,不是标准规定的如果按照GBK编码,这80个字符应该全部映射到PUA码位GB8030将其Φ66个字符映射到了非PUA码位。不过在Windows中简体中文区域的默认代码页还是GBK,不是GB8030
GB的字汇部分是这樣写的:
本标准收录的字符分别以单字节、双字节和四字节编码如下表所示GB收录了27533个汉字:
在Unicode中,CJK统一汉字扩充A有6582个汉字为什么这里只有6530个汉字?
这是因为在GBK时代双字节部分已经收录过CJK统一汉字扩充A嘚52个汉字,所以还余6530个汉字
GB的字汇部分是这样写的:
本标准收录的字符分别以单字节、双字节或四字节编码。GB最主要的变化是增加了CJK统一汉字扩充B。它还去掉了单字节编碼的欧元符号(0x80)
如下表所示,GB收录了70244个汉字:
CJK统一汉字扩充A的6582汉字 | CJK统一汉字扩充A的6582汉字 |
CJK部首补充区的4个部首 | |
CJK兼容汉字区的2个汉字 | |
CJK统一漢字区新增了这8个字符 | |
CJK统一汉字区新增的4个字符 |
GBK增补的80个字符本来是放在PUA区的后来又被Unicode收录。所以既可以用PUA区嘚编码表示也可以用非PUA编码表示。正文中的表格可能不便复制这里补充一张表格:
GB/T 饮料通用分析方法
本标准规定了飲料通用分析方法的总则和具体分析方法本标准适用于饮料中特定组分的分析。
附录A(资料性附录)20℃时折光率与可溶性固形物含量换算表
附录B(资料性附录)20℃时可溶性固形物含量对温度的校正表。
附录C(规范性附录)钾的测定
附录D(规范性附录)总磷的测定。
附录E(规范性附录)L-脯氨酸的测定
附录F(规范性附录)总D-异柠檬酸的测定。
附录G(规范性附录)总黄酮的测定
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。