但是我这个的特点是追究原理,我在乎的事情都想弄明白,于是各个qq群依次发信息,没人理会。唉,郁闷。只好自己google it and teach myself 。下面是详细介绍。
还有对各方求助没有人理会,我有些个人想法。现在的人已经很少有人去深究理论了,人们的观念是得过且过,人们通常只是知道什么,不知道为什么。对编程来说,个人认为这是很悲哀的事情,也是非常危险的事情。我想可能这也是中国的IT落后于美国的原因,我希望中国的编程人员能够好好想想了。
下面的东西是从网上查到的
Unicode 的编码和实现
大概来说,Unicode 编码系统可分为编码方式和实现方式两个层次。
Unicode 的编码方式与ISO 10646的通用字符集(Universal Character Set,UCS)概念相对应,目前实际应用的 Unicode 版本对应于UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示 216即 65536 个字符。基本满足各种语言的使用。实际上目前版本的 Unicode 尚未填充满这16位编码,保留了大量空间作为特殊使用或将来扩展。
上述16位 Unicode 字符构成基本多文种平面(Basic Multilingual Plane,简称 BMP)。最新(但未实际广泛使用)的 Unicode 版本定义了16个辅助平面,两者合起来至少需要占据21位的编码空间,比3字节略少。但事实上辅助平面字符仍然占用4字节编码空间,与UCS-4保持一致。未来版本会扩充到 ISO 10646-1 实现级别3,即涵盖 UCS-4 的所有字符。UCS-4 是一个更大的尚未填充完全的31位字符集,加上恒为0的首位,共需占据32位,即4字节。理论上最多能表示 231个字符,完全可以涵盖一切语言所用的符号。
BMP 字符的 Unicode 编码表示为 U+hhhh,其中每个 h 代表一个十六进制数位。与 UCS-2 编码完全相同。对应的4字节 UCS-4 编码后两个字节一致,前两个字节的所有位均为0。
关于 Unicode 和 ISO 10646 及 UCS 的详细关系 ,请参看通用字符集。
自从青岛疫情反弹之后,大家对青岛疫情的关注度是非常高的,根据最新的消息报道,青岛市新增1例确诊病例详情公布,该确诊病例是青岛某公司的一名装卸工人,在9月底的时候被确诊为无症状感染者,从目前的情况来看,...
快讯!日本将延长新冠疫情紧急状态至3月7日 【环球网快讯】日本共同社刚刚消息称,日本将延长新冠疫情紧急状态至3月7日。 报道称,日本政府官员2月1日表示,日本将于2月2日开始,延长于上...
在我们的印象中,GPS 等同于定位。但是,今天我要告诉大家,我国北斗卫星在数量上已经超过了 GPS,全球排名第一 我国北斗卫星已经这么厉害了吗?这些跟我们生活有什么关系呢?是不是从此以后,我们就可以...
女人吃什么可以美白:红枣 众所周知红枣具有补血的功能,但是红枣还具有“维生素之王”的美称,不但能够促进气血生化,促进肌肤新陈代谢功能,还能抑制黑色素的生成,具有美白的功效,每天5吃颗红枣,美容又...
找一个免费接单的黑客相关问题 世界上哪个国家黑客最厉害相关问题 黑客新人入门怎么发快手 sql注入还存在吗(sql注入教程)...
如何盗他人的微信密码(网络黑客窃取微信号码的实例教程) 在为手机上设立各种各样登陆密码时,总有一种你一生都不容易记得的幻觉,因此 记得密码是多么的简易,变成泥,伤心。 /你看见自己了没有?登陆密码...