`
bruceyu
  • 浏览: 29874 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Unicode的知识积累

阅读更多

・ 对应Unicode,UTF-8的编码可参考如下:

    普通英文占一个字节 格式是 0xxxxxxx 
    两个字节 格式是  110xxxxx 10xxxxxx 
    三个字节格式是   1110xxxx 10xxxxxx 10xxxxxx 
    四个字节格式是   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 
    如果一个完整的字是N个字节,那么首字节就有N个1加上0 , 后面的是数据区. 
    从第二个字节开始,前两个是10固定格式的,用于错误校验.后面的6位才是有用的.

    看个例子:以全角的逗号","为例

    (1), 其Unicode是:FF0C(H),即:1111 1111 0000 1100(B)有人会问,怎么获

            得这个值呢?有很多方法,我推荐可以用 “ 开始 → 运行 → 输入“charmap ”,

            打开"字符映射表",在其中进行查询即可。

    (2), 好了,在用Java环境中,用以下语句获得其UTF-8的值:

 

    String str = ",";

    byte[] byteArr = str.getBytes(); //Java环境中默认的就是UTF-8编码,注意不是Web环境

    for(byte by : byteArr) {

       System.out.print(String.format("%X", by) + "\t");

    }

 

    其结果就是:EF        BC        8C,即: 1110 1111 1011 1100 1000 1100(B)

    我将校验区都标上了红色,我们关心的是数据区,再整理一下看看,又成了 1111 1111 0000 1100(B),

    即:FF0C(H),同上面所得到的Unicode值相同了。

分享到:
评论

相关推荐

    Unicode知识介绍

    编码知识 Unicode介绍 一致性 实现指南

    Java中编码方式和Unicode知识总结

    此文档为Java中编码方式和Unicode知识总结,对了解学习Java编码的讲解很全面清楚!

    UNICODE 基础知识.pdf

    UNICODE 基础知识 Unicode.org 是一个国际性的组织,致力于使全球各种语言文字在计算机上使用统一的 编码。经过多年的发展,UNICODE 编码已经发展到了4.1 的版本。 1. 编码范围 早期的UNICODE 版本里,认为UNICODE ...

    Unicode编码Unicode编码

    Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码

    unicode知识分享

    unicode知识分享,发展史完整讲解。

    让易语言支持Unicode

    不要在求官方支持Unicode啦自己完全能使得易语言支持Unicode 本源码Unicode播放音乐 Unicode文件名自己找,自己看源码,如果你问我界面不支持Unicode怎么解决那我想给你一拳,不会用UI?写代码最重要的是能傻瓜化就傻瓜...

    全部语言Unicode范围

    语言unicode范围整理,国家unicode范围

    unicode

    unicode编码unicode编码

    各国文字Unicode编码范围

    Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字

    js unicode 转换工具

    unicode 转换工具 js unicode 转换工具 unicode 转换工具 js unicode 转换工具

    计算机编码与Unicode(PPT课件)

    这个PPT课件介绍了Unicode和字符编码相关的知识。丰富生动的图片和讲解使您能快速地掌握Unicode编码相关的知识,是不可多得的Unicode相关的PPT教程。 内容提要: ----------------- 1. 计算机编码 2. 内码、字形...

    全新UNICODE查表工具 —— Unicode XMan 2.0 (20120404)

    面向字体制作者的Unicode专业查表工具,并集成整合相关的网络资源。 通过这个工具可以快速方便地查询测试Unicode符号,主要具有以下特点: ——支持对Unicode进行快速查询和浏览,支持多种浏览和查询模式 ——...

    Unicode字符进位转换

    Unicode字符进位转换Unicode字符进位转换Unicode字符进位转换Unicode字符进位转换

    Unicode_汇编unicode_

    win32汇编使用定义unicode变量及数据

    Unicode和ANSI对照表

    就是Unicode和ANSI码的对照文件。 四个文本,两个程序。 文本Unicode是Unicode表 Unicode2ANSI是Unicode文本另存为ANSI unicodeandANSI.txt是对照表的Unicode版本 unicodeandANSI2ANSI.txt是对照表的ANSI版本 有些...

    unicode 转换为 gb2312.txt

    这是unicode跟对应的GB2312编码的转换表,同时也是二维数组,可以直接在c语言中使用,数组左列为unicode,根据unicode的数值大小从小到大进行排序,右列为对应的GB2312编码,旁边有注释对应的汉字,亲测可以在单片机...

    Unicode转换成GBK

    该函数实现Unicode转换成GBK功能,非常适用

    完整的unicode查找表

    我们一直在使用的unicode编码表,便于嵌入式产品使用。请保留备用!

    易语言Unicode编辑框例子

    易语言Unicode编辑框例子,。分享Unicode编辑框例子。改造的编辑框 不能输入Unicode文字。而超级编辑框可以。@tw31。

    汉字拼音对应的unicode编码

    汉字转换成16进制对应的unicode编码,用于汉字拼音排序

Global site tag (gtag.js) - Google Analytics