前言
最近有做相关汉字转拼音处理,因此了解一下,摘抄于此,方便查阅。
好记性不如烂笔头
正文
虽然不常用,了解一下。
基本汉字有20902字。
相关汉字编码介绍
GB2312编码
1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括6763个汉字。
BIG5编码
台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。
GBK编码
1995年12月发布的汉字编码国家标准,是对GB2312编码的扩充,对汉字采用双字节编码。GBK字符集共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。
GB18030编码
2000年3月17日发布的汉字编码国家标准,是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集。
Unicode编码
国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。
简体字范围
4E00-9FA5
简体和繁体字范围
4E00-9FFF
判断简体和繁体的范围
Java代码片段
public static String REGEXP_SIMPLIFIED = "^[\u4E00-\u9FA5]+$"; public static String REGEXP_SIMPLIFIED_TRADITIONAL = "^[\u4E00-\u9FFF]+$"; public static boolean matcher(String str, String regex) { return Pattern.compile(regex).matcher(str).find(); } HanZiUtils.matcher("体", HanZiUtils.REGEXP_SIMPLIFIED); HanZiUtils.matcher("體", HanZiUtils.REGEXP_SIMPLIFIED_TRADITIONAL);
参考文章
历史上的今天
暂无评论...
随机推荐
海子:面朝大海,春暖花开
从明天起,做一个幸福的人喂马,劈柴,周游世界从明天起,关心粮食和蔬菜我有一所房子,面朝大海,春暖花开 从明天起,和每一个亲人通信告诉他们我的幸福那幸福的闪电告诉我的我将告诉每一个人 给每一条河每一座山取一个温暖的名字陌生人,我也为你祝福愿你有一个灿烂的前程...
记录一下ProgressBar的常用方式
前言记录一下ProgressBar的常用方式,加载动画,不转动的圆形,水平进度展示等。正文直入正题。隐藏内容!付费阅读后才能查看!¥1 ¥3多个隐藏块只需支付一次付费阅读参考文章《android ProgressBar 圆形进度条的自定义样式》《Android加载动画常用做法...
戴望舒:致萤火
萤火,萤火,你来照我。 照我,照这沾露的草,照这泥土,照到你老。 我躺在这里,让一颗芽穿过我的躯体,我的心,长成树,开花; 让一片青色的藓苔,那么轻,那么轻把我全身遮盖, 象一双小手纤纤,当往日我在昼眠,把一条薄被在我身上轻披...
丰子恺:人生三十即是秋
我的年岁上冠用了“三十”二字,至今已两年了。不解达观的我,从这两个字上受到了不少的暗示与影响。虽然明明觉得自己的体格与精力比二十九岁时全然没有什么差异。但“三十”这一个观念笼在头上,犹之张了一顶阳伞,使我的全身蒙了一个暗淡色的阴影,又仿佛在日历上撕过了立秋的一页以后,虽然太阳的炎威依然没有减却,...
Android单编译时出现ninja no work to do
前言记录一下正编译Android后使用ninja出现如下提示:ninja: no work to do.记录于此,方便自己查阅。正文隐藏内容!付费阅读后才能查看!¥2 ¥4多个隐藏块只需支付一次付费阅读参考文章无
init的启动
前言init的启动之前也跟过,目前用的是Android P,可能跟之前的存在一定的差异。因此重新记录一下,方便自己查阅。这里只是走走流程,大部分内容来之《Android P (9.0) 之Init进程源码分析》正文涉及文件,没出现顺序。\system\core\init\init.c...