中文汉字和英文数字的unicode编码范围

小知识  2021年4月12日 pm12:12发布4年前 (2021)更新 城堡大人
133 0 0

前言

最近有做相关汉字转拼音处理,因此了解一下,摘抄于此,方便查阅。

好记性不如烂笔头

正文

虽然不常用,了解一下。

基本汉字有20902字。

中文汉字和英文数字的unicode编码范围

相关汉字编码介绍

GB2312编码

1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括6763个汉字。

BIG5编码

台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。

GBK编码

1995年12月发布的汉字编码国家标准,是对GB2312编码的扩充,对汉字采用双字节编码。GBK字符集共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。

GB18030编码

2000年3月17日发布的汉字编码国家标准,是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集。

Unicode编码

国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。

简体字范围

4E00-9FA5

简体和繁体字范围

4E00-9FFF

判断简体和繁体的范围

Java代码片段

    public static String REGEXP_SIMPLIFIED = "^[\u4E00-\u9FA5]+$";
    public static String REGEXP_SIMPLIFIED_TRADITIONAL = "^[\u4E00-\u9FFF]+$";


    public static boolean matcher(String str, String regex) {
        return Pattern.compile(regex).matcher(str).find();
    }

    HanZiUtils.matcher("体", HanZiUtils.REGEXP_SIMPLIFIED);
    HanZiUtils.matcher("體", HanZiUtils.REGEXP_SIMPLIFIED_TRADITIONAL);

参考文章

  1. 汉字unicode编码范围
  2. 中文汉字和英文数字的unicode编码范围

 历史上的今天

  1. 2024: Files.walkFileTree简介(1条评论)
  2. 2023: RecyclerView对Item拖动和上下滑动记录(0条评论)
  3. 2022: Android反编译之vdex转dex查看源码(0条评论)
  4. 2020: 冰心:一日的春光(0条评论)
版权声明 1、 本站名称: 笔友城堡
2、 本站网址: https://www.biumall.com/
3、 本站部分文章来源于网络,仅供学习与参考,如有侵权,请留言

暂无评论

暂无评论...

随机推荐

海子:面朝大海,春暖花开

从明天起,做一个幸福的人喂马,劈柴,周游世界从明天起,关心粮食和蔬菜我有一所房子,面朝大海,春暖花开 从明天起,和每一个亲人通信告诉他们我的幸福那幸福的闪电告诉我的我将告诉每一个人 给每一条河每一座山取一个温暖的名字陌生人,我也为你祝福愿你有一个灿烂的前程...

记录一下ProgressBar的常用方式

前言记录一下ProgressBar的常用方式,加载动画,不转动的圆形,水平进度展示等。正文直入正题。隐藏内容!付费阅读后才能查看!¥1 ¥3多个隐藏块只需支付一次付费阅读参考文章《android ProgressBar 圆形进度条的自定义样式》《Android加载动画常用做法...

戴望舒:致萤火

萤火,萤火,你来照我。 照我,照这沾露的草,照这泥土,照到你老。 我躺在这里,让一颗芽穿过我的躯体,我的心,长成树,开花; 让一片青色的藓苔,那么轻,那么轻把我全身遮盖, 象一双小手纤纤,当往日我在昼眠,把一条薄被在我身上轻披...

丰子恺:人生三十即是秋

我的年岁上冠用了“三十”二字,至今已两年了。不解达观的我,从这两个字上受到了不少的暗示与影响。虽然明明觉得自己的体格与精力比二十九岁时全然没有什么差异。但“三十”这一个观念笼在头上,犹之张了一顶阳伞,使我的全身蒙了一个暗淡色的阴影,又仿佛在日历上撕过了立秋的一页以后,虽然太阳的炎威依然没有减却,...

Android单编译时出现ninja no work to do

前言记录一下正编译Android后使用ninja出现如下提示:ninja: no work to do.记录于此,方便自己查阅。正文隐藏内容!付费阅读后才能查看!¥2 ¥4多个隐藏块只需支付一次付费阅读参考文章无

init的启动

前言init的启动之前也跟过,目前用的是Android P,可能跟之前的存在一定的差异。因此重新记录一下,方便自己查阅。这里只是走走流程,大部分内容来之《Android P (9.0) 之Init进程源码分析》正文涉及文件,没出现顺序。\system\core\init\init.c...