中文汉字和英文数字的unicode编码范围

小知识4年前发布 biumall.com站长

242 00

前言

最近有做相关汉字转拼音处理，因此了解一下，摘抄于此，方便查阅。

好记性不如烂笔头

正文

虽然不常用，了解一下。

基本汉字有20902字。

中文汉字和英文数字的unicode编码范围

简体字范围

4E00-9FA5

简体和繁体字范围

4E00-9FFF

判断简体和繁体的范围

Java代码片段

    public static String REGEXP_SIMPLIFIED = "^[\u4E00-\u9FA5]+$";
    public static String REGEXP_SIMPLIFIED_TRADITIONAL = "^[\u4E00-\u9FFF]+$";


    public static boolean matcher(String str, String regex) {
        return Pattern.compile(regex).matcher(str).find();
    }

    HanZiUtils.matcher("体", HanZiUtils.REGEXP_SIMPLIFIED);
    HanZiUtils.matcher("體", HanZiUtils.REGEXP_SIMPLIFIED_TRADITIONAL);

参考文章

历史上的今天

1、名称：笔友城堡
2、网址： https://www.biumall.com/
3、文章：部分来源于网络，仅供站长学习，如有侵权，请留言
4、打赏：如果觉得不错，赏杯可乐，谢谢

Class not found when unmarshalling

Android 小知识 # Android # biumall # Bundle

5个月前

01530

Android Jetpack – Navigation的Fragment生命周期

Android 小知识 # Android # Fragment # Jetpack

3年前

01850

Fragment already added

Android 小知识 # AndroidRuntime # Fragment # Fragment already added

3年前

02410

[小知识]内存泄漏整理

小知识 # GC # 内存回收机制 # 内存泄漏

4年前

02360

暂无评论

暂无评论...

最近更新

中文汉字和英文数字的unicode编码范围

目录

前言

正文

相关汉字编码介绍

GB2312编码

BIG5编码

GBK编码

GB18030编码

Unicode编码

简体字范围

简体和繁体字范围

判断简体和繁体的范围

参考文章

历史上的今天

通过图片文件的文件头来判断文件的真正格式

[小知识]内存泄漏整理

相关文章

Class not found when unmarshalling

Android Jetpack – Navigation的Fragment生命周期

Fragment already added

[小知识]内存泄漏整理

暂无评论

随机娱乐

随机应用

随机网址

标签云

最近更新

中文汉字和英文数字的unicode编码范围

目录

前言

正文

相关汉字编码介绍

GB2312编码

BIG5编码

GBK编码

GB18030编码

Unicode编码

简体字范围

简体和繁体字范围

判断简体和繁体的范围

参考文章

历史上的今天

通过图片文件的文件头来判断文件的真正格式

[小知识]内存泄漏整理

相关文章

Class not found when unmarshalling

Android Jetpack – Navigation的Fragment生命周期

Fragment already added

[小知识]内存泄漏整理

暂无评论

随机娱乐

随机应用

随机网址