作业帮 > 数学 > 作业

为什么 ^[\\u4E00-\\u9FA5\\uF900-\\uFA2D\\w]*$ 中汉字的unicode编码正则表达

来源:学生作业帮 编辑:作业帮 分类:数学作业 时间:2024/11/07 22:41:48
为什么 ^[\\u4E00-\\u9FA5\\uF900-\\uFA2D\\w]*$ 中汉字的unicode编码正则表达式是两个区间?
为什么是两个不连续的区间呢?其他表示什么呢.
\\u4E00-\\u9FA5和\\uF900-\\uFA2D分别表示什么.
嘿,不止这么简单,问题之纠结在于什么叫汉字,多大规模的,以前回答过类似的问题,参考一下吧.
关于unicode集合中的汉字,若干子区间如下定义:
03007 1 汉字“〇”
03400~04DB5 6582 ExtA 连续
04E00~09FCB 20940 基本集 连续,但9FBC~9FCB暂无字形
0E815~0E864 80 自定义区 连续,这些字符有两个unicode编码
0F900~0FAD9 470 兼容集 有洞,且[FA2E,FA2F,FA6E,FA6F]暂无字形
20000~2A6D6 42711 ExtB 连续
2F800~2FA1D 542 兼容补遗 连续
2A700~2B734 4149 ExtC 连续
2B740~2B81D 222 ExtD 连续