读书人

Unicode CJK一部分编码笔记

发布时间: 2012-11-18 10:51:21 作者: rapoo

Unicode CJK部分编码笔记

首先请关注?http://zh.wikibooks.org/wiki/Unicode?直观对照,下面是范围的解释
他的应用就不说了,基础设施呀。

本来要带上例子字符的,可ITEYE发不上,没办法了。

全部Unicode中日韩越通用汉字字符(约76227字)。
定义??????????? 范围 ? ? ? ? ? ? ? ? ? 字数
CJK基本集??? [4E00-9FBB]????? 20924字
? ? ? ? ? ? ? ? ? ?[9FC3-9FCB] ? ? ? ? ? ? ?8字
CJK扩展A???? [3400-4DB5]?????? 6582字
CJK扩展B???? [20000-2A6D6] 42711字
CJK扩展C  ?[2A700-2B734] ? 4149字
CJK扩展D  ?[2A740-2B81D] ? ? 222字

部首扩展 ? ? ?[2E80-2EF3]??????? 115字
康熙部首 ? ? ?[2F00-2FD5]??????? 214字
IDS符号 ? ? ? [2FF0-2FFB] ? ? ? ? ?12字
CJK符号????? [3000-303F] ? ? ? ? ?64字
日文假名 ? ? ?[3040-30FF]??????? 189字
CJK注音符号 [3105-312C] ? ? ? ? 40字
CJK笔画 ? ? ? [31C0-31E3]???????? 36字
全角符号 ? ? ?[FF01-FF60] ? ? ? ? ? 96字

CJK兼容 ? ? ? ?[F900-FAD9]??????? 474字
CJK兼容扩展? [2F800-2FA1D] ? ?542字
PUA(GBK) [E815-E864] ? ? ? ? ?79字


更详细的解释,其实有些是保留的,目的不外乎扩容准备

中日韩字符范围2E80~9FFF

2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。

3400~4DFFh:中日韩认同表意文字扩充A区,总计收容6,582个中日韩汉字。

4E00~9FFFh:中日韩认同表意文字区,总计收容20,902个中日韩汉字。

A000~A4FFh:彝族文字区,收容中国南方彝族文字和字根。

AC00~D7FFh:韩文拼音组合字区,收容以韩文音符拼成的文字。

F900~FAFFh:中日韩兼容表意文字区,总计收容302个中日韩汉字。

FB00~FFFDh:文字表现形式区,收容组合拉丁文字、希伯来文、阿拉伯文、中日韩直式标点、小符号、半角符号、全角符号等。

对应官方文档

标准CJK文字
http://www.unicode.org/Public/UNIDATA/Unihan.html

全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF
http://www.unicode.org/charts/PDF/UFF00.pdf


CJK部首补充:2E80-2EFF
http://www.unicode.org/charts/PDF/U2E80.pdf


CJK标点符号:3000-303F
http://www.unicode.org/charts/PDF/U3000.pdf


CJK笔划:31C0-31EF
http://www.unicode.org/charts/PDF/U31C0.pdf


康熙部首:2F00-2FDF

http://www.unicode.org/charts/PDF/U2F00.pdf


汉字结构描述字符:2FF0-2FFF
http://www.unicode.org/charts/PDF/U2FF0.pdf


注音符号:3100-312F
http://www.unicode.org/charts/PDF/U3100.pdf


注音符号(闽南语、客家语扩展):31A0-31BF
http://www.unicode.org/charts/PDF/U31A0.pdf


日文平假名:3040-309F
http://www.unicode.org/charts/PDF/U3040.pdf


日文片假名:30A0-30FF
http://www.unicode.org/charts/PDF/U30A0.pdf


日文片假名拼音扩展:31F0-31FF
http://www.unicode.org/charts/PDF/U31F0.pdf


韩文拼音:AC00-D7AF
http://www.unicode.org/charts/PDF/UAC00.pdf


韩文字母:1100-11FF
http://www.unicode.org/charts/PDF/U1100.pdf


韩文兼容字母:3130-318F
http://www.unicode.org/charts/PDF/U3130.pdf


太玄经符号:1D300-1D35F
http://www.unicode.org/charts/PDF/U1D300.pdf


易经六十四卦象:4DC0-4DFF
http://www.unicode.org/charts/PDF/U4DC0.pdf


彝文音节:A000-A48F
http://www.unicode.org/charts/PDF/UA000.pdf


彝文部首:A490-A4CF
http://www.unicode.org/charts/PDF/UA490.pdf


盲文符号:2800-28FF
http://www.unicode.org/charts/PDF/U2800.pdf


CJK字母及月份:3200-32FF
http://www.unicode.org/charts/PDF/U3200.pdf


CJK特殊符号(日期合并):3300-33FF
http://www.unicode.org/charts/PDF/U3300.pdf


装饰符号(非CJK专用):2700-27BF
http://www.unicode.org/charts/PDF/U2700.pdf


杂项符号(非CJK专用):2600-26FF
http://www.unicode.org/charts/PDF/U2600.pdf


中文竖排标点:FE10-FE1F
http://www.unicode.org/charts/PDF/UFE10.pdf


CJK兼容符号(竖排变体、下划线、顿号):FE30-FE4F
http://www.unicode.org/charts/PDF/UFE30.pdf


读书人网 >编程

热点推荐