请教一下怎么才能在Unicode字符中判断里面的字是汉字
wchar_t*szBuff;
.....
我的 szBuff从文件中读取了字符后,要怎么才能判断里面的每一个字符是汉字还是非汉字的呀,Unicode中汉字的范围是多少呀,请教一下各位高手,谢谢了呀
[解决办法]
中日韩文字在一张表里,你无法判断是汉字还是日本文字.
http://www.chi2ko.com/tool/CJK.htm可以看一下
[解决办法]
http://community.csdn.net/Expert/topic/5453/5453933.xml?temp=.2129938
[解决办法]
UNICODE 字符由两个字节组成,如果是标准的ANSI字符,高位字节就为0,低位字节为对应的字符编码.也就是说实际上它只用到了一个字节;
而如果是汉字的话,则两个字节都给使用了,并且每个字节中的值都会> 127;
所以,对于如何判断所输入的是不是汉字,可以根据查看高位字节来确定,如果高位字节为00则不是,如果高位字节> 127则是汉字.
我就是用这个方法来确定的,不过没有根据,有更好的方法的话,告诉我一下.
[解决办法]
中日韩等东亚文字的UNICODE编码都大于255.
我记得每个语言的UNICDOE编码对应了一个范围,只要判断是否在这个范围就可以了.
具体上网搜一下吧.
[解决办法]
这个容易啊,你可以先把UNICODE码转换成GB2312,然后在GB2312里面判断,这样就解决了啊
[解决办法]
中日都是交杂在一起的,有的是相同的