读书人

多国语言一致性检测!解决思路

发布时间: 2012-03-11 18:15:39 作者: rapoo

多国语言一致性检测!!
怎样去检测一个字符串的语言的一致行,如(纯中文字符串中不能包含日文,日文字符串中不能出现不允许的中文),希望最好能有实现代码,方案也行!!

[解决办法]
在不确定字符串的编码方式之前,这是没办法做到的。
[解决办法]
unicode编码的中文不是有一个区间的吗?就像ascii编码从0~~254一样的意思
[解决办法]
unicode 是大字符集,采用2~4字节的编码,通常我们用的是16bit的,包含了很多国家的语言。
你说的应该就是windows用的16bits的,他的日文和中文编码肯定不能重复的。

要实现你这功能,你需要得到一张中文码表,根据这个码表判断每个字是否是中文。
码表一些unicode的网站上面有,但是你需要根据你的需求自己处理。

读书人网 >.NET

热点推荐