一堆文字 怎么判断是简体还是繁体呢???
.
1 一堆文字 怎么判断是简体还是繁体呢???
2 一堆文字 怎么判断是英文字符还是中文呢???
比如 “来和” 怎么判断那个是简体呢?那个是繁体呢??
比如 “abc阿百川” 这段文字中其中一个怎么判断是英文还是中文呢???
.
[解决办法]
这个涉及到 编码了吧。 查下简繁的编码规则
[解决办法]
http://blog.csdn.net/hui211314ddhui/article/details/14579663
[解决办法]
如果说“来”是简体,“”是繁体,那么请问“和”字是简体还是繁体?
在大陆人看,“来和” 里面是两个简体字一个繁体字,在台湾人看,“来和” 里面是一个简化字两个正体字
[解决办法]
首先字符串要是unicode编码才好判断(如果是MBCS需要结合codepage来判断),编码在GB2312-80范围内的都算是简体,编码小于256(U+0100)是西文。
[解决办法]
LZ首先你混淆了一个概念, 就是编码和字库.你说的简体/繁体我理解应该是编码, 大陆的GB2312/GBK等标准通常字库都是简体字, 台湾的BIG5字库通常都是繁体字.
但这不是一定的, 因为GB2312也可以做一个繁体字库, 事实上也存在这样的字库.
编码都是数字, 无所谓简体繁体; 字库就是用一个个点阵画出的图形, 可以是简体字形, 也可以是繁体字形.
如果你是想判断字库中的图形是简体字形还是繁体字形, 就比较复杂了, 涉及很难的图形识别算法.
如果你是想判断编码是GB2312还是BIG5还是ASCII(英文字符)就比较简单了, 他们的取值范围是不一样的, 你可以通过统计是否存在某个取值范围的字节来判断属于哪种编码.
[解决办法]
对 单从人眼上去说简繁体,确实有点纠结。计算机并非人脑,不会去像你的思想,主观的确定哪个是简体,哪个是繁体。它只会从编码来确定,如果编码字库里面无法找到,那么就是乱码显示。你读取到一段字符串的时候只能从编码来解析了。