读书人

utf8编码有关问题

发布时间: 2012-08-15 16:57:17 作者: rapoo

utf8编码问题
utf8编码规则如下:
1字节 0xxxxxxx
2字节 110xxxxx 10xxxxxx
3字节 1110xxxx 10xxxxxx 10xxxxxx
不考虑三个字节以上情况!

现在我上报了以个0xC0 0xB7,经过utf8校验失败,打印信息描述该字符串为非utf8编码,校验失败进程直接挂掉!!!

0xC0 0xB7二进制为
1100 0000 1011 1110 符合上面的2字节 110xxxxx 10xxxxxx 编码规则,求高手指教!!!!!


急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急急

[解决办法]
建议看一下http://zh.wikipedia.org/zh/UTF-8,utf8有4字节的,0xEO是合法前缀,但是0xC0不是

读书人网 >软件架构设计

热点推荐