读书人

怎么用算法实现多国语言的自动识别功能

发布时间: 2012-05-09 12:13:59 作者: rapoo

如何用算法实现多国语言的自动识别功能?
各位大虾,能否给我一个提示,我大概百度到了一些关于自动识别的思想,针对字符编码的特点来自动识别,但是我对字符编码不是很了解,麻烦有心人能否给我一些关于字符编码的书籍,让我能够了解一下,至于自动识别我想问问大家的想法,然后自己再实现一下,仅仅只需要大家的想法而已!

[解决办法]
http://baike.baidu.com/view/40801.htm

看后面的Unicode 编码范围,如果字符时unicode,就可以根据范围知道语言的种类,

如果不是unicode,是gbk之类的,就比较麻烦,以为存在编码重复的问题
[解决办法]
如果是基于Unicode的,那么先看看Unicode的规范。
如果是MBCS的话,会麻烦些,需要对常用的单词和语句做统计预测。

读书人网 >C++

热点推荐