读书人

hadoop中文乱码有关问题

发布时间: 2012-08-21 13:00:21 作者: rapoo

hadoop中文乱码问题


我在hadoop中要处理不同编码格式的文件。如:gbk ,utf-8.

hadoop 默认是utf-8 执行结果是Utf-8的正常显示

gbk 的显示乱码

在网上查了?value = new String(text.getBytes(), 0, text.getLength(), encoding);这种形式。

执行结果未变化。

求指导。。。

<!--EndFragment-->

读书人网 >编程

热点推荐