hadoop中文乱码问题
我在hadoop中要处理不同编码格式的文件。如:gbk ,utf-8.
hadoop 默认是utf-8 执行结果是Utf-8的正常显示
gbk 的显示乱码
在网上查了?value = new String(text.getBytes(), 0, text.getLength(), encoding);这种形式。
执行结果未变化。
求指导。。。
<!--EndFragment-->发布时间: 2012-08-21 13:00:21 作者: rapoo
hadoop中文乱码问题
我在hadoop中要处理不同编码格式的文件。如:gbk ,utf-8.
hadoop 默认是utf-8 执行结果是Utf-8的正常显示
gbk 的显示乱码
在网上查了?value = new String(text.getBytes(), 0, text.getLength(), encoding);这种形式。
执行结果未变化。
求指导。。。
<!--EndFragment-->