python汉字识别问题~
要用python写一个网页新闻爬虫,我想通过寻找(urllib2.urlopen(urllib2.Request(url))).read()中的汉字串最长的那部分作为新闻内容,取出print,现在问题是python中该如何识别汉字哈~~~~高手帮帮忙,小弟拜谢~
[解决办法]
转成unicode,然后使用汉字的unicode区间。
发布时间: 2012-02-20 21:18:23 作者: rapoo
python汉字识别问题~
要用python写一个网页新闻爬虫,我想通过寻找(urllib2.urlopen(urllib2.Request(url))).read()中的汉字串最长的那部分作为新闻内容,取出print,现在问题是python中该如何识别汉字哈~~~~高手帮帮忙,小弟拜谢~
[解决办法]
转成unicode,然后使用汉字的unicode区间。