读书人

Jsoup-1.6.0的一个bug解析html标签内

发布时间: 2012-11-18 10:51:21 作者: rapoo

Jsoup-1.6.0的一个bug—解析html标签内容只是0被忽略掉了

有一个需求,想要把带html标签的字符串中的纯文本内容做截取,尝试使用Jsoup,版本是 jsoup-1.6.0.jar, 使用起来确实方便,但发现一个问题,标签中内容如果只有一个0的话Jsoup居然不认,很奇怪

?

String html = "<span lang=EN-US>0</span>";Document doc = Jsoup.parse(html);Elements eles = doc.getElementsByTag("span");Element span = eles.get(0);System.out.println(span.hasText());//falseSystem.out.println(span.ownText());//空串

?

暂时没有好的解决办法。

?

--------------------

哈哈, Stackoverflow 真强大,问题刚发就有人回应,一楼的哥们说是jsoup的bug,他用jsoup-1.3.3就正常。我试了一下,还真是。但有一个问题是我用了Element.clone()方法,1.3.3的版本还不支持,我继续试了更新的版本,最好又支持clone方法又没有这个bug。结果发现是在1.6的时候新出的bug,所以可以使用1.6之前最新的版本 jsoup-1.5.2.jar,哈,问题解决了。

?

注:

1. 问题放到了Stackoverflow上,呵呵,第一次去那儿;

2. 初步感觉Stackoverflow上面问问题比je的问答频道更好些,呵呵。

读书人网 >CSS

热点推荐