怎么用jsoup将网页中的正文提取成txt文本
想用jsoup将一个网页中的文字提取出来存储在另外一个txt文档中。
不知道该怎么用。
System.out.println(doc.title()); 提取出来了网页的title。
正文不知道该怎么提取。。。
[解决办法]
JS中可以用document.body.innerText取网页的文本,你看看jsoup中有没有类似的方法或属性。
发布时间: 2013-03-01 18:33:02 作者: rapoo
怎么用jsoup将网页中的正文提取成txt文本
想用jsoup将一个网页中的文字提取出来存储在另外一个txt文档中。
不知道该怎么用。
System.out.println(doc.title()); 提取出来了网页的title。
正文不知道该怎么提取。。。
[解决办法]
JS中可以用document.body.innerText取网页的文本,你看看jsoup中有没有类似的方法或属性。