读书人

网页抓取如何除去注释

发布时间: 2013-12-10 15:05:55 作者: rapoo

网页抓取怎么除去注释
网站抓取来源比较多,有些网站会在部分页面不定期加上不同的注释,导致抓取结果里面包含了代码,如果统一将注释去掉?求解决方案 java
[解决办法]

str.replaceAll("<!--.*?-->", "");

[解决办法]
str.replaceAll("<!--.*?-->", "");
试试这个
[解决办法]
楼主想去掉"<!-- -->",可以用楼上两位的代码
[解决办法]
str.replaceAll("<!--.*?-->", "");

读书人网 >J2SE开发

热点推荐