读书人

关于httpunit抓取动态网页的小疑点

发布时间: 2013-06-26 14:29:32 作者: rapoo

关于httpunit抓取动态网页的小问题
现在写了一个抓取代码 所有功能已经配置好


for (int i = 0; i < config.getMaxPage(); i++) {
int pagecount =i*20;
HtmlPage page = webClient
.getPage("http://video.baidu.com/v?word="
+ config.getKeyword()
+ "&ct=301989888&rn=20&pn=0&db=0&s=0&fbl=800&tpl=videoMultiNeed#pn="
+ pagecount);
String xml = page.asXml();//输出了一下xml 发现还是 pagecount第一次的值的url 各位大牛知道这是啥情况吗 可是输出了url 确实是改变后的了

Document doc = Jsoup.parse(xml);

//下面是具体解析



[解决办法]
恭喜楼主,问题解决了。

读书人网 >J2EE开发

热点推荐