抓取谷歌网页有关问题

发布时间： 2012-12-20 09:53:21 作者： rapoo

抓取谷歌网页问题
当使用
URL url = new URL("http://www.google.cn/search?hl=zh-CN&newwindow=1&q=北京&start=0&sa=N");
url.openStream() 时候发现报403访问拒绝错误，是由于谷歌对java 程序进行限制，缺少Agent。

解决办法：
URL url = new URL("http://www.google.cn/search?hl=zh-CN&newwindow=1&q=北京&start=0&sa=N");
URLConnection con = url.openConnection();
con.setRequestProperty("User-Agent","Mozilla/4.0 (compatible; MSIE 5.0; Windows XP; DigExt)");
InputStream in = con.getInputStream();

抓取谷歌网页有关问题

热点推荐