求java或Python 网络爬虫
小弟我现在想找一个网络爬虫,找了一下网上的全是把整个网站给镜像了.我想要的结果是如淘宝网:能把网站的产品图片,及对应的产品信息给抓下来.我想了一下,大概的功能应该就是要抓下面的内容:
1.产品所在的页面url
2.产品图片
3.产品对应的信息(只要能抓到页面,可自己解析页面取值)
能分类对应.不是网上的那种把整个网站给抓下来.
急!谢谢各位了!
[解决办法]
还要分类?
这个有点难度啊,五一以后研究下吧!
发布时间: 2012-03-11 18:15:38 作者: rapoo
求java或Python 网络爬虫
小弟我现在想找一个网络爬虫,找了一下网上的全是把整个网站给镜像了.我想要的结果是如淘宝网:能把网站的产品图片,及对应的产品信息给抓下来.我想了一下,大概的功能应该就是要抓下面的内容:
1.产品所在的页面url
2.产品图片
3.产品对应的信息(只要能抓到页面,可自己解析页面取值)
能分类对应.不是网上的那种把整个网站给抓下来.
急!谢谢各位了!
[解决办法]
还要分类?
这个有点难度啊,五一以后研究下吧!