读书人

求java或Python 网络爬虫,该怎么解决

发布时间: 2012-03-11 18:15:38 作者: rapoo

求java或Python 网络爬虫
小弟我现在想找一个网络爬虫,找了一下网上的全是把整个网站给镜像了.我想要的结果是如淘宝网:能把网站的产品图片,及对应的产品信息给抓下来.我想了一下,大概的功能应该就是要抓下面的内容:
1.产品所在的页面url
2.产品图片
3.产品对应的信息(只要能抓到页面,可自己解析页面取值)

能分类对应.不是网上的那种把整个网站给抓下来.

急!谢谢各位了!



[解决办法]
还要分类?
这个有点难度啊,五一以后研究下吧!

读书人网 >网络基础

热点推荐