读书人

广域网爬虫,该如何解决

发布时间: 2012-03-21 13:33:14 作者: rapoo

广域网爬虫
问各位大侠:给你一亿个网站URL,我要收集到所有网站关于公司信息的属性(联系人、电话等等)?
望各位给出设计思路或是代码

[解决办法]
这个也忒猛了
这个怎么抓?
一亿个网站没有共同点,获取页面信息搜索“联系我们” or “联系电话”????

不懂,帮顶吧
[解决办法]

探讨

这个也忒猛了
这个怎么抓?
一亿个网站没有共同点,获取页面信息搜索“联系我们” or “联系电话”????

不懂,帮顶吧

读书人网 >.NET

热点推荐