使用nutch抓取别人网站主要实现什么需求
已会简单的抓取别人网站文章的标题和内容然后存到数据库中,不过还不是很清楚这样做为了实现什么需求,什么样的项目需要用到这样的功能?
[解决办法]
“接口”的一种,不需要第三方支持的内容同步方式
可以使用在很多场合,例如:转载的新闻信息等。
[解决办法]
这个,貌似有人抓取连接进行下载资源,例如图片。视频等等
[解决办法]
可以是搜索站内信息这种功能
发布时间: 2013-03-06 16:20:31 作者: rapoo
使用nutch抓取别人网站主要实现什么需求
已会简单的抓取别人网站文章的标题和内容然后存到数据库中,不过还不是很清楚这样做为了实现什么需求,什么样的项目需要用到这样的功能?
[解决办法]
“接口”的一种,不需要第三方支持的内容同步方式
可以使用在很多场合,例如:转载的新闻信息等。
[解决办法]
这个,貌似有人抓取连接进行下载资源,例如图片。视频等等
[解决办法]
可以是搜索站内信息这种功能