读书人

有研究过nutch crawl 的来

发布时间: 2012-03-09 16:54:56 作者: rapoo

有研究过nutch crawl 的高手进来
现在我要研究的是nutch的分层抓取、索引
nutch默认的也是分层抓取,但是索引是最后做的。我希望是抓取一层,接着就做索引,然后抓取第二层,在做索引,然后把第一层的索引和第二层的索引合并起来,请问这样能实现吗?

最好能讲下思路!

谢谢了!

[解决办法]

读书人网 >网络基础

热点推荐