Injector部分人
1.urls文件中取url信息并以sequence的方式入到tempdir中(M/R)
2.合并tempdir和crawlDB到tempcrawlDB(判是否需要inject urls文件中的url)(M/R)
3.用tempcrawlDB覆掉crawlDB
于垂直搜索,人得url的score是有多少用的
发布时间: 2012-12-23 11:28:15 作者: rapoo
Injector部分人
1.urls文件中取url信息并以sequence的方式入到tempdir中(M/R)
2.合并tempdir和crawlDB到tempcrawlDB(判是否需要inject urls文件中的url)(M/R)
3.用tempcrawlDB覆掉crawlDB
于垂直搜索,人得url的score是有多少用的