python 爬取指定url的ICP备案信息(结构化抓取)
time.sleep(2) pass
每次抓取都会sleep 2s,防止ip被封,实际上即使sleep了IP过一段时间还是会被封
由于是结构化抓取,当网站格式变化此程序将无法使用
发布时间: 2013-04-07 12:50:11 作者: rapoo
python 爬取指定url的ICP备案信息(结构化抓取)
time.sleep(2) pass
每次抓取都会sleep 2s,防止ip被封,实际上即使sleep了IP过一段时间还是会被封
由于是结构化抓取,当网站格式变化此程序将无法使用