读书人

请教怎样抓取网页更新后的内容

发布时间: 2012-03-14 12:01:13 作者: rapoo

请问怎样抓取网页更新后的内容?
每次更新时需要将网站重新抓取一遍,这样做太费时了,能否只抓取网站更新的内容,老的内容就不抓取了呢?

[解决办法]
根据什么来判断网页是否更新?LastModified??如果有固定的方法,程序应该能实现。
[解决办法]
好像http头有最后更新时间,没研究过,最近正在看,以前看过提及过,不知道是不是正确

读书人网 >网络基础

热点推荐