读书人

如何自动提取下载下来的网页源码里新

发布时间: 2012-03-15 11:50:39 作者: rapoo

怎么自动提取下载下来的网页源码里,新闻的发布时间呀?
怎么自动提取下载下来的网页源码里,新闻的发布时间呀?求高手帮我解决下,准确度和成功率最好高点,谢谢。。

[解决办法]
仔细分析下 那个网页里面 显示时间的标签特征,然后根据这个特征去截取。
或者用 正则表达式。
[解决办法]
嗯,难道那个新闻网站没有提供RSS、Atom之类的内容发布协议么?
要是支持的话,XML解析是很容易的,因为都很规整。

读书人网 >C++

热点推荐