读书人

解析html网页,该怎么解决

发布时间: 2013-04-21 21:18:07 作者: rapoo

解析html网页
各位,我要读取个纯html页面,获取里面的内容解析html网页,该怎么解决里面的东西我都要,存到数据库里,用正则太麻烦,而且东西可能会变的,有没有其他的方式,类似搞xml的?谢谢各位了 html 数据库
[解决办法]
正则最简单,用其它办法更麻烦
[解决办法]

引用:
引用:用HtmlAgilityPack.dll ,使用XPath表达式爬。。我下载了个,朋友这个xpath能直接读取url吗,要是能的话,写下代码吧?谢谢


首先实例化一个HtmlDocument
HtmlDocument document = new HtmlDocument();
然后HtmlDocument 有Load方法和LoadHtml方法,分表从Stream加载和文本中加载。你用WebRequest获取到资源,解析就行了。关键要学会XPath表达式。

读书人网 >asp.net

热点推荐