读书人

用SAX解析html,有什么比较好用的包吗?

发布时间: 2012-02-21 16:26:23 作者: rapoo

用SAX解析html,有什么比较好用的包吗?
rt

[解决办法]
SAX是解析XML文件的一种方法,使用SAX只能解析XHTML文件.

如果是使用C语言,最经典的SDK库就是expat了:
http://expat.sourceforge.net/
[解决办法]
解析XHTML可以用我们封装的DOM,SAX API程式库
http://resource.netsoftlab.ca/topic.php?a=disp&id=8
技术支持: ericwang[at]netsoftlab.ca

[解决办法]
nutch里面提供了一个html的解析接口。
生成一个解析树,蛮好用。就是解析速度有点慢,可能一个文件要几十到几百ms。
[解决办法]
http://sourceforge.net/projects/htmlparserjava 的htmlparser.

读书人网 >网络基础

热点推荐