读书人

python html parser库lxml的引见和使用

发布时间: 2013-11-13 14:04:18 作者: rapoo

python html parser库lxml的介绍和使用
使用由 Python 编写的 lxml 实现高性能 XML 解析 http://blog.csdn.net/yatere/article/details/6667043

用lxml解析HTMLhttp://www.cnblogs.com/descusr/archive/2012/06/20/2557075.html


分步遍历:比先遍历得到body的某个div,然后在使用这个div的内容做遍历基础,继续通过它往下遍历

>>> dom.xpath('body/div[1]')[0].tag'div'



参考:
lxml的官方文档:http://codespeak.net/lxml/
HtmlParser的性能:http://blog.ianbicking.org/2008/03/30/python-html-parser-performance/

读书人网 >CSS

热点推荐