将网页源代码转换为xml
我现在需要将网页的源代码转换为xml,可是网页中有img这种不是成对出现的标签,所以我想请教大家如何处理呢。
我的思路是for循环查找然后在img标签后面添加一个</img>使其闭合,可是问题来了,因为html不小所以循环的话非常吗,所以请问大家有其他的办法吗?
[解决办法]
发布时间: 2012-09-18 16:21:42 作者: rapoo
将网页源代码转换为xml
我现在需要将网页的源代码转换为xml,可是网页中有img这种不是成对出现的标签,所以我想请教大家如何处理呢。
我的思路是for循环查找然后在img标签后面添加一个</img>使其闭合,可是问题来了,因为html不小所以循环的话非常吗,所以请问大家有其他的办法吗?
[解决办法]