读书人

求读取多个嵌套标签的网页html正则表达

发布时间: 2012-03-13 11:21:12 作者: rapoo

求读取多个嵌套标签的网页html正则表达式
html如下:

<table width=100% border=0 cellspacing=0 cellpadding=0 style= "line-height:15pt; "> <tr> <td> <span style=font-size:12px;> [求助]新名称!!谢谢!拜托了 <br>
编辑 <br>
名称! <br>
拜托各位了! <br>
<img src= "../images/UBBicon/em03.GIF " width=20 height=20 align=absmiddle border=0> <img src= "../images/UBBicon/em03.GIF " width=20 height=20 align=absmiddle border=0> </span> </td> </tr> </table>


我想从中提取到:

[求助]新名称!!谢谢!拜托了 <br>
编辑 <br>
名称! <br>
拜托各位了! <br>
<img src= "../images/UBBicon/em03.GIF " width=20 height=20 align=absmiddle border=0> <img src= "../images/UBBicon/em03.GIF " width=20 height=20 align=absmiddle border=0>


请问正则表达式应该怎么写?

我是这样写的:Regex reg = new Regex(@ " <table[^> ]*?> <tr[^> ]*?> <td[^> ]*?> <span[^> ]*?> (? <desc> [^ <]*?) </span> </td> </tr> </table> ");

但不行!

[解决办法]
你到底想要什么样的结果,如果像你例子所说,我修改的那个就可以了,所以只是解释一下你的匹配不成功的原因

<table[^> ]*?> <tr[^> ]*?> <td[^> ]*?> <span[^> ]*?> (? <desc> [\s\S]*?) </span> </td> </tr> </table>

读书人网 >C#

热点推荐