读书人

正则表达式提取内容,该如何处理

发布时间: 2012-02-05 12:07:15 作者: rapoo

正则表达式提取内容
<table border=0 cellPadding=0 cellSpacing=0 width=98% valign=top align=center>
<tr>
<td width=4%> </td>
<td colspan=2 width=92% >
<table border=1 cellPadding=0 cellSpacing=0 width=100% valign=top align=center bordercolorlight= "#CCCCCC " bordercolordark= "#ccffcc ">
<tr height=26 bgcolor=#E3E3E3> <td colspan=4 align=center class=xt> <font color=black> 第一卷 莫名其妙   [ <a href= '# ' onclick=window.open( 'readchapterall.asp?bl_id=95133&bookchapterid=201 ') > 分卷阅读 </a> ] </td> </tr> <tr vlign=top class=xt align=left style= 'padding:4 '> <td width= '33.3333333333333% '>
<a href= 'javascript:gotopage(2533768) ' title= '本章字数:2835 更新日期:2007-1-22 ' target=_top> 第一章 色狼下山 </a>

</td> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2533771) '
title= '本章字数:2311

更新日期:2007-1-22 '
target=_top> 第二章 遭遇怪兽 </a> </td> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2533775) '
title= '本章字数:2307

更新日期:2007-1-22 '
target=_top> 第三章 人妖同流 </a> </td> </tr> <tr vlign=top class=xt align=left style= 'padding:4 '> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2535077) '
title= '本章字数:2651

更新日期:2007-1-23 '
target=_top> 第四章 英雄落魄 </a> </td> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2537127) '
title= '本章字数:2705

更新日期:2007-1-23 '
target=_top> 第五章 末日神功 </a> </td> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2539099) '
title= '本章字数:3270

更新日期:2007-1-24 '
target=_top> 第六章 初入警局 </a> </td> </tr> <tr vlign=top class=xt align=left style= 'padding:4 '> <td width= '33.3333333333333% '> <a href= 'javascript:gotopage(2541114) '
title= '本章字数:3206

更新日期:2007-1-24 '
target=_top> 第七章 命相奇术 </a> </td> <td>   </td> <td>   </td> </tr>
</table>
</td>
<td width=4%> </td>
</tr>
</table>

</table>
不知怎样用正则表达式将 'javascript:gotopage(2541114)中的数字取出和将章节名称-例如:“第七章 命相奇术”取出。要取出全部章节。

[解决办法]
汗哪,刚才在那个帖子里问楼主是不是这个意思,楼主那么快就结帖了,那样取出来根本就是毫无意义的,试下下面的

MatchCollection mc=Regex.Matches(yourStr,@ "gotopage\((? <number> \d+)\)[\s\S]*?> (? <title> [\s\S]*?) </a> ",RegexOptions.IgnoreCase);

foreach(Match m in mc)
{

m.Groups[ "number "].Value;   //数字串
m.Groups[ "title "].Value; //标题

}

读书人网 >C#

热点推荐