正则表达式截取页面内容
- HTML code
<table width="97%" border="0" align="center" cellspacing="0" cellpadding="0"><tr><td align="left" valign="middle" class="cvtitle">自我评价</td></tr><tr><td align="middle" valign="middle" height="4"><img src="http://img01.51jobcdn.com/im/2009/resumetemplate/line1_1.gif" width="100%" height="4"></td></tr><tr><td height="10" align="left" valign="middle"></tr><tr><td id="Cur_Val" valign="top">1.具有良好的文案能力和表达能力;<br>2.学习能力和适应能力强;<br>3.具有良好亲和力和沟通协调能力;<br>4.具有较强的数据分析能力;<br>5.具有项目管理及执行能力;<br>6.有进取心,勤奋。</td></tr><tr><td height="10" align="left" valign="middle"></tr></table>
怎么把 自我评价 和 下面的1到6个自我评价的内容取出来。
[解决办法]
(?is)(?<=<td\sid="Cur_Val"[^>]*?>).*?(?=</tr>)
[解决办法]
正则表达式:a(b)
源字符串:ab
整个匹配结果为:ab
这个表达式有两个捕获组
Group[0],就是整个表达式a(b),捕获的内容是:ab
Group[1],是(b),捕获的内容是:b
正则表达式:a(?:b)
源字符串:ab
整个匹配结果为:ab
这个表达式只有一个捕获组,Group[0],捕获的内容就是:ab
(?:exp) 以上就是只匹配,但是不捕获到捕获组中