读书人

正则表达式截取html,该如何解决

发布时间: 2013-01-06 15:44:47 作者: rapoo

正则表达式截取html

1.现有超链接如下:<a href="products/F0/food/----------------------20----OFFSET5/2.html " rel="nofollow">Next</a>
实现效果:截取超链接Next对应的href。

2.现有表格如下
<table class="table-1">
<tr>
<th>Name</th>
</tr>
<tr>
<th>Address</th>
</tr>
<tr>
<th>Telephone</th>
</tr>
</table>
实现效果:截取<th>Name</th>所在的<tr>

注:请使用正则表达式(在C#中运行)
[解决办法]
C# 正则:

1. (?i)(?<=<a\b[^>]*?href=(['"]?))[^'"]+(?=\1[^>]*?>Next</a>)
2. (?is)<tr>.*?<th>Name</th>.*?</tr>

js正则:

1. var reg=/<a\b[^>]*?href=(['"]?)([^'"]+)\1[^>]*?>Next<\/a>/i; 取分组2的值
2. var reg=/<tr>.*?<th>Name<\/th>.*?<\/tr>/i;

读书人网 >Web开发

热点推荐