读书人

用正则表达式掏出div中的链接部分!跪

发布时间: 2013-09-09 20:31:09 作者: rapoo

用正则表达式取出div中的链接部分!跪求!泪奔!想了一个月了
一开始在学正则表达式 但是还是没能写出来!


数据是这样:


<div>
<!-- Start link loop -->
<!-- -->


<!-- End link loop -->
</div>


<div align="center"> <!-- Start link loop -->
?<br/><div class="link_normal">
<div class ="xdir_title">
<!----><a href="http://www.baidu.net?lid=75597">这是我的百度钓鱼站!</a>
<!-- 08月05日 10:32-->
</div>



我想取出来http://www.baidu.net?lid=75597和这是我的百度钓鱼站!

要怎么做!
[解决办法]
这样子:

(?is)<div class ="xdir_title">.*?<a\b[^>]*?href=(['"]?)(?<href>[^'"]+)\1>(?<v>.*?)</a>
[解决办法]
引用:
Quote: 引用:

Quote: 引用:

Quote: 引用:

string html = ...
Match m = Regex.Match(html, @"\<a\shref\=\"(.*?)">(.*?)\<\/a\>");
string s1 = m.Groups[1].Value; // http://www.baidu.net?lid=75597
string s2 = m.Groups[2].Value; //这是我的百度钓鱼站!

那个出来太多啦,还有别的:这些也出来啦!

<li><a href="http://www.baidu.net?lid=75597">登录</a></li>
<li><a href="http://www.baidu.net?lid=75597">注册</a></li>

你想要什么,不想要什么。

我就想要前面带有:
<div class ="xdir_title">
<!----><a href="http://www.iteer.net/modules/xdirectory/singlelink.php?lid=75597">北京万古恒信科技有限公司</a>
</div>

也就是<div class ="xdir_title"></div>中的那一段href!

那5L糖糖的应该是正解。

读书人网 >C#

热点推荐