读书人

求好手帮忙写个正则表达式

发布时间: 2013-07-04 11:45:55 作者: rapoo

求高手帮忙写个正则表达式

小弟在做一个winform的爬虫,想写个正则表达式来读数据,但是技术有限,一直写不出来。请高手帮忙下。


<li>
<div>
<h3><a href="http://1.html" target="_blank" >标题</a></h3>
<p>摘要</p>
</div>
<p class="source">来自:<a href="2.html" target="_blank">来源</a>
作者:<a href="3.html" target="_blank">作者</a>
时间:<span>时间</span>
回复:<span>回复数</span></p>
</li>

想得到的结果
1.html 标题 摘要 来源 作者 时间 回复数
这几个数值,拜托啦~~~~ 正则表达式 WinForm
[解决办法]

(?is)<li>\s*<div>\s*<h3><a href="(?<html>.*?)".*?>(?<title>.*?)</a></h3>\s*<p>(?<sence>.*?)</p>\s*</div>\s*<p class="source">.*?<a href.*?>(?<source>.*?)</a>\s*.*<a href=".*?>(?<author>.*?)</a>\s*.*?<span>(?<time>.*?)</span>\s*.*?<span>(?<retimes>.*?)</span></p>\s*</li>


根据你的需求从左往右的去取吧

读书人网 >C#

热点推荐