读书人

这个正则表达式怎样写,该怎么处理

发布时间: 2012-05-11 12:55:37 作者: rapoo

这个正则表达式怎样写
<table width="99%" >
<tr>
<td class="data" style="width:120pt" nowrap><font class="sameasbody">
公司编号∶</font></td>
<td class="data"><font class="sameasbody">0000005</font>
<input type="hidden" name="crno" value="0000005">
</td>
</tr>

<tr>
<td valign="top" class="data" style="width:120pt"><font class="sameasbody">
公司名称∶</font></td>
<td class="data"><span class="coyname">
HONG KONG FIRE INSURANCE COMPANY LIMITED -THE-
</span></td>
</tr>
<tr>
<td class="data"><font class="sameasbody">
公司分类∶</font></td>
<td class="data"><font class="sameasbody">
本地公司

</font></td>
</tr>
<tr>
<td class="data"><font class="sameasbody">
成立日期∶</font></td>
<td class="data"><font class="sameasbody">
1868年12月23日
</font></td>
</tr>
<tr>
<td class="data" valign="top"><font class="sameasbody">
公司类别∶</font></td>
<td class="data"><font class="sameasbody">
公众非上市公司

</font></td>
</tr>
<tr>
<td class="data" valign="top"><font class="sameasbody">
公司现况∶</font></td>
<td class="data"><font class="sameasbody">
已告解散

</font></td>
</tr>
<tr>
<td class="data" valign="top"><font class="sameasbody">
备注∶</font></td>
<!-- <td class="data" valign="middle"><pre><font class="sameasbody">清<br>已告解散(成自清)
</font></pre></td> /-->
<td class="data" valign="middle"><font class="sameasbody">清<br>已告解散(成自清)
</font></td>
</tr>
<tr>
<td class="data"><font class="sameasbody">
清盘模式∶</font></td>
<td class="data"><font class="sameasbody">
成员自动清盘

</font></td>
</tr>
<tr>
<td class="data"><font class="sameasbody">
已告解散日期∶</font></td>

<td class="data"><font class="sameasbody">
2004年3月5日
</font></td>

</tr>
<tr>
<td class="data"><font class="sameasbody">
押记登记册∶</font></td>
<td class="data"><font class="sameasbody">


</font></td>
</tr>
<tr>
<td class="data"><font class="sameasbody">


重要事项∶</font></td>
<td class="data"><font class="sameasbody">-</font></td>
</tr>

</table>

取去 TR 数据放到List 如:
KET value
公司编号 0000005
公司名称 HONG KONG FIRE INSURANCE COMPANY LIMITED -THE-
公司分类 本地公司
。。。。。。
加入加到LIst里


[解决办法]

手写的

C# code
Dictionary<string,string> dic=new Dictionary<string,string>();MatchCollection mc=Regex.Matches("你的html代码",@"(?is)<tr>\s*<td[^>]*><font[^>]*>(.*?)</font></td>.*?<td[^>]*>(<font[^>]*>|<span[^>]*>)(.*?)(</font>|</span>).*?</td>\s*</tr>");foreach(Match m in mc){   dic.Add(m.Groups[1].Value,m.Groups[3].Value);} 

读书人网 >asp.net

热点推荐