读书人

!利用java中的正则表达式解析html网页

发布时间: 2012-01-03 22:16:06 作者: rapoo

高手指点!利用java中的正则表达式解析html网页的问题?
我要获取网页中这段代码的文字部分:
<table width=100% cellpadding=3 cellspacing=2>
<tr align=center bgcolor=ffcc00>
<td align=left>  城市 </td>
<td> 区号 </td>
<td> 邮编 </td>
</tr>
<tr align=center bgcolor=FFF7AE>
<td align=left>  阜新市 </td>
<td> 0418 </td>
<td> 123000 </td>
</tr>
</table>
求正则表达式写法??????????????

[解决办法]
String noHtmlContent = content.replaceAll( " <[^> ]*> ", " ");
[解决办法]
Pattern pattern = Pattern.compile( " <[^ <|> ]*> ");
[解决办法]
自己写个过滤的类呗
不是难事情!

读书人网 >J2SE开发

热点推荐