高手指点!利用java中的正则表达式解析html网页的问题?
我要获取网页中这段代码的文字部分:
<table width=100% cellpadding=3 cellspacing=2>
<tr align=center bgcolor=ffcc00>
<td align=left> 城市 </td>
<td> 区号 </td>
<td> 邮编 </td>
</tr>
<tr align=center bgcolor=FFF7AE>
<td align=left> 阜新市 </td>
<td> 0418 </td>
<td> 123000 </td>
</tr>
</table>
求正则表达式写法??????????????
[解决办法]
String noHtmlContent = content.replaceAll( " <[^> ]*> ", " ");
[解决办法]
Pattern pattern = Pattern.compile( " <[^ <|> ]*> ");
[解决办法]
自己写个过滤的类呗
不是难事情!