读书人

简单正则表达式解决方案

发布时间: 2012-02-16 21:30:36 作者: rapoo

简单正则表达式
我想把下面一段字符串里所有的图片,table都给去掉,要怎么写正则表达式呢?最后只剩下“testtest”字符串。。。

HTML code
<IMG border=0 src="/ibms/webapps/scripts/ewebeditor/uploadfile/20111220100337001.png"><TABLE style="BACKGROUND-COLOR: #ffffff; WIDTH: 100%; BORDER-COLLAPSE: collapse" border=1 cellSpacing=2 borderColor=#000000 cellPadding=3><TBODY><TR><TD> </TD><TD> </TD></TR><TR><TD> </TD><TD> </TD></TR></TBODY></TABLE><BR>testtest 


[解决办法]
Python code
html = '''<IMG border=0 src="/ibms/webapps/scripts/ewebeditor/uploadfile/20111220100337001.png"><TABLE style="BACKGROUND-COLOR: #ffffff; WIDTH: 100%; BORDER-COLLAPSE: collapse" border=1 cellSpacing=2 borderColor=#000000 cellPadding=3><TBODY><TR><TD> </TD><TD> </TD></TR><TR><TD> </TD><TD> </TD></TR></TBODY></TABLE><BR>testtest '''import reprint re.sub(r'<[^<>]*>', '', html).replace(' ', ' ').strip()
[解决办法]
自己翻译成java的。
[解决办法]
#!/usr/bin/perl -w
use strict;
my $data = <<"EOF";
<IMG border=0 src="/ibms/webapps/scripts/ewebeditor/uploadfile/20111220100337001.png">
<TABLE style="BACKGROUND-COLOR: #ffffff; WIDTH: 100%; BORDER-COLLAPSE: collapse" border=1 cellSpacing=2 borderColor=#000000 cellPadding=3>
<TBODY>
<TR>
<TD> </TD>
<TD> </TD></TR>
<TR>
<TD> </TD>
<TD> </TD></TR></TBODY></TABLE><BR>
testtest
EOF

$data =~ s/^<.*(?=testtest)//s;
print $data;

读书人网 >perl python

热点推荐