读书人

JAVA除去HTML代码

发布时间: 2012-10-08 19:54:56 作者: rapoo

JAVA去除HTML代码

import java.util.regex.Matcher;import java.util.regex.Pattern;public class Test {/** * @param args */public static void main(String[] args) {// TODO Auto-generated method stub        String content="<p>郎酒15年陈红花郎酒53°500ML,楼兰蛇龙珠戈壁干红(铁盒)750ML,组合                                  价699元。</p>";    Pattern patt=Pattern.compile("<[^>]+>([^<]*)</[^>]+>");    Matcher m=patt.matcher(content);    while(m.find()){    content=content.replaceFirst("<[^>]+>([^<]*)</[^>]+>", m.group(1).toString());    }    System.out.println(content);         //郎酒15年陈红花郎酒53°500ML,楼兰蛇龙珠戈壁干红(铁盒)750ML,组合价699元。}}

?

读书人网 >CSS

热点推荐