读书人

正则表达式兑现除去重复的单词

发布时间: 2013-01-20 10:22:40 作者: rapoo

正则表达式实现除去重复的单词

起因:还是动态生成图表时的问题,因为字段是动态设定的,可以在多个轴、序列中设置字段,这就很有可能会存在字段的重复问题。重复的字段生成Sql并执行是没有问题的,但执行的结果,生成List(执行Hibernate的sqlquery.setResultTransformer(Transformers.ALIAS_TO_ENTITY_MAP).list())时就会有问题了(抛出异常)。所以就要除去查询sql字段中的重复字段。

首先想到的是把字符串分隔成数组,再添加到set中,再用Set中的字段名重新生成不重复的字段名字符串。

代码是这样的:

String s = "LOWVOLTAGE_LOSS_RATE,YEARMONTH,LOWVOLTAGE_LOSS_RATE,NAME,YEARMONTH,PPQ,PPQ,SPQ,PPQ,PPQ,SPQ,CODE,LOWVOLTAGE_LOSS_RATE";Pattern p = Pattern.compile("(\\b[\\w|_]+\\b,?)(.*)\\1(.*)");Matcher matcher = p.matcher(s);while(matcher.find()){s = matcher.replaceAll("$1$2$3");System.out.println(s);matcher = p.matcher(s);}if(s.endsWith(","))s = s.substring(0,s.length()-1);String expect = "LOWVOLTAGE_LOSS_RATE,YEARMONTH,NAME,PPQ,SPQ,CODE";Assert.assertEquals(expect, s.substring(0,s.length()-1));

验证结果为预期结果。

本来以为到这里就已经结束了,可系统刚运行了一会,就报出了错误,跟踪发现,当要处理的字符串为:

"D_NAME,COMPANYID,COMPANY_NAME,PARENT_ID,ID,COMPANYID,COMPANY_NAME,DF_UNIFIED_CODE,DF_CLEARANCE_TAG_ID,"时,执行的结果会把“DF_CLEARANCE_TAG_ID”替换成“DF_CLEARANCE_TAG_”,这可不是我要的结果!

经改进后的正则表达式为:(\b[\w|_]+\b,?)(.*)\b\1\b (.*),再次测试,结果完全满足要求。







读书人网 >编程

热点推荐