Java 正则中的(.*?)vs(.*)
@author YHC
public static void main(String[] args) { //选择最小和最大重复次数String a="{user=\"administrator\",password=\"root\"}";String b="user =\"a\"";//注意=号之间有空格String c="user\r\n=\"c\"";//注意有换行符号//获取双引号之间的内容,分别获得a,b,c中的所有的用户的名称String regex="(?s)user.*?=(\".*?\")";match(regex,a);//user="administrator"match(regex,b);//user ="a"match(regex,c);//user //="c"//上面的非常简单,注意以下事例//选择最小和最大重复数//注意以下几点,user =这个之间可能有空格//我们需要的结果是找出user='xxx'的信息,其余不要String notice="[{user='admin',password='admin'}," + "{user='yhc',password='yhc'}]";//也许大家会觉得.*?为什么需要?号,那么一下我们看看//有?和没有?的区别String regex1="user.*='(.*?)'";//user.*=之间没有?match(regex1, notice);//输出结果(错误):user='admin',password='admin'},{user='yhc',password='yhc'String regex2="user.*?='(.*?)'";//user.*=之间有?match(regex2, notice);//输出结果(正确)://user='admin'//user='yhc'//为什么上面就因为一个?号而有这么大的区别咧?//解释以上代码运行机制//有了匹配文本中的第一个user之后,引擎就会到达(.*),其中点号(.)可以//匹配任意字符,其中包括换行符,星号(*)则把它重复0次或更多次,请注意,//这里的星号(*)是贪心的,因此点星(.*)会匹配直到目标文件结束的所有的//内容,注意=====>>>>(.*)会吃了所有的目标文件内容,从第一个匹配//user的地方开始;//当(.*)把肚子吃饱之后,引擎才会试图去匹配在目标文本末尾的=//这个表达式,当然,一定会匹配失败,但这并不会代表此次匹配就结束了,//正则引擎会进行回溯backtrack,当匹配某一个位置之后//,正则表达式都会保存一个回溯位置,如果正则表达式匹配之后的文本失败后//那么正则引擎还可以回到这些位置//当=匹配匹配失败之后,引擎进行回溯,让(.*)放弃它的匹配中的一个//字符接着=会被再次尝试匹配,这次在文本中的最后一个字符的位置,//如果依然失败的话,那么引擎会再一次进行回溯在文件的倒数第2个字符出尝试匹配//这个过程会一直继续,直到=匹配成功位置,如果一直没有匹配成功,那么最终(.*)//会用完所有的回溯位置,然后正则匹配失败//如果在整个回溯的过程中=在某个点匹配成功,那么就会接着尝试匹配'如果'匹配//失败,引擎接着进行回溯,这个过程会一直重复,直到='(.*?)'可以被匹配为止//问题就出现在.*上,因为星号是贪心的,所以你们要注意哦!//我们需要使用lazy 懒惰 可以在后面放一个?使其变为懒惰//例如:(*?),(+?),(??) ,{1,100}? 都可以将其变为懒惰}public static void match(String regex,String input){ //创建正则对象 Pattern pattern=Pattern.compile(regex); //匹配对象 Matcher matcher=pattern.matcher(input); //输出匹配字符串 while(matcher.find()){ System.out.println(matcher.group()); }}
如果以上有写错误的地方,请大家指出,thanks!