匹配引号之间除逗号以外的任何内容

2022-02-27 00:00:00 regex match java

我有此正则表达式:(?<=")(?:\.|[^"\])*(?=")

它匹配引号内的每个字符,并排除引号本身。

当我使用这样的字符串尝试时:

"one","two","three"

它还匹配逗号,因此匹配结果如下:

one
,
two
,
three

有没有办法修改正则表达式使其排除那些逗号?也就是说,输出为:

one
two
three

我需要在正则表达式中排除那些引号,并且不在匹配结果中包含逗号。

这是我最大的正则表达式:

((0[1-9]|[12][0-9]|3[01]).(0[1-9]|1[012]).dddd)|(([0-1][0-9])|([2][0-3])):([0-5][0-9]):([0-5][0-9])|"((?:\.|[^"\])*)"

第一部分匹配日期:dd.mm.yyyy

((0[1-9]|[12][0-9]|3[01]).(0[1-9]|1[012]).dddd)

第二部分匹配时间:hh:mm:ss

(([0-1][0-9])|([2][0-3])):([0-5][0-9]):([0-5][0-9])

最后一个应该匹配引号之间的所有字符:

";((?:.|[^";])*)

但是正则表达式上的最后一部分不能以不排除引号的方式工作。此外,由于某些原因,它会删除字符串中用引号引起来的所有空格。

输入是包含如下字符串的文本文件:

"AK Pz 310u PI-13-5","23.02.2015","07:45:00","23.02.2015","09:20:00","False","True","23.02.2015","07:40:00","2","Common","AK Pz 310u PI-13-5","Common"

预期输出是引号中的值数组(当然,本身不带逗号和引号)。我之所以使用这么大的正则表达式来匹配日期和时间,是因为如果它们是错误的,就不应该进行匹配。


解决方案

要使您的正则表达式不匹配逗号,您需要删除环绕式,并使用捕获组来获取双引号之间的内容。因为查找是不匹配任何字符的断言。因此,在此"one","two","three"输入中,首先您的正则表达式与one匹配,然后它与以下,匹配,因为双引号中也有逗号。

"((?:\.|[^"\])*)"

此正则表达式强制匹配每个挡路双引号字符串。

Java代码将是

String value = ""one","two","three"";
Matcher m = Pattern.compile(""((?:\\.|[^"\\])*)"").matcher(value);
while(m.find())
{
    System.out.println(m.group(1));
}

输出:

one
two
three

DEMO

相关文章