Java 正则表达式根据字符进行转义
我必须把一大堆电子邮件和名字分开,我必须用逗号分开,但有些名字里有逗号,所以我必须先处理这个问题。幸运的是,名字在“引号”之间 例如,现在我使用我的正则表达式输出(编辑:它不会在我看到的论坛中显示电子邮件!):Java 正则表达式根据字符进行转义,java,regex,Java,Regex,我必须把一大堆电子邮件和名字分开,我必须用逗号分开,但有些名字里有逗号,所以我必须先处理这个问题。幸运的是,名字在“引号”之间 例如,现在我使用我的正则表达式输出(编辑:它不会在我看到的论坛中显示电子邮件!): “塔尔布姆,埃丝特” “沃尔德,何塞·范德” “黛比·德克森”,科琳 最后一个出现了错误,因为名称没有逗号,所以它会继续运行,直到找到一个,而这正是我要用来分隔的名称。因此,我希望它查找,直到找到“为止。我将使用String.split和String.replaceAll简化代码。这避
“塔尔布姆,埃丝特”
“沃尔德,何塞·范德”
“黛比·德克森”,科琳
最后一个出现了错误,因为名称没有逗号,所以它会继续运行,直到找到一个,而这正是我要用来分隔的名称。因此,我希望它查找,直到找到“为止。我将使用
String.split
和String.replaceAll
简化代码。这避免了使用模式的麻烦,并使他代码简洁明了。
试试这个:
public static void main(String[] args) {
String test = "\"Talboom, Esther\" <E.Talboom@wegener.nl>, \"Wolde, Jos van der\" <J.vdWolde@wegener.nl>, \"Debbie Derksen\" <deberken@casema.nl>, corine <corine5@xs4all.nl>, \"Markies Aart\" <A.Markies@wegenernieuwsmedia.nl>";
// Split up into each person's details
String[] nameEmailPairs = test.split(",\\s*(?=\")");
for (String nameEmailPair : nameEmailPairs) {
// Extract exactly the parts you need from the person's details
String name = nameEmailPair.replaceAll("\"([^\"]+)\".*", "$1");
String email = nameEmailPair.replaceAll(".*<([^>]+).*", "$1");
System.out.println(name + " = " + email);
}
}
我以前使用的正则表达式与您之前使用的相同,直到我发现它对(合法的)名称(如“me”,
@fge)会失败。通常,通过两个步骤来完成这些事情更容易—它倾向于保持正则表达式的可读性,并且更容易理解、调试和维护,.split()
将在内部使用一个模式
,不同之处在于它必须为每个split()调用创建一个新的模式--
也可以使用一个模式及其提供的split()
method;)是的,这正是我所做的——请参阅我的解决方案因为它更易于阅读,所以您应该在自己重写之前使用API。顺便说一句,内部Pattern.compile
(其中String.split
使用)缓存模式
,因此您不需要静态模式
——没有它,性能几乎相同。
import java.util.regex.Pattern;
import java.util.regex.Matcher;
String test = "\"Talboom, Esther\" <E.Talboom@wegener.nl>, \"Wolde, Jos van der\" <J.vdWolde@wegener.nl>, \"Debbie Derksen\" <deberken@casema.nl>, corine <corine5@xs4all.nl>, \"Markies Aart\" <A.Markies@wegenernieuwsmedia.nl>";
Pattern pattern = Pattern.compile("\".*?,.*?\"");
Matcher matcher = pattern.matcher(test);
boolean found = false;
while (matcher.find ()) {
System.out.println(matcher.group());
}
String test = "\"Talboom, Esther\" <E.Talboom@wegener.nl>, DRP - Wouter Haan <wouter@drp.eu>, \"Wolde, Jos van der\" <J.vdWolde@wegener.nl>, \"Debbie Derksen\" <deberken@casema.nl>, corine <corine5@xs4all.nl>, clankilllller@gmail.com, \"Markies Aart\" <A.Markies@wegenernieuwsmedia.nl>";
public static void main(String[] args) {
String test = "\"Talboom, Esther\" <E.Talboom@wegener.nl>, \"Wolde, Jos van der\" <J.vdWolde@wegener.nl>, \"Debbie Derksen\" <deberken@casema.nl>, corine <corine5@xs4all.nl>, \"Markies Aart\" <A.Markies@wegenernieuwsmedia.nl>";
// Split up into each person's details
String[] nameEmailPairs = test.split(",\\s*(?=\")");
for (String nameEmailPair : nameEmailPairs) {
// Extract exactly the parts you need from the person's details
String name = nameEmailPair.replaceAll("\"([^\"]+)\".*", "$1");
String email = nameEmailPair.replaceAll(".*<([^>]+).*", "$1");
System.out.println(name + " = " + email);
}
}
Talboom, Esther = E.Talboom@wegener.nl
Wolde, Jos van der = J.vdWolde@wegener.nl
Debbie Derksen = corine5@xs4all.nl
Markies Aart = A.Markies@wegenernieuwsmedia.nl