Regex 正则表达式-排除R中的特定字符串?
我试图在整个语料库的长度范围内,根据正则表达式以不同的组合搜索特定的关键字“我”(我是循环中直到语料库长度的迭代器)。因此,我在语料库中的大部分简历中都将我作为资历,例如:- 1.我 2.电子工程硕士 3.医学硕士。 4.我-计算机科学等等Regex 正则表达式-排除R中的特定字符串?,regex,rscript,Regex,Rscript,我试图在整个语料库的长度范围内,根据正则表达式以不同的组合搜索特定的关键字“我”(我是循环中直到语料库长度的迭代器)。因此,我在语料库中的大部分简历中都将我作为资历,例如:- 1.我 2.电子工程硕士 3.医学硕士。 4.我-计算机科学等等 matchME <- regmatches(as.String(docs[[i]]), gregexpr("\\WM\\.?E\\.?(\\s|\\.|\\-|\\(|\\:|\\,)|((Master)|(MASTER))[sS]?\\s?(((o
matchME <- regmatches(as.String(docs[[i]]), gregexpr("\\WM\\.?E\\.?(\\s|\\.|\\-|\\(|\\:|\\,)|((Master)|(MASTER))[sS]?\\s?(((of)|(Of)|(OF))|((in)|(In)|(IN)))\\s?((Engineering)|(ENGINEERING)|(Engg)|(engineering))" , as.String(docs[[i]])))
排除一个字符串可以通过一个负的前瞻来完成,比如在模式的开始处添加
perl=T
(?!Win(?:dows)\\s*-\\s*ME)。此外,您可以在模式的开头使用(?i)
,以启用不区分大小写的匹配。排除字符串可以使用负前瞻来完成,例如在模式的开头使用(?!Win(?:dows)?\\s*-\\s*ME)
,并添加perl=T
。此外,您可以在模式的开头使用(?i)
来启用不区分大小写的匹配。
[^(Windows)]\WM\.?E\.?(\s|\.|\-|\(|\:|\,)|((Master)|(MASTER))[sS]?\s?(((of)|(Of)|(OF))|((in)|(In)|(IN)))\s?((Engineering)|(ENGINEERING)|(Engg)|(engineering))