Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/image/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 正则表达式-排除R中的特定字符串?_Regex_Rscript - Fatal编程技术网

Regex 正则表达式-排除R中的特定字符串?

Regex 正则表达式-排除R中的特定字符串?,regex,rscript,Regex,Rscript,我试图在整个语料库的长度范围内,根据正则表达式以不同的组合搜索特定的关键字“我”(我是循环中直到语料库长度的迭代器)。因此,我在语料库中的大部分简历中都将我作为资历,例如:- 1.我 2.电子工程硕士 3.医学硕士。 4.我-计算机科学等等 matchME <- regmatches(as.String(docs[[i]]), gregexpr("\\WM\\.?E\\.?(\\s|\\.|\\-|\\(|\\:|\\,)|((Master)|(MASTER))[sS]?\\s?(((o

我试图在整个语料库的长度范围内,根据正则表达式以不同的组合搜索特定的关键字“我”(我是循环中直到语料库长度的迭代器)。因此,我在语料库中的大部分简历中都将我作为资历,例如:- 1.我 2.电子工程硕士 3.医学硕士。 4.我-计算机科学等等

 matchME <- regmatches(as.String(docs[[i]]), gregexpr("\\WM\\.?E\\.?(\\s|\\.|\\-|\\(|\\:|\\,)|((Master)|(MASTER))[sS]?\\s?(((of)|(Of)|(OF))|((in)|(In)|(IN)))\\s?((Engineering)|(ENGINEERING)|(Engg)|(engineering))" , as.String(docs[[i]])))

排除一个字符串可以通过一个负的前瞻来完成,比如在模式的开始处添加
perl=T
(?!Win(?:dows)\\s*-\\s*ME)。此外,您可以在模式的开头使用
(?i)
,以启用不区分大小写的匹配。排除字符串可以使用负前瞻来完成,例如在模式的开头使用
(?!Win(?:dows)?\\s*-\\s*ME)
,并添加
perl=T
。此外,您可以在模式的开头使用
(?i)
来启用不区分大小写的匹配。
[^(Windows)]\WM\.?E\.?(\s|\.|\-|\(|\:|\,)|((Master)|(MASTER))[sS]?\s?(((of)|(Of)|(OF))|((in)|(In)|(IN)))\s?((Engineering)|(ENGINEERING)|(Engg)|(engineering))