Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/363.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/typo3/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python-使用正则表达式捕获单引号而不是撇号_Python_Regex_Parsing - Fatal编程技术网

Python-使用正则表达式捕获单引号而不是撇号

Python-使用正则表达式捕获单引号而不是撇号,python,regex,parsing,Python,Regex,Parsing,有时,我正在搜索的文档中有不均匀的引号。如果它们包含双引号,我可以很容易地找到所有这些事件,但是单引号让我感到不舒服。我怎样才能在不捕捉撇号的情况下只捕捉单引号,比如you's,Rob's,Womens',not等 编辑 比如说这个, "my friend likes apples. 会被这个抓住的 rgxDoubleQuotes = re.compile('\"') for charseq in root.findall(".//span[@type='sentence']/extent/c

有时,我正在搜索的文档中有不均匀的引号。如果它们包含双引号,我可以很容易地找到所有这些事件,但是单引号让我感到不舒服。我怎样才能在不捕捉撇号的情况下只捕捉单引号,比如you's,Rob's,Womens',not等

编辑

比如说这个,

"my friend likes apples.
会被这个抓住的

rgxDoubleQuotes = re.compile('\"')
for charseq in root.findall(".//span[@type='sentence']/extent/charseq[@START]"): 
if rgxDoubleQuotes.findall(charseq.text):
    if charseq.text.count("\"") % 2 != 0:
        print charseq.text
但它不会捕获

'your dog just pissed.
我希望能够捕捉第二个句子,而不必捕捉包含撇号的句子,如

the cat's name is same

仅捕获单引号是指捕获引号之间的文本吗?如果我正确地记得很久以前的学术课,这在非递归正则表达式中实际上是不可能的。您需要跟踪嵌套级别,而regexp不会这样做。这与寻找不匹配的帕伦基本上是同一个问题。有些语言的正则表达式库有递归扩展,但Python没有。@peterdegloper:新的正则表达式模块有递归功能:我认为撇号总是在单词中,没有空格,或者是以下形式:s。这是标准英语;俚语通常有其他的好时光,可能无法解释。祝你好运。我认为你不能完全依靠一个自动化的程序来处理你混乱的内容。示例:第1行:“我昨晚去了Vas”派对第2行:“我去了火星”马克说。