Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/366.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python unicode字符串中的正则表达式_Python_Regex - Fatal编程技术网

Python unicode字符串中的正则表达式

Python unicode字符串中的正则表达式,python,regex,Python,Regex,我有一些unicode文本,我想用正则表达式清理它们。例如,我有一些情况下,你(2).之所以存在这种情况,是因为出于格式化的原因,结束参数最终会出现在相邻的html单元格中。我对这个问题的最初解决方案是查看下一个单元格的内容,并使用字符串函数确定它是否包含结束参数。我知道这不是一个很好的解决方案,但它确实有效。现在我想修复它,但似乎无法解决使正则表达式工作 missingParen=re.compile(r"^\(\d[^\)]$") 我对我认为我在做什么的理解: ^在字符串的开头,我要查找

我有一些unicode文本,我想用正则表达式清理它们。例如,我有一些情况下,你(2).之所以存在这种情况,是因为出于格式化的原因,结束参数最终会出现在相邻的html单元格中。我对这个问题的最初解决方案是查看下一个单元格的内容,并使用字符串函数确定它是否包含结束参数。我知道这不是一个很好的解决方案,但它确实有效。现在我想修复它,但似乎无法解决使正则表达式工作

missingParen=re.compile(r"^\(\d[^\)]$")
我对我认为我在做什么的理解:
^在字符串的开头,我要查找
(对于打开的paren,paren必须反斜杠,因为它是一个特殊字符
\d我还想找到一个位数
[我正在创建一个特殊的角色类
^我不想找到下面的内容
)这是一个非常接近的参数
字符串末尾的$

当然,情节变厚了,我做了一个愚蠢的假设,因为我放置了一个\d,我找不到(33,但我错了,所以我在正则表达式中添加了一个{1},这没有帮助,它匹配了(3333,所以我的问题比我想象的要复杂。我希望字符串只是一个开放的paren和一个数字。这是更聪明的方法吗

missingParen=re.compile(r"^\(\d$")

请注意,我已经给它贴上了“初学者”的标签,这样你就不能找到任何便宜的观点,不是因为我不欣赏你的见解,我一直想读你的书,它可能有答案,好吧,很抱歉使用了一个意识流思维刺激器,但似乎写下我最初的问题让我走上了正轨。这是让我明白,这是一个解决我正在尝试做的事情的方法:

  missingParen=re.compile(r"^\(\d$")

好吧,很抱歉用这一个意识流思维刺激器,但似乎写下我最初的问题让我走上了正轨。在我看来,这是我试图做的事情的解决方案:

  missingParen=re.compile(r"^\(\d$")

我的问题的答案是否相关?我的问题的答案是否相关?