Python 使用用户输入作为正则表达式搜索表达式

Python 使用用户输入作为正则表达式搜索表达式,python,regex,Python,Regex,我正在从事一个个人项目,该项目旨在打开用户指定的文件,然后接收用户输入,并使用该输入作为正则表达式搜索文件。本文的目的是深入了解正则表达式的工作原理,以及如何将正则表达式合并到程序中 我的问题在于,用户给我的所有输入都被格式化为字符串。因此(如果我错了,请纠正我),输入[a-z]+将导致搜索表达式“[a-z]+”。如果我想要r“[a-z]+”作为搜索表达式,这是一个问题,因为将其作为用户输入将给我“r”[a-z]+”(如果我错了,请再次更正)。这显然不适用于正则表达式。如何格式化输入,使r“[a

我正在从事一个个人项目,该项目旨在打开用户指定的文件,然后接收用户输入,并使用该输入作为正则表达式搜索文件。本文的目的是深入了解正则表达式的工作原理,以及如何将正则表达式合并到程序中

我的问题在于,用户给我的所有输入都被格式化为字符串。因此(如果我错了,请纠正我),输入[a-z]+将导致搜索表达式“[a-z]+”。如果我想要r“[a-z]+”作为搜索表达式,这是一个问题,因为将其作为用户输入将给我“r”[a-z]+”(如果我错了,请再次更正)。这显然不适用于正则表达式。如何格式化输入,使r“[a-z]+”的输入保持r“[a-z]+”

这是有问题的代码部分。函数参数中的文本文件从程序的另一部分导入,并用于正则表达式搜索:

def new_search_regex(textFile):
    """Query for input, then performs RegEx() with user's input"""
    global totalSearches
    global allSearchResults

    # ask user for regular expression to be searched
    expression = raw_input("Please enter the Regular Expression to be searched: ")

    # perform initial regex search
    foundRegex = re.search(expression, textFile)

    # if Regex search successful
    if foundRegex != None:

        # Do complete regex search
        foundRegex = re.findall(expression, textFile)

        # Print result
        print "Result: " + str(foundRegex)

        # Increment global total
        totalSearches += 1

        # create object for result, store in global array
        reg_object = Reg_Search(totalSearches, expression, foundRegex)
        allSearchResults.append(reg_object)
        print "You're search number for this search is " + str(totalSearches)        # Inform user of storage location

    # if Regex search unsuccessful
    else:
        print "Search did not have any results."

    return
注意:最后我为结果创建了一个对象,并将其存储在全局数组中


目前,这还假设用户能够胜任地输入非系统正则表达式。不过,我很快就会开始添加错误检查,例如在用户输入上使用.escape。这将如何影响我的处境?它是否会对用户造成严重破坏,包括直接来自Python的“输入中”:

r“…”
语法仅用于防止python编译器解释转义序列(例如,
\n
被转换为换行符)。一旦被编译器解析,它将只是一个常规字符串

我们使用'raw_input'读取用户输入。编译器不执行任何转义序列解释。您无需执行任何操作,字符串已正确解释

您可以自己这样测试:

>>> x = r"[a-z]+\n"
>>> y = raw_input("")
[a-z]+\n
>>> x == y
True

记住格式化你的用户输入(为了删除讨厌的结束行字符)。或者你可以评估()用户的输入,但我不推荐它(即使你是一个超级用户)太好了!非常感谢。
>>> x = r"[a-z]+\n"
>>> y = raw_input("")
[a-z]+\n
>>> x == y
True