正则表达式Python数据操作——非类型对象_Python_Regex

正则表达式Python数据操作——非类型对象

python regex

正则表达式Python数据操作——非类型对象,python,regex,Python,Regex,我有一个.txt文件，其中包含以下格式的数据： pq1000007 35 2 237493054 0.013328573 我正在尝试使用正则表达式来捕获第一个、第三个和最后一个数字，但前提是最后一个数字大于0.4。出于某种原因，我得到这样一条消息：“非类型对象没有属性‘group’”。有什么想法吗代码：如果搜索结果为None，则表示您的正则表达式不匹配。它似乎适用于您给出的示例，但可能文件中的实际数据与模式不匹配。（另外，我看到您的正则表达式包含\d+\d+，它应该是\d+）另外，ma

我有一个.txt文件，其中包含以下格式的数据：

pq1000007 35 2 237493054 0.013328573

我正在尝试使用正则表达式来捕获第一个、第三个和最后一个数字，但前提是最后一个数字大于0.4。出于某种原因，我得到这样一条消息：“非类型对象没有属性‘group’”。有什么想法吗

代码：

如果搜索结果为None，则表示您的正则表达式不匹配。它似乎适用于您给出的示例，但可能文件中的实际数据与模式不匹配。（另外，我看到您的正则表达式包含

\d+\d+

，它应该是

\d+

）

另外，

match.group

返回一个字符串。您需要将其转换为一个数字（例如，

float（match.group（2））

将其与数字0.4进行比较。

一些问题：

正则表达式匹配是一个字符串，因此您无法有意义地将其与浮点值进行比较（事实上，在Python 3中，这样做是非法的）。在Python 2中，任何字符串的比较值都将始终大于浮点值（因为ASCII中的

“str”

高于

“float”

。是的，这条规则毫无意义。很好，Python 3取消了它）

然后，正则表达式中的最后一个数字在第三个捕获组中，因此您需要执行以下操作

if float(match.group(3)) > 0.4:

然后，您应该在正则表达式中使用逐字字符串（

r“…”

）

最后，

\d+\d+

当然是多余的，

\d+

也可以

match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)

此正则表达式与您给出的示例行相匹配，因此您的错误消息（表示不匹配）必须具有不同的来源。可能文件中的某一行与正则表达式不匹配。在这种情况下，您可以这样构造程序：

for Line in InFile:
    match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
    if match:
        if float(match.group(3)) > 0.4:
            # do stuff
        else:
            print "No match: ", Line

for Line in InFile:
    match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
    if match:
        if float(match.group(3)) > 0.4:
            # do stuff
        else:
            print "No match: ", Line