Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/297.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
正则表达式Python数据操作——非类型对象_Python_Regex - Fatal编程技术网

正则表达式Python数据操作——非类型对象

正则表达式Python数据操作——非类型对象,python,regex,Python,Regex,我有一个.txt文件,其中包含以下格式的数据: pq1000007 35 2 237493054 0.013328573 我正在尝试使用正则表达式来捕获第一个、第三个和最后一个数字,但前提是最后一个数字大于0.4。出于某种原因,我得到这样一条消息:“非类型对象没有属性‘group’”。有什么想法吗 代码: 如果搜索结果为None,则表示您的正则表达式不匹配。它似乎适用于您给出的示例,但可能文件中的实际数据与模式不匹配。(另外,我看到您的正则表达式包含\d+\d+,它应该是\d+) 另外,ma

我有一个.txt文件,其中包含以下格式的数据:

pq1000007 35 2 237493054 0.013328573 
我正在尝试使用正则表达式来捕获第一个、第三个和最后一个数字,但前提是最后一个数字大于0.4。出于某种原因,我得到这样一条消息:“非类型对象没有属性‘group’”。有什么想法吗

代码:


如果搜索结果为None,则表示您的正则表达式不匹配。它似乎适用于您给出的示例,但可能文件中的实际数据与模式不匹配。(另外,我看到您的正则表达式包含
\d+\d+
,它应该是
\d+

另外,
match.group
返回一个字符串。您需要将其转换为一个数字(例如,
float(match.group(2))
将其与数字0.4进行比较。

一些问题:

正则表达式匹配是一个字符串,因此您无法有意义地将其与浮点值进行比较(事实上,在Python 3中,这样做是非法的)。在Python 2中,任何字符串的比较值都将始终大于浮点值(因为ASCII中的
“str”
高于
“float”
。是的,这条规则毫无意义。很好,Python 3取消了它)

然后,正则表达式中的最后一个数字在第三个捕获组中,因此您需要执行以下操作

if float(match.group(3)) > 0.4:
然后,您应该在正则表达式中使用逐字字符串(
r“…”

最后,
\d+\d+
当然是多余的,
\d+
也可以

match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
此正则表达式与您给出的示例行相匹配,因此您的错误消息(表示不匹配)必须具有不同的来源。可能文件中的某一行与正则表达式不匹配。在这种情况下,您可以这样构造程序:

for Line in InFile:
    match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
    if match:
        if float(match.group(3)) > 0.4:
            # do stuff
        else:
            print "No match: ", Line
for Line in InFile:
    match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
    if match:
        if float(match.group(3)) > 0.4:
            # do stuff
        else:
            print "No match: ", Line