正则表达式Python数据操作——非类型对象
我有一个.txt文件,其中包含以下格式的数据:正则表达式Python数据操作——非类型对象,python,regex,Python,Regex,我有一个.txt文件,其中包含以下格式的数据: pq1000007 35 2 237493054 0.013328573 我正在尝试使用正则表达式来捕获第一个、第三个和最后一个数字,但前提是最后一个数字大于0.4。出于某种原因,我得到这样一条消息:“非类型对象没有属性‘group’”。有什么想法吗 代码: 如果搜索结果为None,则表示您的正则表达式不匹配。它似乎适用于您给出的示例,但可能文件中的实际数据与模式不匹配。(另外,我看到您的正则表达式包含\d+\d+,它应该是\d+) 另外,ma
pq1000007 35 2 237493054 0.013328573
我正在尝试使用正则表达式来捕获第一个、第三个和最后一个数字,但前提是最后一个数字大于0.4。出于某种原因,我得到这样一条消息:“非类型对象没有属性‘group’”。有什么想法吗
代码:
如果搜索结果为None,则表示您的正则表达式不匹配。它似乎适用于您给出的示例,但可能文件中的实际数据与模式不匹配。(另外,我看到您的正则表达式包含
\d+\d+
,它应该是\d+
)
另外,match.group
返回一个字符串。您需要将其转换为一个数字(例如,float(match.group(2))
将其与数字0.4进行比较。一些问题:
正则表达式匹配是一个字符串,因此您无法有意义地将其与浮点值进行比较(事实上,在Python 3中,这样做是非法的)。在Python 2中,任何字符串的比较值都将始终大于浮点值(因为ASCII中的“str”
高于“float”
。是的,这条规则毫无意义。很好,Python 3取消了它)
然后,正则表达式中的最后一个数字在第三个捕获组中,因此您需要执行以下操作
if float(match.group(3)) > 0.4:
然后,您应该在正则表达式中使用逐字字符串(r“…”
)
最后,\d+\d+
当然是多余的,\d+
也可以
match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
此正则表达式与您给出的示例行相匹配,因此您的错误消息(表示不匹配)必须具有不同的来源。可能文件中的某一行与正则表达式不匹配。在这种情况下,您可以这样构造程序:
for Line in InFile:
match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
if match:
if float(match.group(3)) > 0.4:
# do stuff
else:
print "No match: ", Line
for Line in InFile:
match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
if match:
if float(match.group(3)) > 0.4:
# do stuff
else:
print "No match: ", Line