Python 为什么可以';我在正则表达式中找不到这个字符串吗?
输出数据:Python 为什么可以';我在正则表达式中找不到这个字符串吗?,python,regex,jupyter,Python,Regex,Jupyter,输出数据: lines = [] total_check = 0 with pdfplumber.open(file) as pdf: pages = pdf.pages for page in pdf.pages: text = page.extract_text() for line in text.split('\n'): print(line) 当我尝试从数据中检索VAT时: Totaalbedrag excl.
lines = []
total_check = 0
with pdfplumber.open(file) as pdf:
pages = pdf.pages
for page in pdf.pages:
text = page.extract_text()
for line in text.split('\n'):
print(line)
当我尝试从数据中检索VAT时:
Totaalbedrag excl. btw € 25,00
输出:AttributeError:“非类型”对象没有属性“组”
KVK_re = re.compile(r'(excl. btw .+)')
KVK_re.search(data).group(0)
产出:“不包括25,00欧元”
当我在搜索中粘贴文字输出时,它怎么可能找到25,00欧元的数字,而当我输入数据变量时,它怎么可能没有
请帮帮我 您没有提供
数据
对象的内容,但错误消息只是说找不到正则表达式。因此,您可能正在对不包含该特定字符串的数据调用搜索
$KVK_re=re.compile(r'(不包括btw.+))
$KVK_re.search('test')。组(0)
AttributeError:“非类型”对象没有属性“组”
在大多数情况下,当模式中使用了文字空格,但没有匹配时,原因是不可见字符或非中断空格
当您有不间断的空格时,\xA0
,您可以简单地用\s
替换文字空格来匹配任何空格,或者用[\xA0]
来匹配任意一个空格
在这种情况下,可能同时存在空格和一些不可见字符,因此,您可以使用\W
来匹配任何非单词字符,而不是文字空格:
KVK_re = re.compile(r'(excl. btw .+)')
KVK_re.search(r'excl. btw € 25,00').group(0)
请尝试
KVK_re=re.compile(r'(excl\.\s+btw\s.+)
不起作用。我将附加输出文件供您参考,然后使用\W
匹配任何非单词字符,r'(不包括\.\W+btw\W.+)
谢谢!成功了。您是一个传奇r=re.compile(r'[\w\s]+?(?)?
r'excl\.\W+btw\W.+'