Python 所有字符和函数间的正则表达式
我正在用python抓取论坛页面 我需要得到所有的信息和信息需要有所有的标点符号。但是我需要删除所有的空格 我试着用这段代码做到这一点:但我没有。*和我的输出中的其他Python 所有字符和函数间的正则表达式,python,parsing,web-scraping,forum,Python,Parsing,Web Scraping,Forum,我正在用python抓取论坛页面 我需要得到所有的信息和信息需要有所有的标点符号。但是我需要删除所有的空格 我试着用这段代码做到这一点:但我没有。*和我的输出中的其他 found = [re.sub("[.*]+", " ", d.text.encode("utf-8").decode("utf-8"))] rez.extend(found) for line in rez: line = re.sub(r'^\s+$|\n', '', line) text_f
found = [re.sub("[.*]+", " ", d.text.encode("utf-8").decode("utf-8"))]
rez.extend(found)
for line in rez:
line = re.sub(r'^\s+$|\n', '', line)
text_file.write(line + "\n\n")
print(line)
要删除字符串
行中的所有空格,只需执行以下操作:
re.sub("\s", "",line)
这将保留所有其他标点符号,只删除空格。如果要删除所有空格,那么found=''.join(text.split())
?或者干脆@MichaelFranzen有什么问题?因为str.replace
使用特定字符串操作,而不是任何空格序列。您必须对每个可能的空白字符执行replace
。re.sub(“[.*]+”,“,”,s)
将包含
和*
的所有运行替换到单个空格中;它有效地删除了所有周期和星号。你说你不想那样;如果是,你为什么这么做?