删除python中的大量空白
我正在尝试编写自定义标记器:删除python中的大量空白,python,Python,我正在尝试编写自定义标记器: print(re.sub(' ',"\n",(re.sub('\\{|\\}|\\[|\\]|\\\\|\\/|\\\"|\\\'|\\,|\\=|\\(|\\)|\\:|\\||\\-|\\*|\\!|\\;|\\<|\\>|\\,|\\?|//@'," ",str)))) 正在插入许多新行。我正在尝试编写一个优化的代码,以删除所有带有正则表达式的空行,而不必深入每个细节。我真的很担心这个节目的表现。我有超过1000亿条线路。所以,我有点担心行刑的时
print(re.sub(' ',"\n",(re.sub('\\{|\\}|\\[|\\]|\\\\|\\/|\\\"|\\\'|\\,|\\=|\\(|\\)|\\:|\\||\\-|\\*|\\!|\\;|\\<|\\>|\\,|\\?|//@'," ",str))))
正在插入许多新行。我正在尝试编写一个优化的代码,以删除所有带有正则表达式的空行,而不必深入每个细节。我真的很担心这个节目的表现。我有超过1000亿条线路。所以,我有点担心行刑的时间。有什么建议吗
我正试图做出如下输出:
America
Category
States
of
the
United
States
Category
Southern
United
States
Link
FA
mk
您可以使用join()
和split()
方法:
print " ".join(your_string.split())
输出:
America Category States of the United States Category Southern United States Link FA mk
编辑:
America Category States of the United States Category Southern United States Link FA mk
要将每个单词放在不同的行中,请使用“\n”
而不是”
:
您可以使用join()
和split()
方法:
print " ".join(your_string.split())
输出:
America Category States of the United States Category Southern United States Link FA mk
编辑:
America Category States of the United States Category Southern United States Link FA mk
要将每个单词放在不同的行中,请使用“\n”
而不是”
:
re.sub('\n{2,}','\n',str)
将删除空行re.sub('\n{2,}','\n',str)
将删除空行您为什么要给这个
java
?如果您使用“原始”字符串,您的正则表达式模式将非常容易阅读(可能编写和维护):例如r“\no\t\hing\\in\a\raw\stri\s es\ca\ped”
(这将是一个带有12个反斜杠的字符串)。你为什么在{
之前写两个反斜杠?你到底为什么给这个java
贴上标签?如果你使用一个“raw”字符串,你的正则表达式模式将非常容易阅读(可能编写和维护):例如r“\no\t\hing\\in\a\raw\stri\s es\ca\ped”
(这将是一个包含12个反斜杠的字符串)。为什么在{
之前写两个反斜杠?应该是'\n'。连接…
,而不是空格应该是'\n'。连接…
,而不是空格