Python 如何删除斜杠后的空格/&引用;

Python 如何删除斜杠后的空格/&引用;,python,url,replace,whitespace,Python,Url,Replace,Whitespace,我正在使用Python,我想删除URL中的空格,以便恢复断开的链接 这是我必须处理的典型案例 关于某事的文本https://sr.a i/gMF 链接在斜杠(/)后面有一个空格,这是可以预期的。但它也可以有其他随机分布的空格 首先,我想修正斜杠(/)后面是否有空格 P> 此代码可以很好地替换斜线之后的空白空间,但是如果空白区域在其他地方发生而不删除所有空白空间,有没有办法修复该链接,因为我需要保留文本的含义?< /强> 使用该函数,并用空格替换空白空间。 >>> my_st

我正在使用Python,我想删除URL中的空格,以便恢复断开的链接

这是我必须处理的典型案例

关于某事的文本https://sr.a i/gMF

链接在斜杠(/)后面有一个空格,这是可以预期的。但它也可以有其他随机分布的空格

首先,我想修正斜杠(/)后面是否有空格

<> P> <强>此代码可以很好地替换斜线之后的空白空间,但是如果空白区域在其他地方发生而不删除所有空白空间,有没有办法修复该链接,因为我需要保留文本的含义?< /强>

使用该函数,并用空格替换空白空间。

>>> my_string = "https:// sr.a i/gMF"
>>> my_string
'https:// sr.a i/gMF'
>>> my_string.replace(" ","")
'https://sr.ai/gMF'
使用该函数,只需用空白替换为空字符串

>>> my_string = "https:// sr.a i/gMF"
>>> my_string
'https:// sr.a i/gMF'
>>> my_string.replace(" ","")
'https://sr.ai/gMF'
可能
.replace(“”,)
工作。如果有很多空白,导入re(正则表达式)将帮助您。

可能
.replace(“”,)
工作。如果有很多空白,导入re(正则表达式)将帮助您。

将regexp库与以下regexp一起使用

import re
text = re.sub(r"[/]\s", "/", text)
# r"" --> regexp in python
# [/] --> slash
# \s  --> blank
在这种情况下,您可以绕过一个使regexp在某些特殊情况下更稳定的方法

将regexp库与以下regexp一起使用

import re
text = re.sub(r"[/]\s", "/", text)
# r"" --> regexp in python
# [/] --> slash
# \s  --> blank


在这种情况下,您可以绕过一个使regexp在某些角落情况下更稳定的方法

为什么不简单地删除所有空格?因为我还有其他文本,需要保留。实际上,我必须修复链接的原因只是为了识别它,以便删除它并只保留文本。单个正斜杠没有特殊处理。您可能需要使用正则表达式来提取可能包含空格的URL,然后删除所有空格,如in的答案。因此,您需要知道要修复的URL中会包含哪些字符,因为如果您没有任何限制,URL正则表达式可能会非常复杂。您如何判断:
https://sr.a i/gMF/the
,也就是说,
这个
是url的一部分或者是一个普通的单词?为什么不干脆删除所有的空格呢?因为我还有其他的文本需要保留。实际上,我必须修复链接的原因只是为了识别它,以便删除它并只保留文本。单个正斜杠没有特殊处理。您可能需要使用正则表达式来提取可能包含空格的URL,然后删除所有空格,如in的答案。因此,您需要知道要修复的URL中会包含哪些字符,因为如果您没有任何限制,URL正则表达式可能会非常复杂。您如何判断:
https://sr.a i/gMF/the
,也就是说,
这个
是url的一部分或者是一个普通的单词?这将删除字符串中的所有空格,但是我需要将其他单词分开并且有意义。链接是否总是在行的末尾?例如,是否每次都会出现这样的情况,它可能会说“Words http://some.link more Words”?不幸的是,它可能会出现在文本中的任何地方。我认为您可能需要拆分链接部分,修复其中的空白,然后重建原始字符串。但由于单词可能出现在链接之后,我不知道如何确定链接何时结束。这将删除字符串中的所有空格,但我需要将其他单词分开并保持有意义。链接是否总是在行的末尾?例如,是否每次都会出现这样的情况,它可能会说“Words http://some.link more Words”?不幸的是,它可能会出现在文本中的任何地方。我认为您可能需要拆分链接部分,修复其中的空白,然后重建原始字符串。但是由于链接后可能会出现单词,我不知道您如何确定链接何时结束。您能否进一步解释re(正则表达式)如何帮助解决此问题?对不起,我不知道您需要将其他单词分开。再次更改生成的字符串怎么样?您能解释一下re(正则表达式)如何帮助解决问题吗?对不起,我不知道您需要将其他单词分开。再次更改结果字符串如何