Python 如何删除Unicode字符串中的空白

Python 如何删除Unicode字符串中的空白,python,regex,string,Python,Regex,String,我是python新手,正在尝试做一些web抓取。 我得到的字符串是:u'Kathy and Othon Prounis' 我想要的最终输出是u'Kathy and Othon Prounis',其中多余的空格被删除。 我试过: temp = re.split(' ',u' Kathy and Othon Prounis ') 给予 [u'', u'Kathy', u'', u'and', u'Othon', u'Prounis', u''] 但是我不能对它执行temp.remove(u''

我是python新手,正在尝试做一些web抓取。
我得到的字符串是:
u'Kathy and Othon Prounis'
我想要的最终输出是
u'Kathy and Othon Prounis'
,其中多余的空格被删除。 我试过:

temp = re.split(' ',u' Kathy  and Othon Prounis ')
给予

[u'', u'Kathy', u'', u'and', u'Othon', u'Prounis', u'']

但是我不能对它执行
temp.remove(u'')

您需要确保不会在字符串的开始/结束处发生拆分。您可以使用regex lookarounds执行此操作:

>>> re.split('(?<!^) +(?!$)',u' Kathy  and Othon Prounis ')
[' Kathy', 'and', 'Othon', 'Prounis ']
为了这个目的,为什么不这样做呢

>>> ' Kathy  and Othon Prounis '.split()
['Kathy', 'and', 'Othon', 'Prounis']

如果您的目标只是删除额外的空格,那么您可以完全避免数组,只需执行
result=re.sub('+','',s.strip())
,其中
s
是要处理的字符串。
u'Kathy and Othon Prounis'.strip().replace('''',)给出了<代码> U'KaSi'和Othon Pruni’< /Cord> @ LordSalforis,如果在字符串的中间存在多个空格,则不能给出正确的输出,因为它只是用另一个空间替换每个单独的空间。
>>> ' Kathy  and Othon Prounis '.split()
['Kathy', 'and', 'Othon', 'Prounis']