Python 如何替换字符串中的模式?
嗨,我正在尝试替换所有包含“www…”和“www…”的表达式http://..'仅使用'URL'。我尝试过这个,但我得到了这个错误Python 如何替换字符串中的模式?,python,regex,replace,Python,Regex,Replace,嗨,我正在尝试替换所有包含“www…”和“www…”的表达式http://..'仅使用'URL'。我尝试过这个,但我得到了这个错误 TypeError:需要字符串或缓冲区 我的代码是: df['text_1']=re.sub('(www\.[^\s]+)|(https?://[^\s]+)','URL',df['text']) df[text]包含tweet,因此我只想保留其中的文本。 我在Python 2中 谢谢。听起来您好像遇到了这个错误,因为您没有提供字符串或缓冲区作为re.sub的第三个
TypeError:需要字符串或缓冲区
我的代码是:
df['text_1']=re.sub('(www\.[^\s]+)|(https?://[^\s]+)','URL',df['text'])
df[text]
包含tweet,因此我只想保留其中的文本。
我在Python 2中
谢谢。听起来您好像遇到了这个错误,因为您没有提供
字符串或缓冲区作为re.sub
的第三个参数
>>> re.sub('\W', 'REPLACED', 'this is my text')
'thisREPLACEDisREPLACEDmyREPLACEDtext'
>>> re.sub('\W', 'REPLACED', None)
Traceback (most recent call last):
...
TypeError: expected string or buffer
请确保df['text']
包含正确的字符串,然后再尝试将其用于re.sub
这听起来像是您收到了错误,因为您没有将字符串或缓冲区作为re.sub
的第三个参数
>>> re.sub('\W', 'REPLACED', 'this is my text')
'thisREPLACEDisREPLACEDmyREPLACEDtext'
>>> re.sub('\W', 'REPLACED', None)
Traceback (most recent call last):
...
TypeError: expected string or buffer
在将df['text']
用于re.sub
之前,请确保df[/text']
包含正确的字符串。假设df
是一个数据帧,请不要使用re.sub
。改用:
这将生成一个新列text\u 1
,根据正则表达式替换text
的所有值。假设df
是一个数据帧,不要使用re.sub
。改用:
这将生成一个新列text\u 1
,根据正则表达式替换所有text
值。是df[text]
推文列表,即字符串列表还是单个字符串?您是否尝试过…=[re.sub(“”,'URL',s)表示df['text']]
?在df[text]
的每个值中都有一条tweet。这就是你要问的?请澄清df
实际上是什么数据类型。我们知道它不是一个字符串,也不是一个缓冲区,我假设它是一个数据帧。是的,它是数据帧,你能推荐我在哪里可以阅读更多关于这些差异的信息吗?字符串、数据帧和缓冲区?现在我对此有点困惑。ThanksIsdf[text]
推文列表,即字符串列表,还是单个字符串?您是否尝试过…=[re.sub(“”,'URL',s)表示df['text']]
?在df[text]
的每个值中都有一条tweet。这就是你要问的?请澄清df
实际上是什么数据类型。我们知道它不是一个字符串,也不是一个缓冲区,我假设它是一个数据帧。是的,它是数据帧,你能推荐我在哪里可以阅读更多关于这些差异的信息吗?字符串、数据帧和缓冲区?现在我对此有点困惑。谢谢工作,是的,我正在使用数据帧,谢谢所有工作的人,是的,我正在使用数据帧,谢谢大家