Python 如果字符串单词包含特定字符,请删除包含这些字符的单词
假设我有如下数据Python 如果字符串单词包含特定字符,请删除包含这些字符的单词,python,python-2.7,python-3.x,Python,Python 2.7,Python 3.x,假设我有如下数据 data['sentences'] This is a sentence Donald Trump Machine Learning Python is good 我想搜索字符的模式,如果我们找到一个,需要删除包含字符的单词 假设我想删除带有“enc”、“ood”和“ump”的单词,输出应该是 data['sentences'] This is a Donald Machine Learning Python is 我在使用re.sub的地方尝试了以下方法 re.
data['sentences']
This is a sentence
Donald Trump
Machine Learning
Python is good
我想搜索字符的模式,如果我们找到一个,需要删除包含字符的单词
假设我想删除带有“enc”、“ood”和“ump”的单词,输出应该是
data['sentences']
This is a
Donald
Machine Learning
Python is
我在使用re.sub的地方尝试了以下方法
re.sub("enc", "", y)
但这是一个输出,就像,这是一个sente
。我不知道如何删除整个单词
有人能帮我做这件事吗?是python吗?我想找到一种有效的方法来实现这一点,因为我想使用pyspark为将近10亿条记录运行这一功能。有人能帮我做这件事吗
谢谢在标识符之前和之后添加迭代:
re.sub(r'\w*enc\w*', '', y)
这将替换为空白的所有字母数字字符以及指定的字符串(即其中包含的单词)。这不是作业板。我们不是来“帮助”你的。你发布你的代码,你解释它应该做什么,你解释它怎么不做,我们(也许)会尝试帮助修复它。我不明白,你的数据是一本字典,一个文件,一个列表。。?什么是
数据['句]
?@MarcB对不起。我确实尝试了一些事情。只是这里没提到。我现在可以添加它了。@RafaelCardoso它是一个数据帧,数据帧的一列是句子