Python 如何删除Wordcloud中的标点符号?

Python 如何删除Wordcloud中的标点符号?,python,sentiment-analysis,word-cloud,Python,Sentiment Analysis,Word Cloud,我们尝试使用wordcloud,但是我们已经删除了标点符号,但是wordcloud中仍然有一个逗号 我们使用了以下代码: text1+=i + ' ' wc = WordCloud(width = 800, height = 800,background_color="white",min_font_size = 10,\ repeat=True,) wc.generate(text1) plt.figure(figsize = (8, 8), facecolor = No

我们尝试使用wordcloud,但是我们已经删除了标点符号,但是wordcloud中仍然有一个逗号

我们使用了以下代码:

text1+=i + ' '

wc = WordCloud(width = 800, height = 800,background_color="white",min_font_size = 10,\
repeat=True,)
wc.generate(text1)
plt.figure(figsize = (8, 8), facecolor = None)
plt.axis("off")
plt.imshow(wc, interpolation="bilinear")
plt.title('Sentiment Reviews English',fontsize=32); 

NLTK对于通过删除标点符号或停止词(这可能会引起您的word cloud的兴趣)来处理文本非常有用


由于不知道文本是如何预处理的,很可能不是所有的标点符号都被删除了,而WordCloud引入了新的标点符号,所以如果您能够提供用于删除标点符号的代码,这将非常有用。此外(如果可能的话),您获得的当前输出也将有助于回答您的问题。我们需要查看您的输入
text1
。否则,这个问题是不可复制的。此外,还可以显示输出绘图(或其底层字符串)。
from nltk.tokenize import RegexpTokenizer

tokenizer = RegexpTokenizer(r'\w+')
tokenizer.tokenize('Sentiment . Reviews, English!')
#['Sentiment', 'Reviews', 'English']