Python 删除数字和用户';s停止熊猫数据框中的单词

Python 删除数字和用户';s停止熊猫数据框中的单词,python,pandas,nltk,Python,Pandas,Nltk,我想知道如何从数据集中删除一些变量,特别是数字和字符串列表。比如说 Test Num 0 bam 132 1 - 65 2 creation 47 3 MAN 32 4 41 831 ... ... ... 460 Luchino 21 461 42 4126 7 462 finger 43 463 washing 1 我想要点像这样的 Test Num 0 b

我想知道如何从数据集中删除一些变量,特别是数字和字符串列表。比如说

    Test      Num
0   bam       132
1   -         65
2   creation  47
3   MAN       32
4   41        831
... ... ...
460 Luchino   21
461 42 4126   7
462 finger    43
463 washing   1
我想要点像这样的

    Test      Num
0   bam       132
2   creation  47
... ... ...
460 Luchino   21
462 finger    43
463 washing   1
我(手动)删除了MAN(应该包括在字符串列表中,如停止词)、
-
和数字

我已尝试使用isdigit,但它不起作用,因此我确信我的代码中存在错误:

df['Text'].where(~df['Text'].str.isdigit())
我要说的是:

my_stop=['MAN','-']
df['Text'].apply(lambda lst: [x for x in lst if x in my_stop])

您好,您应该尝试以下代码:

 df[df['Text']!='MAN']

如果要筛选,可以使用
.loc

df = df.loc[~df.Text.str.isdigit() & ~df.Text.isin(['MAN']), :]
.where(cond,other)
返回与self形状相同的数据帧或序列,但在
cond
为true时保留原始值,在为false时替换为
other

请在

中阅读更多信息,谢谢RichieV。我可以问你如何扩展到一个列表,而不仅仅是一个单词(例如MAN)?我有很多话想从中删除创建你的列表和代码
~df.Text.isin(不需要的列表)…
@仍在学习请注意我在
中的行为是错误的。其中
,现已修复。这并不能提供问题的答案。一旦你有足够的钱,你将能够;相反-