如何删除dataframe(Python)中的停止字
这是我的代码,不起作用如何删除dataframe(Python)中的停止字,python,pandas,dataframe,Python,Pandas,Dataframe,这是我的代码,不起作用 from pythainlp.corpus import thai_stopwords stopwords =thai_stopwords() def remove_stopwords(x): list_token = [] for i in x: if i not in stopwords: list_token.append(i) return list_token df['t
from pythainlp.corpus import thai_stopwords
stopwords =thai_stopwords()
def remove_stopwords(x):
list_token = []
for i in x:
if i not in stopwords:
list_token.append(i)
return list_token
df['tokens']=df['tokens'].apply(remove_stopwords)
我已经试过了:
df['tokens'] = df['tokens'].apply(lambda x: [item for item in x if item not in stopwords])
假设您的
stopwords
是一个列表,df['tokens']
是每个单词或标记的列表。简单方法:
clear_tokens = []
for i in df.index:
clear_tokens.append([item for item in df.tokens[i] if item not in stopwords])
df['tokens'] = clear_tokens
如果您的df.tokens
是每行中的一个句子,则:
clear_tokens = []
for i in df.index:
tokenlist = df.tokens[i].split()
clear_tokens.append(' '.join([item for item in tokenlist if item not in stopwords]))
df['tokens'] = clear_tokens
假设您的
stopwords
是一个列表,df['tokens']
是每个单词或标记的列表。简单方法:
clear_tokens = []
for i in df.index:
clear_tokens.append([item for item in df.tokens[i] if item not in stopwords])
df['tokens'] = clear_tokens
如果您的df.tokens
是每行中的一个句子,则:
clear_tokens = []
for i in df.index:
tokenlist = df.tokens[i].split()
clear_tokens.append(' '.join([item for item in tokenlist if item not in stopwords]))
df['tokens'] = clear_tokens
你的代码打算做什么?它在做什么?怎么了?我们和你不是在同一个项目上。花些时间阅读如何从这个链接中提出一个好问题->你的代码打算做什么?它在做什么?怎么了?我们和你不是在同一个项目上。花些时间阅读如何在此链接中提出一个好问题->