如何删除dataframe（Python）中的停止字_Python_Pandas_Dataframe

如何删除dataframe（Python）中的停止字

python pandas dataframe

如何删除dataframe（Python）中的停止字,python,pandas,dataframe,Python,Pandas,Dataframe,这是我的代码，不起作用 from pythainlp.corpus import thai_stopwords stopwords =thai_stopwords() def remove_stopwords(x): list_token = [] for i in x: if i not in stopwords: list_token.append(i) return list_token df['t

这是我的代码，不起作用

from pythainlp.corpus import thai_stopwords    
stopwords =thai_stopwords()
    def remove_stopwords(x):
      list_token = []
      for i in x:
          if i not in stopwords:
            list_token.append(i)

   return list_token
df['tokens']=df['tokens'].apply(remove_stopwords)

我已经试过了：

df['tokens'] = df['tokens'].apply(lambda x: [item for item in x if item not in stopwords])

假设您的

stopwords

是一个列表，

df['tokens']

是每个单词或标记的列表。
简单方法：

clear_tokens = []
for i in df.index:
   clear_tokens.append([item for item in df.tokens[i] if item not in stopwords])

df['tokens'] = clear_tokens

如果您的

df.tokens

是每行中的一个句子，则：

clear_tokens = []
for i in df.index:
   tokenlist = df.tokens[i].split()
   clear_tokens.append(' '.join([item for item in tokenlist if item not in stopwords]))

df['tokens'] = clear_tokens

假设您的

stopwords

是一个列表，

df['tokens']

是每个单词或标记的列表。
简单方法：

clear_tokens = []
for i in df.index:
   clear_tokens.append([item for item in df.tokens[i] if item not in stopwords])

df['tokens'] = clear_tokens

如果您的

df.tokens

是每行中的一个句子，则：

clear_tokens = []
for i in df.index:
   tokenlist = df.tokens[i].split()
   clear_tokens.append(' '.join([item for item in tokenlist if item not in stopwords]))

df['tokens'] = clear_tokens

你的代码打算做什么？它在做什么？怎么了？我们和你不是在同一个项目上。花些时间阅读如何从这个链接中提出一个好问题->你的代码打算做什么？它在做什么？怎么了？我们和你不是在同一个项目上。花些时间阅读如何在此链接中提出一个好问题->