Python 如何使用google.colab导入文件上传文本文件,然后将其转换为一组单词?

Python 如何使用google.colab导入文件上传文本文件,然后将其转换为一组单词?,python,dictionary,text,set,Python,Dictionary,Text,Set,这是我用西班牙语为stop words制作的文本文件,然后我将其上传到google collab: srop_words_西班牙语.txt 这是我的代码: from google.colab import files spa = files.upload() 如您所见,导入成功: srop_words_spanish.txt(text/plain) - 3391 bytes, last modified: 11/22/2020 - 100% done Saving srop_words_spa

这是我用西班牙语为stop words制作的文本文件,然后我将其上传到google collab: srop_words_西班牙语.txt

这是我的代码:

from google.colab import files
spa = files.upload()
如您所见,导入成功:

srop_words_spanish.txt(text/plain) - 3391 bytes, last modified: 11/22/2020 - 100% done
Saving srop_words_spanish.txt to srop_words_spanish (4).txt
然而,它是以dict的形式上传的

{'srop_words_spanish.txt': b'alg\xc3\xban\r\nalguna\r\nalgunas\r\nalguno\r\nalgunos\r\nambos\r\nampleamos\r\nante\r\nantes\r\naquel\r\naquellas\r\naquellos\r\naqui\r\narriba\r\natras\r\nbajo\r\nbastante\r\nbien\r\ncada\r\ncierta\r\nciertas\r\ncierto\r\nciertos\r\ncomo\r\ncon\r\nconseguimos\r\nconseguir\r\nconsigo\r\nconsigue\r\nconsiguen\r\nconsigues\r\ncual\r\ncuando\r\ndentro\r\ndesde\r\ndonde\r\ndos\r\nel\r\nellas\r\nellos\r\nempleais\r\nem.....
我的目标是将dict转换为一组单词,而不使用\r或\n或直接打开文本文件,如下所示:

stopspa=set(line.strip() for line in open("srop_words_spanish.txt", 
encoding='UTF-8'))
我想知道如何做这两件事

# clean up the dataset to remove unnecessary columns (eg. REG) 
df=df.drop(['Marca temporal','Nombre y Apellidos','Correo electrónico'], axis = 1)
df.columns = list(map(str, df.columns))
%load_ext google.colab.data_table
df
[![enter image description here][1]][1]

df['Comentarios'] = df['Comentarios'].replace('\n', '')
df['Comentarios'] = df['Comentarios'].replace('\r', '')

text=[]

for i in range(len(df)):
  text.append(df.iloc[i,0])text= 

" ".join([str(i) for i in text])