Python 基本文本挖掘。我收到一个UicodeencoderError 请编辑问题以显示完整的错误。另外,如果您能解释此代码的作用,那就太好了。您为什么使用“latin1”编码?您知道您的csv文件实际使用哪种编码吗?也许你应该用“utf-8”来代替?或者,您的文本

Python 基本文本挖掘。我收到一个UicodeencoderError 请编辑问题以显示完整的错误。另外,如果您能解释此代码的作用,那就太好了。您为什么使用“latin1”编码?您知道您的csv文件实际使用哪种编码吗?也许你应该用“utf-8”来代替?或者,您的文本,python,nlp,text-mining,Python,Nlp,Text Mining,基本文本挖掘。我收到一个UicodeencoderError 请编辑问题以显示完整的错误。另外,如果您能解释此代码的作用,那就太好了。您为什么使用“latin1”编码?您知道您的csv文件实际使用哪种编码吗?也许你应该用“utf-8”来代替?或者,您的文本数据可能不是有效的utf-8? import codecs import csv data = csv.reader(codecs.open("2019VAERSData.csv", "r", "latin1")) keys = next(d

基本文本挖掘。我收到一个UicodeencoderError
请编辑问题以显示完整的错误。另外,如果您能解释此代码的作用,那就太好了。您为什么使用“latin1”编码?您知道您的csv文件实际使用哪种编码吗?也许你应该用“utf-8”来代替?或者,您的文本数据可能不是有效的utf-8?
import codecs
import csv

data = csv.reader(codecs.open("2019VAERSData.csv", "r", "latin1"))
keys = next(data)

serious_keys = list(map(lambda key: keys.index(key), ["DISABLE", "DIED", "ER_VISIT", "HOSPITAL"]))

writer = csv.writer(open("2019-vaers-serious.csv", "w"))

keys += ["SERIOUS"]
writer.writerow(keys)

for row in data:
    is_serious = False
    for key in serious_keys:
        if row[key] == "Y":
            is_serious = True
    row += ["Y" if is_serious else "N"]
    writer.writerow(row)