如何使用python修改(纠正)在数据帧中写得不好的值
我有一个csv文件,其中包含写得不好的值。 我想纠正这些错误。例如,在名为carCompany.的列中,丰田替换丰田丰田,马自达替换马自达 我需要做的工作是使用这些自变量来预测汽车价格。replace(to_replace=None,value=None,inplace=False,limit=None,regex=False,method='pad')如何使用python修改(纠正)在数据帧中写得不好的值,python,dataframe,data-cleaning,Python,Dataframe,Data Cleaning,我有一个csv文件,其中包含写得不好的值。 我想纠正这些错误。例如,在名为carCompany.的列中,丰田替换丰田丰田,马自达替换马自达 我需要做的工作是使用这些自变量来预测汽车价格。replace(to_replace=None,value=None,inplace=False,limit=None,regex=False,method='pad') 应该可以工作。您可以使用此软件包的可能副本:非常有用它可以工作,但更改不会保留。如何保存它以继续分析必须覆盖数据框:df=df.replace
应该可以工作。您可以使用此软件包的可能副本:非常有用它可以工作,但更改不会保留。如何保存它以继续分析必须覆盖数据框:df=df.replace('Toyouta','toyota')或创建新的数据框:df_new=df.replace('Toyouta','toyota')df.replace({'Toyouta':'toyota','vw':'volkswagen',inplace=True)
eg.
>>> df = pd.DataFrame({'A': [0, 1, 2, 3, 4],
... 'B': [5, 6, 7, 8, 9],
... 'C': ['a', 'b', 'c', 'd', 'e']})
>>> df.replace(0, 5)
A B C
0 5 5 a
1 1 6 b
2 2 7 c
3 3 8 d
4 4 9 e
df.replace('Toyouta','toyota')