Python logistic.fit()逻辑回归中的erorr
我正在尝试使用Python logistic.fit()逻辑回归中的erorr,python,logistic-regression,Python,Logistic Regression,我正在尝试使用logistic.fit()我得到下面的eror。如何修复错误 Input contains NaN, infinity or a value too large for dtype('float64'). 以下是我代码的一部分: (楼层和姓氏是字符串) 所以你有几个选择 选项1: df_clean = df.dropna() df["Column_Name"].fillna(df["Column_Name"].mean(), inplace=True) df = df[p
logistic.fit()
我得到下面的eror。如何修复错误
Input contains NaN, infinity or a value too large for dtype('float64').
以下是我代码的一部分:
(楼层和姓氏是字符串)
所以你有几个选择 选项1:
df_clean = df.dropna()
df["Column_Name"].fillna(df["Column_Name"].mean(), inplace=True)
df = df[pd.notnull(df['Column_Name'])]
df.fillna(0)
这将删除所有NA值。如果您的观察结果很少,则不推荐使用
选项2:
df_clean = df.dropna()
df["Column_Name"].fillna(df["Column_Name"].mean(), inplace=True)
df = df[pd.notnull(df['Column_Name'])]
df.fillna(0)
这将用平均值替换所有缺失的值,或者您也可以执行中值。显然,这只适用于数值列
选项3:
df_clean = df.dropna()
df["Column_Name"].fillna(df["Column_Name"].mean(), inplace=True)
df = df[pd.notnull(df['Column_Name'])]
df.fillna(0)
在这里,您可以指定要从中删除NaN值的列。如果您的某些列是分类列,而其他列是数字列,那么这将与选项2一起使用
选项4:
df_clean = df.dropna()
df["Column_Name"].fillna(df["Column_Name"].mean(), inplace=True)
df = df[pd.notnull(df['Column_Name'])]
df.fillna(0)
用0填充所有NaN值。你可以这样做,而不是选择2,你的电话。无论如何,这应该足以让你开始思考如何解决你的问题。因为您熟悉这些数据,所以应该最了解如何处理这些数据。如果您对此有任何具体问题,我将非常乐意提供帮助 很明显,你的x或y都有问题。如果这样做df.isnull().sum(axis=1)
并且任何一行返回的数字都大于0,那么很明显,您的数据缺少值。你们如何处理它们取决于其他的事情。我做到了,几乎所有的线都超过0,那个么如何修复呢?如果我上传我的全部actaul代码能帮上忙吗?