Python中的数据预处理

Python中的数据预处理,python,scikit-learn,Python,Scikit Learn,嘿,我是数据科学的新手,在这里我试图在其中一列中找到缺失的数据。但是,我遇到了一个错误,即“X未定义”。有人能帮我吗 #missing data from sklearn.preprocessing import Imputer imputer = Imputer(missing_values='NaN', strategy ='mean', axis =0) imputer = imputer.fit(X[:, 1:3]) X[:, 1:3] = imputer.transform(X[:,

嘿,我是数据科学的新手,在这里我试图在其中一列中找到缺失的数据。但是,我遇到了一个错误,即“X未定义”。有人能帮我吗

#missing data
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values='NaN', strategy ='mean', axis =0)
imputer = imputer.fit(X[:, 1:3])
X[:, 1:3] = imputer.transform(X[:, 1:3])
“X”表示主数据帧的numpy.ndarray减去目标变量

X = df.iloc[:, :-1].values
试试这个。应正常工作。

要查找单列缺少的数据,必须使用以下代码。 dataset_name['column_name'].isnull().sum()

注意:如果我们需要找到丢失的数据,那么就不用担心X变量了。
当您试图用一些平均值/中值/模式值填充缺失的数据时,需要X和y变量。

您的X是什么?我想你忘了在代码中定义X。你可以用你感兴趣的列替换X。X只是我之前使用过的一组数据。我看不出有任何理由在这里打印代码。它是在代码中定义的。这只是代码片段