Pandas 创建决策树分类器时,为什么在拟合期间出现此错误

Pandas 创建决策树分类器时,为什么在拟合期间出现此错误,pandas,machine-learning,classification,decision-tree,Pandas,Machine Learning,Classification,Decision Tree,您好,我正在尝试决策树分类器下面的视频你好世界-机器学习食谱#1谷歌开发者 这是我的密码 #Import the Pandas library import pandas as pd #Load the train and test datasets to create two DataFrames train_url = "http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/train.csv" train = pd.read

您好,我正在尝试决策树分类器下面的视频你好世界-机器学习食谱#1谷歌开发者

这是我的密码

#Import the Pandas library
  import pandas as pd
#Load the train and test datasets to create two DataFrames
train_url = "http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/train.csv" train = pd.read_csv(train_url)
#Print the head of the train and test dataframes
train.head() 
test_url = "http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/test.csv" test = pd.read_csv(test_url)
#Print the head of the train and test dataframes
test.head()
#from sklearn import tree
from sklearn import tree
#find the best feature to predict Survival rate
#define X_features and Y_labels
col_names=['Pclass','Age','SibSp','Parch']
X_features= train[col_names]
#assign survial to label
Y_labels= train.Survived
#create a decision tree classifier
clf=tree.DecisionTreeClassifier()
#fit (find patterns in Data)
clf=clf.fit(X_features, Y_labels)
clf.predict(test[col_names])
获取错误 ValueError Traceback(最近一次调用last)in()13#Y#u train#u sparse=Y#u labels.to#u sparse()14#fit(在数据中查找模式)--->15 clf=clf.fit(X#u特征,Y#labels)16#clf.predict(测试[列名])

C:\Users\nitinahu\AppData\Local\Continuum\Anaconda3\lib\site packages\sklearn\tree\tree.py 拟合(自身、X、y、样本重量、检查输入、X\U idx\U排序)152 随机状态=检查随机状态(自随机状态)153如果 检查\u输入:-->154 X=检查\u数组(X,dtype=dtype, 如果issparse(X):156 X.排序索引()则接受_sparse=“csc”)155

C:\Users\nitinahu\AppData\Local\Continuum\Anaconda3\lib\site packages\sklearn\utils\validation.py 在检查数组(数组、接受稀疏、数据类型、顺序、复制、, 强制所有有限,确保2d,允许nd,确保最小样本, 确保\u最小\u功能,警告\u数据类型,估计器)396%(array.ndim, 估算器(名称)397如果力(全部)有限:-->398 _assert_all_finite(数组)399 400 shape_repr=_shape_repr(array.shape)

C:\Users\nitinahu\AppData\Local\Continuum\Anaconda3\lib\site packages\sklearn\utils\validation.py 在_assert_all_finite(X)52中,而不是np.isfinite(X).all()):53 ValueError(“输入包含NaN,无穷大”-->54”或一个值 对于%r.%X.dtype)55 56,该值较大

ValueError:输入包含NaN、无穷大或太大的值 数据类型('float32')


只需检查响应中的所有值


一个或两个值超出了界限,导致溢出。

您好,您应该参考以帮助开始。一般来说,当发帖人对帖子进行编码并询问为什么不起作用时,一个问题并不受欢迎。这表明您的努力很小。谢谢您的建议,不是吗
valueError
,可能有些值超出了允许的范围?我检查了“年龄”列中是否有NaN,如何在火车和测试数据集中的“年龄”列中找到NaN,并用一些实际值替换