Pandas 创建决策树分类器时，为什么在拟合期间出现此错误_Pandas_Machine Learning_Classification_Decision Tree

Pandas 创建决策树分类器时，为什么在拟合期间出现此错误

pandas machine-learning

Pandas 创建决策树分类器时，为什么在拟合期间出现此错误,pandas,machine-learning,classification,decision-tree,Pandas,Machine Learning,Classification,Decision Tree,您好，我正在尝试决策树分类器下面的视频你好世界-机器学习食谱#1谷歌开发者这是我的密码 #Import the Pandas library import pandas as pd #Load the train and test datasets to create two DataFrames train_url = "http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/train.csv" train = pd.read

您好，我正在尝试决策树分类器下面的视频你好世界-机器学习食谱#1谷歌开发者

这是我的密码

#Import the Pandas library
  import pandas as pd
#Load the train and test datasets to create two DataFrames
train_url = "http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/train.csv" train = pd.read_csv(train_url)
#Print the head of the train and test dataframes
train.head() 
test_url = "http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/test.csv" test = pd.read_csv(test_url)
#Print the head of the train and test dataframes
test.head()
#from sklearn import tree
from sklearn import tree
#find the best feature to predict Survival rate
#define X_features and Y_labels
col_names=['Pclass','Age','SibSp','Parch']
X_features= train[col_names]
#assign survial to label
Y_labels= train.Survived
#create a decision tree classifier
clf=tree.DecisionTreeClassifier()
#fit (find patterns in Data)
clf=clf.fit(X_features, Y_labels)
clf.predict(test[col_names])

获取错误 ValueError Traceback（最近一次调用last）in（）13#Y#u train#u sparse=Y#u labels.to#u sparse（）14#fit（在数据中查找模式）--->15 clf=clf.fit（X#u特征，Y#labels）16#clf.predict（测试[列名]）

C:\Users\nitinahu\AppData\Local\Continuum\Anaconda3\lib\site packages\sklearn\tree\tree.py 拟合（自身、X、y、样本重量、检查输入、X\U idx\U排序）152 随机状态=检查随机状态（自随机状态）153如果检查\u输入：-->154 X=检查\u数组（X，dtype=dtype，如果issparse（X）：156 X.排序索引（）则接受_sparse=“csc”）155

C:\Users\nitinahu\AppData\Local\Continuum\Anaconda3\lib\site packages\sklearn\utils\validation.py 在检查数组（数组、接受稀疏、数据类型、顺序、复制、，强制所有有限，确保2d，允许nd，确保最小样本，确保\u最小\u功能，警告\u数据类型，估计器）396%（array.ndim，估算器（名称）397如果力（全部）有限：-->398 _assert_all_finite（数组）399 400 shape_repr=_shape_repr（array.shape）

C:\Users\nitinahu\AppData\Local\Continuum\Anaconda3\lib\site packages\sklearn\utils\validation.py 在_assert_all_finite（X）52中，而不是np.isfinite（X）.all（））：53 ValueError（“输入包含NaN，无穷大”-->54”或一个值对于%r.%X.dtype）55 56，该值较大

ValueError：输入包含NaN、无穷大或太大的值数据类型（'float32'）

只需检查响应中的所有值

一个或两个值超出了界限，导致溢出。

您好，您应该参考以帮助开始。一般来说，当发帖人对帖子进行编码并询问为什么不起作用时，一个问题并不受欢迎。这表明您的努力很小。谢谢您的建议，不是吗

valueError

，可能有些值超出了允许的范围？我检查了“年龄”列中是否有NaN，如何在火车和测试数据集中的“年龄”列中找到NaN，并用一些实际值替换