Python Pandas返回:ValueError:未知标签类型:';连续';

Python Pandas返回:ValueError:未知标签类型:';连续';,python,scikit-learn,Python,Scikit Learn,我在使用pandas和sklearn进行机器学习时遇到问题。我的问题是 ValueError:未知的标签类型:“连续” 我试过了 model = sklearn.tree.DecisionTreeClassifier() model.fit(X, y) 它返回以下错误: ValueError Traceback (most recent call last) <ipython-input-45-3caead2f350b>

我在使用pandas和sklearn进行机器学习时遇到问题。我的问题是

ValueError:未知的标签类型:“连续”

我试过了

model = sklearn.tree.DecisionTreeClassifier()
model.fit(X, y)
它返回以下错误:

ValueError                                Traceback (most recent call last)
<ipython-input-45-3caead2f350b> in <module>
----> 1 model.fit(ninp, out)

c:\users\user\appdata\local\programs\python\python38-32\lib\site-packages\sklearn\tree\_classes.py in fit(self, X, y, sample_weight, check_input, X_idx_sorted)
    888         """
    889 
--> 890         super().fit(
    891             X, y,
    892             sample_weight=sample_weight,

c:\users\user\appdata\local\programs\python\python38-32\lib\site-packages\sklearn\tree\_classes.py in fit(self, X, y, sample_weight, check_input, X_idx_sorted)
    179 
    180         if is_classification:
--> 181             check_classification_targets(y)
    182             y = np.copy(y)
    183 

c:\users\user\appdata\local\programs\python\python38-32\lib\site-packages\sklearn\utils\multiclass.py in check_classification_targets(y)
    170     if y_type not in ['binary', 'multiclass', 'multiclass-multioutput',
    171                       'multilabel-indicator', 'multilabel-sequences']:
--> 172         raise ValueError("Unknown label type: %r" % y_type)
    173 
    174 

ValueError: Unknown label type: 'continuous'
ValueError回溯(最近一次调用)
在里面
---->1个型号。安装(ninp,out)
c:\users\user\appdata\local\programs\python\python38-32\lib\site packages\sklearn\tree\\u classes.py合适(self、X、y、sample\u weight、check\u input、X\u idx\u sorted)
888         """
889
-->890 super().fit(
891 X,y,
892样品重量=样品重量,
c:\users\user\appdata\local\programs\python\python38-32\lib\site packages\sklearn\tree\\u classes.py合适(self、X、y、sample\u weight、check\u input、X\u idx\u sorted)
179
180如果是U分类:
-->181检查分类目标(y)
182 y=np.拷贝(y)
183
检查分类目标中的c:\users\user\appdata\local\programs\python\python38-32\lib\site packages\sklearn\utils\multiclass.py(y)
170如果y_类型不在['binary'、'multiclass'、'multiclass multioutput'中,
171“多标签指示器”、“多标签序列”]:
-->172提升值错误(“未知标签类型:%r”%y\u类型)
173
174
ValueError:未知的标签类型:“连续”

分类器将一组示例分类为离散类(即,它分配了一个对应于K类之一的标签)。如果您的目标(您的
y
变量的内容)是连续的(例如介于0和1之间的浮点),则决策树不知道如何处理它

您有两种解决方案:

  • 您的问题是一项分类任务,您需要对目标变量进行建模,使其表示类别而不是连续变量
  • 您的问题不是分类任务,而是回归任务,您需要使用适当的模型(例如,
    DecisionTreeRegressor

  • 现在了解
    X
    y
    所包含的内容可能会有所帮助?也许可以添加一个简短的示例,帮助理解它们的结构。这是否回答了您的问题?您需要检查您的目标是什么,最有可能是浮动。在这种情况下,您可能会考虑切换到回归,或者检查已经给出的其他众多答案在类似的情况下。