Python 如何在决策树中划分数据集连续变量列的类别?

Python 如何在决策树中划分数据集连续变量列的类别?,python,machine-learning,decision-tree,Python,Machine Learning,Decision Tree,当我有一个像123到189这样的数字列时,我怎么知道我可以划分多少组,哪个阈值是最好的选择 有人能解释一下吗 提前谢谢 努兰,你提供的信息很少 那么列的值范围是123到189 这完全取决于领域和问题的背景 比如说,如果我有一个叫做Marks的列,范围从0到100, 我试着把它分为三类——低、中、高。 也许还可以尝试4种课程——低、中、中、高 然后比较每种情况下的性能 另一个好方法是将它们除以四分位数 为此,熊猫们有了自己的选择

当我有一个像123到189这样的数字列时,我怎么知道我可以划分多少组,哪个阈值是最好的选择

有人能解释一下吗


提前谢谢

努兰,你提供的信息很少

那么列的值范围是123到189

这完全取决于领域和问题的背景

比如说,如果我有一个叫做Marks的列,范围从0到100, 我试着把它分为三类——低、中、高。 也许还可以尝试4种课程——低、中、中、高

然后比较每种情况下的性能

另一个好方法是将它们除以四分位数

为此,熊猫们有了自己的选择