Machine learning 如何对连续数据进行分类?

Machine learning 如何对连续数据进行分类?,machine-learning,classification,Machine Learning,Classification,我有两个相依的连续变量,我想用它们的组合值来预测第三个二元变量的值。如何对值进行离散化/分类?我不是在寻找聚类算法,我特别感兴趣的是获得“有意义的”离散类别,我随后可以在贝叶斯分类器中使用。 论文、书籍、在线课程的指南,非常感谢 这是机器学习的本质,也是研究最多的问题之一 最小二乘回归、logistic回归、支持向量机、随机森林等被广泛应用于这类问题,称为二元分类 如果您的目标是实用地对数据进行分类,那么可以使用几个库,如python中的Scikits learn和java中的weka。他们有大

我有两个相依的连续变量,我想用它们的组合值来预测第三个二元变量的值。如何对值进行离散化/分类?我不是在寻找聚类算法,我特别感兴趣的是获得“有意义的”离散类别,我随后可以在贝叶斯分类器中使用。
论文、书籍、在线课程的指南,非常感谢

这是机器学习的本质,也是研究最多的问题之一

最小二乘回归、logistic回归、支持向量机、随机森林等被广泛应用于这类问题,称为二元分类

如果您的目标是实用地对数据进行分类,那么可以使用几个库,如python中的Scikits learn和java中的weka。他们有大量的文档


但是如果你想了解机器学习的本质,只需在这里或谷歌上搜索机器学习资源。

如果你想成为一个真正的书呆子,生成一系列不同的可能离散化,然后在此基础上训练分类器,然后用特征描述离散化,然后在上面运行分类器,看看哪种离散化最好


一般来说,离散化更像是一门艺术,对输入变量范围的含义有很好的理解。

我对问题进行了编辑,以使其更清楚,它是关于分类的,而不是关于一般的分类。