Algorithm 数值/连续n维数据的机器学习算法

Algorithm 数值/连续n维数据的机器学习算法,algorithm,machine-learning,Algorithm,Machine Learning,我试图找到一种算法,它可以接受这样的训练输入: {1.1,2.3,3.5}->“foo” {4.7,5.9,6.1}->“bar” 其中第一部分是数据,第二部分是我自己指定的类别标签。这个想法是,当我输入一个新的数据点时,它应该能够猜出正确的标签 我已经实现了NaiveBayes(虽然到目前为止我只是用通常的{red,round}->“apple”东西测试了它),但我开始认为将数值数据离散化为布尔(统计)事件不会特别容易,也不可能产生好的结果(如果我错了,请纠正我!)。我喜欢它(NaiveBay

我试图找到一种算法,它可以接受这样的训练输入:

{1.1,2.3,3.5}->“foo” {4.7,5.9,6.1}->“bar”

其中第一部分是数据,第二部分是我自己指定的类别标签。这个想法是,当我输入一个新的数据点时,它应该能够猜出正确的标签

我已经实现了NaiveBayes(虽然到目前为止我只是用通常的{red,round}->“apple”东西测试了它),但我开始认为将数值数据离散化为布尔(统计)事件不会特别容易,也不可能产生好的结果(如果我错了,请纠正我!)。我喜欢它(NaiveBayes)的一点是它非常简单,事实上,我很可能会有适合事件的数据

所以我的问题是,你能说出一些可以直接使用数字数据的机器学习算法吗?或者,我如何有效地将浮点数据离散化为事件(用于,例如朴素贝叶斯)


其他信息:我也为这个项目实现了k-means(它输出的质心实际上是当前数据的来源),但我感兴趣的不是简单的聚类,而是将智能标签/类别附加到数据并将这些标签教给机器

也许会有帮助。那是一篇很棒的文章!我现在在想,我的最佳选择将是对训练数据应用k-means,并创建k个属性/事件;每个集群1个。本质上,当我将一个新的数据点传入我的naive bayes实现时,它将计算该数据点属于给定集群的概率(使用给定集群的平均值和标准偏差)。我会将此作为一种解决方案发布,但我仍然感兴趣的是,是否有专门针对连续/数字数据而不是分类数据的算法。