Algorithm 数值/连续n维数据的机器学习算法_Algorithm_Machine Learning

Algorithm 数值/连续n维数据的机器学习算法

algorithm machine-learning

Algorithm 数值/连续n维数据的机器学习算法,algorithm,machine-learning,Algorithm,Machine Learning,我试图找到一种算法，它可以接受这样的训练输入： {1.1,2.3,3.5}->“foo” {4.7,5.9,6.1}->“bar” 其中第一部分是数据，第二部分是我自己指定的类别标签。这个想法是，当我输入一个新的数据点时，它应该能够猜出正确的标签我已经实现了NaiveBayes（虽然到目前为止我只是用通常的{red，round}->“apple”东西测试了它），但我开始认为将数值数据离散化为布尔（统计）事件不会特别容易，也不可能产生好的结果（如果我错了，请纠正我！）。我喜欢它（NaiveBay

我试图找到一种算法，它可以接受这样的训练输入：

{1.1,2.3,3.5}->“foo” {4.7,5.9,6.1}->“bar”

其中第一部分是数据，第二部分是我自己指定的类别标签。这个想法是，当我输入一个新的数据点时，它应该能够猜出正确的标签

我已经实现了NaiveBayes（虽然到目前为止我只是用通常的{red，round}->“apple”东西测试了它），但我开始认为将数值数据离散化为布尔（统计）事件不会特别容易，也不可能产生好的结果（如果我错了，请纠正我！）。我喜欢它（NaiveBayes）的一点是它非常简单，事实上，我很可能会有适合事件的数据

所以我的问题是，你能说出一些可以直接使用数字数据的机器学习算法吗？或者，我如何有效地将浮点数据离散化为事件（用于，例如朴素贝叶斯）

其他信息：我也为这个项目实现了k-means（它输出的质心实际上是当前数据的来源），但我感兴趣的不是简单的聚类，而是将智能标签/类别附加到数据并将这些标签教给机器

也许会有帮助。那是一篇很棒的文章！我现在在想，我的最佳选择将是对训练数据应用k-means，并创建k个属性/事件；每个集群1个。本质上，当我将一个新的数据点传入我的naive bayes实现时，它将计算该数据点属于给定集群的概率（使用给定集群的平均值和标准偏差）。我会将此作为一种解决方案发布，但我仍然感兴趣的是，是否有专门针对连续/数字数据而不是分类数据的算法。