Machine learning 项目的Mahout朴素贝叶斯分类器

Machine learning 项目的Mahout朴素贝叶斯分类器,machine-learning,mahout,bayesian,classification,Machine Learning,Mahout,Bayesian,Classification,团队 我正在做一个项目,在这个项目中,我需要将项目划分为特定的类别。我有一个文件作为输入;包含目标变量和空格分隔特征。我的训练数据如下 类别名称[选项卡]数据字符串 管道[Tab]管道水龙头塑料管PVC管冷水管热水管三通出口上弯头上弯头下弯头闸阀截止阀 油漆[标签]象牙黑焦棕色灰泥紫色土红色赭色钛白色镉黄色浅镉黄色深 Cloth[标签]衬衫T恤Pent牛仔裤T恤货物 嗯,我有一大套分类。我这里有几个问题 我是否使用正确的数据进行培训?如果没有,我应该用什么 一旦我训练并测试了我的模型,下一步是什

团队

我正在做一个项目,在这个项目中,我需要将项目划分为特定的类别。我有一个文件作为输入;包含目标变量空格分隔特征。我的训练数据如下

类别名称[选项卡]数据字符串 管道[Tab]管道水龙头塑料管PVC管冷水管热水管三通出口上弯头上弯头下弯头闸阀截止阀

油漆[标签]象牙黑焦棕色灰泥紫色土红色赭色钛白色镉黄色浅镉黄色深

Cloth[标签]衬衫T恤Pent牛仔裤T恤货物

嗯,我有一大套分类。我这里有几个问题

  • 我是否使用正确的数据进行培训?如果没有,我应该用什么
  • 一旦我训练并测试了我的模型,下一步是什么?如何使用输出
  • 请帮我做这个

    谢谢


    Nimesh

    是的,一旦你得到了一些输出,你就可以用它来测试了。 您可以看到一些测试数据集生成一些测试结果。 有些是好的,但有些不是。
    调整模型或测试数据集可能是您的下一步。

    是否每个类别都有多个条目,例如“绘制”类别的几行,每行都有一组不同但重叠的单词?您可以查看教程,它正在实现与您尝试做的非常类似的操作。