Machine learning 在这种情况下可以使用什么机器学习算法?

Machine learning 在这种情况下可以使用什么机器学习算法?,machine-learning,weka,prediction,Machine Learning,Weka,Prediction,我的数据由以下对象组成 Obj1-颜色-形状-尺寸-价格-排名 所以我希望能够预测颜色/形状/尺寸/价格的组合是获得高排名的好组合。甚至一个组合也可以像这样工作:为了获得好的排名,alg预测这种颜色和形状的最佳性能。差不多吧 对于这种预测,什么是可取的算法 如果你能简单地解释一下我如何接近模型建筑,我会非常感激。例如:我的数据看起来像 Blue pentagon small $50.00 #5 Red Squre large $30.00 #3 那么,我应该看看什么是有用的预测模型呢?

我的数据由以下对象组成

Obj1-颜色-形状-尺寸-价格-排名

所以我希望能够预测颜色/形状/尺寸/价格的组合是获得高排名的好组合。甚至一个组合也可以像这样工作:为了获得好的排名,alg预测这种颜色和形状的最佳性能。差不多吧

对于这种预测,什么是可取的算法

如果你能简单地解释一下我如何接近模型建筑,我会非常感激。例如:我的数据看起来像

Blue pentagon small $50.00 #5
Red  Squre    large $30.00 #3

那么,我应该看看什么是有用的预测模型呢?我应该尝试什么算法来预测,比如说最高权重是价格,其次是颜色,然后是尺寸。如果我想预测像红色小形状这样的组合与粉色小形状相比,排名更高的可能性更小。(本质上是尝试组合多个标称值列进行预测)

将组合视为线性方程,并应用蒙特卡罗算法(如遗传算法)调整方程的参数


  • 将颜色/形状/尺寸/价格/排名编码为数字值


  • 将组合视为一个线性方程,例如
    a*颜色+b*形状+c*大小+d*价格=排名

  • 应用遗传算法调整a/b/c/d,使计算出的
    排名
    尽可能接近基本事实

  • 最后你得到了方程,你可以用它来:

    1) 通过简单的线性规划找到最大排名

    2) 只需指定其他参数即可预测排名


  • 听起来你想学习可以作为人类理解的模型。根据排名变量的类型,可能会有许多不同的学习者

    如果排名是分类的(例如星星),那么分类器可能是最好的。韦卡有很多人。一些产生人类可以理解的模型的是
    J48
    决策树学习器和
    OneR
    规则学习器

    如果排名是连续的(例如分数),回归可能更合适。合适的算法例如是
    SimpleLogistic
    LinearRegression


    或者,您可以尝试使用Weka中的任何算法对示例进行聚类,然后分析聚类。也就是说,理想情况下,集群中的示例都具有相同(或非常相似)的排名,您可以查看其他属性的值范围并得出自己的结论。

    非常感谢您的观点。我对J48有了一点了解,所以我一定要尝试一下。我需要一些关于如何修改数据的建议。现在,我的数据都是名义属性。比如黄色,圆形,中等,19.99美元,#458(排名)。那么你怎么建议呢,我试着给它建模。或者我应该看到什么样的输出?
    J48
    只能处理分类数据,因此原则上不需要修改它。不过,将价格转换为一个数字是有意义的(只需删除$符号)。查看示例排名#458表明分类并不是最好的方法(没有类)。我建议你试试回归。根据您选择的算法,您可能需要将数据转换为数字(例如,map small->0、Middle->1、large->2等)。如果我使用0、1、2等,这些算法不会使用文字值,而只是将它们作为不同的类使用吗?是的。但有些算法无法处理分类值。如果你感兴趣的只是单个因素的权重,这不重要——不管怎样,最重要的因素都会有最高的权重。你能看一下这个问题吗?你能看一下这个问题吗?我正试着这么做。这个问题我并没有找到一个理想的答案。因此,我提出了实际问题,并提供了实际的样本数据以寻求帮助。@ExceptionHandler我并没有针对这个问题。你问了9个问题,但只接受了其中的2个:-)那时我是个新手。现在,我正在努力接受答案。大多数情况下,经过几天的努力,我可能已经找到了正确的答案,然后我忘了来这里更新。。我会记住这一点:)@ExceptionHandler如果你自己找到了解决方案,干得好!我们非常欢迎您将您的解决方案发布为帮助他人的答案。如果你自己的答案比别人的好,你甚至可能想要接受。