Machine learning WEKA中的多类回归

Machine learning WEKA中的多类回归,machine-learning,classification,weka,regression,Machine Learning,Classification,Weka,Regression,假设我有一个四类问题,其连续输出值在相同的范围内。(假设在10-50范围内)。如果我将所有类数据(训练数据)放在一个.csv文件中(对于WEKA),每个训练样本都有连续输出…那么我的回归模型将如何告诉我获得的输出(连续)是针对哪个类的???我想同时量化多类输入数据我现在仍然完全确定您的问题是什么,但我假设您有四个数据集,每个数据集中都有一个回归问题,您希望对累积数据集执行回归,并期望模型不仅恢复回归值,还恢复“来源” 在原始实现中(仅连接数据),这是不可能的,因为您将丢失有关数据来源的任何信息

假设我有一个四类问题,其连续输出值在相同的范围内。(假设在10-50范围内)。如果我将所有类数据(训练数据)放在一个.csv文件中(对于WEKA),每个训练样本都有连续输出…那么我的回归模型将如何告诉我获得的输出(连续)是针对哪个类的???我想同时量化多类输入数据

我现在仍然完全确定您的问题是什么,但我假设您有四个数据集,每个数据集中都有一个回归问题,您希望对累积数据集执行回归,并期望模型不仅恢复回归值,还恢复“来源”

  • 在原始实现中(仅连接数据),这是不可能的,因为您将丢失有关数据来源的任何信息
  • 您可以增加输出值,因此除了“Y”(回归值)之外,您还可以添加另一个值,指示它来自哪个集合,例如:
  • 你把它转换成

    Big set: 
    x11 -> (y11,1)
    x21 -> (y21,2)
    x31 -> (y31,3)
    x41 -> (y41,4)
    
    或者用一元编码

    Big set: 
    x11 -> (y11,1,0,0,0)
    x21 -> (y21,0,1,0,0)
    x31 -> (y31,0,0,1,0)
    x41 -> (y41,0,0,0,1)
    
    这样,经过训练后,您不仅可以检索回归值,还可以检索源数据集(您称之为“类”)

    当然,最简单的解决方案是建立两个独立的模型,一个用于回归,一个用于分类,这样你可以使用为这些任务设计的模型(而使用一个模型需要为至少一个部分选择一些次优的解决方案)

    创建这样的“大集合”而不是处理小集合是否有益的问题相当于回答以下问题:

    当被回归的值在每个子问题中都有非常相似的预测值时


    因此-如果您有合理的理由,在每个子问题中,可以以类似的方式导出此功能(因为它对应于一些独立于数据拆分的物理现象)那么,是的,这是一个很好的方法。虽然只有在训练集非常有限的情况下才应该采取这些步骤——如果有足够的数据,最好假设每个子问题都有不同的特征,以防止模型偏差。最后,“最终”答案是“检查两种方法并评估其性能更好”(例如使用交叉验证),这也将让您了解此值在子集中是否真正独立。

    您似乎使用了一些错误的词来描述您的问题。如果您有回归,而没有类,则类是分类元素(有限数量的输出值-类ID).你只是在处理多维回归。我知道分类和回归的区别(实际上我经常做这些问题),但我有四种类型的数据。这样我想对四类(类型)进行回归数据。我想混合数据集,然后用它训练回归模型。然后预测给定数据集的四类中任何一类的连续输出…就像我们在多类分类问题中所做的那样。(我知道输出将是连续的)实际上,我想同时对不同类型的数据执行回归,这似乎仍然是错误的-它与多维回归有什么不同,多维回归的每个输入都有一个实向量?我知道分类和回归的区别(实际上我经常做这些问题)但是我有四种类型的数据。这样我想对四类(类型)数据进行回归。我想混合数据集,然后用它训练回归模型。然后预测给定数据集的四类中任何一类的连续输出…就像我们在多类分类问题中所做的那样。(我知道输出将是连续的)我实际上想对不同类型的数据进行回归simultaneously@lejlot…你是对的…这是我的问题而不是答案..我不能同时训练多维(多变量)和多类数据进行回归(比如气体量化)有什么好处…那么这意味着,对于每种类型的数据,我必须建立不同的回归模型…这是不太有利的…或者我应该同时使用分类和回归模型来首先对测试数据集进行分类,然后对其进行量化…如果我仍然无法正确传达,请道歉…提前感谢Hanks lejlot的回答…实际上我现在正在遵循您提到的第二个选项…但实际上我想使用提到的第一个选项…在WEKA GUI中,我无法对累积数据集执行回归…我是否应该尝试使用命令提示符?是的..被回归的值在每个子问题中都有非常相似的预测值…在我的情况下一旦您将数据转换为所描述的格式,无论您使用哪种工具,WEKA都将加载此增强数据,但您必须自己对其进行增强/转换,因为这是非常不寻常的数据处理。
    Big set: 
    x11 -> (y11,1,0,0,0)
    x21 -> (y21,0,1,0,0)
    x31 -> (y31,0,0,1,0)
    x41 -> (y41,0,0,0,1)
    
    Big set regression: 
    x11 -> y11
    x21 -> y21
    x31 -> y31
    x41 -> y41
    
    Big set classification: 
    x11 -> 1
    x21 -> 2
    x31 -> 3
    x41 -> 4