Machine learning WEKA中的多类回归_Machine Learning_Classification_Weka_Regression

Machine learning WEKA中的多类回归

machine-learning

Machine learning WEKA中的多类回归,machine-learning,classification,weka,regression,Machine Learning,Classification,Weka,Regression,假设我有一个四类问题，其连续输出值在相同的范围内。（假设在10-50范围内）。如果我将所有类数据（训练数据）放在一个.csv文件中（对于WEKA），每个训练样本都有连续输出…那么我的回归模型将如何告诉我获得的输出（连续）是针对哪个类的？？？我想同时量化多类输入数据我现在仍然完全确定您的问题是什么，但我假设您有四个数据集，每个数据集中都有一个回归问题，您希望对累积数据集执行回归，并期望模型不仅恢复回归值，还恢复“来源” 在原始实现中（仅连接数据），这是不可能的，因为您将丢失有关数据来源的任何信息

假设我有一个四类问题，其连续输出值在相同的范围内。（假设在10-50范围内）。如果我将所有类数据（训练数据）放在一个.csv文件中（对于WEKA），每个训练样本都有连续输出…那么我的回归模型将如何告诉我获得的输出（连续）是针对哪个类的？？？我想同时量化多类输入数据

我现在仍然完全确定您的问题是什么，但我假设您有四个数据集，每个数据集中都有一个回归问题，您希望对累积数据集执行回归，并期望模型不仅恢复回归值，还恢复“来源”

在原始实现中（仅连接数据），这是不可能的，因为您将丢失有关数据来源的任何信息

您可以增加输出值，因此除了“Y”（回归值）之外，您还可以添加另一个值，指示它来自哪个集合，例如：

你把它转换成

Big set: 
x11 -> (y11,1)
x21 -> (y21,2)
x31 -> (y31,3)
x41 -> (y41,4)

或者用一元编码

Big set: 
x11 -> (y11,1,0,0,0)
x21 -> (y21,0,1,0,0)
x31 -> (y31,0,0,1,0)
x41 -> (y41,0,0,0,1)

这样，经过训练后，您不仅可以检索回归值，还可以检索源数据集（您称之为“类”）

当然，最简单的解决方案是建立两个独立的模型，一个用于回归，一个用于分类，这样你可以使用为这些任务设计的模型（而使用一个模型需要为至少一个部分选择一些次优的解决方案）

创建这样的“大集合”而不是处理小集合是否有益的问题相当于回答以下问题：

当被回归的值在每个子问题中都有非常相似的预测值时

因此-如果您有合理的理由，在每个子问题中，可以以类似的方式导出此功能（因为它对应于一些独立于数据拆分的物理现象）那么，是的，这是一个很好的方法。虽然只有在训练集非常有限的情况下才应该采取这些步骤——如果有足够的数据，最好假设每个子问题都有不同的特征，以防止模型偏差。最后，“最终”答案是“检查两种方法并评估其性能更好”（例如使用交叉验证），这也将让您了解此值在子集中是否真正独立。

您似乎使用了一些错误的词来描述您的问题。如果您有回归，而没有类，则类是分类元素（有限数量的输出值-类ID）.你只是在处理多维回归。我知道分类和回归的区别（实际上我经常做这些问题），但我有四种类型的数据。这样我想对四类（类型）进行回归数据。我想混合数据集，然后用它训练回归模型。然后预测给定数据集的四类中任何一类的连续输出…就像我们在多类分类问题中所做的那样。（我知道输出将是连续的）实际上，我想同时对不同类型的数据执行回归，这似乎仍然是错误的-它与多维回归有什么不同，多维回归的每个输入都有一个实向量？我知道分类和回归的区别（实际上我经常做这些问题）但是我有四种类型的数据。这样我想对四类（类型）数据进行回归。我想混合数据集，然后用它训练回归模型。然后预测给定数据集的四类中任何一类的连续输出…就像我们在多类分类问题中所做的那样。（我知道输出将是连续的）我实际上想对不同类型的数据进行回归simultaneously@lejlot…你是对的…这是我的问题而不是答案..我不能同时训练多维（多变量）和多类数据进行回归（比如气体量化）有什么好处…那么这意味着，对于每种类型的数据，我必须建立不同的回归模型…这是不太有利的…或者我应该同时使用分类和回归模型来首先对测试数据集进行分类，然后对其进行量化…如果我仍然无法正确传达，请道歉…提前感谢Hanks lejlot的回答…实际上我现在正在遵循您提到的第二个选项…但实际上我想使用提到的第一个选项…在WEKA GUI中，我无法对累积数据集执行回归…我是否应该尝试使用命令提示符？是的..被回归的值在每个子问题中都有非常相似的预测值…在我的情况下一旦您将数据转换为所描述的格式，无论您使用哪种工具，WEKA都将加载此增强数据，但您必须自己对其进行增强/转换，因为这是非常不寻常的数据处理。

Big set: 
x11 -> (y11,1,0,0,0)
x21 -> (y21,0,1,0,0)
x31 -> (y31,0,0,1,0)
x41 -> (y41,0,0,0,1)

Big set regression: 
x11 -> y11
x21 -> y21
x31 -> y31
x41 -> y41

Big set classification: 
x11 -> 1
x21 -> 2
x31 -> 3
x41 -> 4