Machine learning 如何通过一个简单的模拟模型生成一个人工数据集,用于具有二进制响应和4-5个特征的分类分析?
我需要一个模拟模型,生成一个带有二进制响应变量的人工分类数据集。然后我想使用这个数据集检查各种分类器的性能。数据集可以有任意数量的特征、预测值。您需要知道生成数据的分布。很可能是正态分布。然后需要将数据点标记到其类 正态分布: 高斯分布:Machine learning 如何通过一个简单的模拟模型生成一个人工数据集,用于具有二进制响应和4-5个特征的分类分析?,machine-learning,data-mining,classification,Machine Learning,Data Mining,Classification,我需要一个模拟模型,生成一个带有二进制响应变量的人工分类数据集。然后我想使用这个数据集检查各种分类器的性能。数据集可以有任意数量的特征、预测值。您需要知道生成数据的分布。很可能是正态分布。然后需要将数据点标记到其类 正态分布: 高斯分布: excel中的数据生成:这是个坏主意,不会告诉您分类器的相对优点 首先,我将解释如何生成数据,然后解释为什么这样做不会学到任何东西。你需要一个二进制特征向量:有很多方法可以做到这一点,但让我们采用最简单的方法。独立伯努利变量的向量。下面是生成任意多个实例的
excel中的数据生成:这是个坏主意,不会告诉您分类器的相对优点 首先,我将解释如何生成数据,然后解释为什么这样做不会学到任何东西。你需要一个二进制特征向量:有很多方法可以做到这一点,但让我们采用最简单的方法。独立伯努利变量的向量。下面是生成任意多个实例的方法:
如果你也想模拟xs,你可以,但是你回到了我上面讨论的领域。另外,请注意,由于这是逻辑回归抽样,因此该分类器在这里具有明显的优势,正如我在上面所描述的…是的,您是对的。我想要一个不偏向任何分类器的数据集。一个回归示例可以是模型:Y=(2sinX1)(2sinX2)+e,其中X1和X2是一致的,e是高斯分布。我需要一个二进制响应,谢谢!啊等等-一个二进制响应?然后你需要逻辑回归模型。让我编辑我的答案。