Machine learning 机器学习,强调某些观察?

Machine learning 机器学习,强调某些观察?,machine-learning,Machine Learning,我有一个多类机器学习问题,我将尝试不同的方法,如逻辑回归、决策树、多层感知器等 数据集中的观测值有一个属性,该属性是1-5中的一个索引,它定义了某个观测值正确分类的重要性(索引1非常重要,5根本不重要)。我的问题是: 问题1:我应该如何向模型强调指数越低的观测值越重要?我正在考虑复制这些观察结果,以便模型更适合较低指数的观察结果,还有什么其他方法可行 问题2:我可以使用什么绩效评估标准来找到能够很好地预测这些低指数观察结果的模型?(通过计算正确预测的实例之间的指数分布而得出。) 关于这一点,答案

我有一个多类机器学习问题,我将尝试不同的方法,如逻辑回归、决策树、多层感知器等

数据集中的观测值有一个属性,该属性是1-5中的一个索引,它定义了某个观测值正确分类的重要性(索引1非常重要,5根本不重要)。我的问题是:

问题1:我应该如何向模型强调指数越低的观测值越重要?我正在考虑复制这些观察结果,以便模型更适合较低指数的观察结果,还有什么其他方法可行

问题2:我可以使用什么绩效评估标准来找到能够很好地预测这些低指数观察结果的模型?(通过计算正确预测的实例之间的指数分布而得出。)


关于这一点,

答案1:更频繁地呈现训练集的重要模式是这方面的标准方法。如果您的训练算法具有类似于容错率的特性(例如,如果您使用反向传播),那么您还可以为高优先级模式增加此参数


答案2:我会使用加权均方误差,并赋予高优先级模式的误差更大的权重。

答案1:更频繁地呈现训练集的重要模式是这方面的标准方法。如果您的训练算法具有类似于容错率的特性(例如,如果您使用反向传播),那么您还可以为高优先级模式增加此参数


答案2:我会使用加权均方误差,并赋予高优先级模式的误差更大的权重。

关于第二个问题的答案,我不认为均方误差应该如何用于分类问题?@Josi:我假设(1)你有监督分类ans(2)单元格具有连续的输出值。如果不是这样的话,另一种错误度量可能更有意义。第一种假设是正确的,但第二种假设不是。输出是离散的,因此输出只是一个类标签,其中只有一个标签正确,而所有其他标签都不正确。我一直在考虑一些方法,比如F分数和汉明损失,但我很难决定。我所寻找的是一个绩效评估标准,即:-某种程度上补充了古典小说的准确性-相当简单-某种动机,说明我为什么应该使用这种方法来回答第二个问题,我不知道如何将均方误差用于分类问题?@Josi:我假设(1)你进行监督分类,而(2)单元格具有连续的输出值。如果不是这样的话,另一种错误度量可能更有意义。第一种假设是正确的,但第二种假设不是。输出是离散的,因此输出只是一个类标签,其中只有一个标签正确,而所有其他标签都不正确。我一直在考虑一些方法,比如F分数和汉明损失,但我很难决定。我所寻找的是一个绩效评估标准,它是:-某种程度上补充了古典小说的准确性-相当简单-某种动机,说明我为什么应该使用这种方法