Machine learning 为训练实例分配特定权重的策略_Machine Learning_Scikit Learn_Classification

Machine learning 为训练实例分配特定权重的策略

machine-learning scikit-learn

Machine learning 为训练实例分配特定权重的策略,machine-learning,scikit-learn,classification,Machine Learning,Scikit Learn,Classification,我正在研究一个机器学习分类模型，在这个模型中，用户可以提供有助于改进模型的标签实例。与以前可用于培训的实例相比，需要给予用户提供的最新实例更多的相关性特别是，我正在使用Sklearn库用python开发我的机器学习模型到目前为止，我只发现过采样特定实例的策略是问题的可能解决方案。使用此策略，我将创建实例的多个副本，以便提供更高的相关性我发现的其他策略，但在这些情况下似乎没有帮助：注重为每门课赋予权重的策略。默认情况下，此策略在多个库（如Sklearn）中得到高度使用。然而，这将想法推

我正在研究一个机器学习分类模型，在这个模型中，用户可以提供有助于改进模型的标签实例。与以前可用于培训的实例相比，需要给予用户提供的最新实例更多的相关性

特别是，我正在使用Sklearn库用python开发我的机器学习模型

到目前为止，我只发现过采样特定实例的策略是问题的可能解决方案。使用此策略，我将创建实例的多个副本，以便提供更高的相关性

我发现的其他策略，但在这些情况下似乎没有帮助：

注重为每门课赋予权重的策略。默认情况下，此策略在多个库（如Sklearn）中得到高度使用。然而，这将想法推广到了类级别，并不能帮助我将重点放在特定的实例上

我一直在寻找可能有助于为单个实例提供特定权重的多种策略，但大多数策略都侧重于类级别而不是实例级别的权重

我阅读了一些建议，以张量流模型中的实例为例，将损失函数乘以一些因子，但这似乎最适用于张量流中的神经网络模型

我想知道是否有人知道其他可能有助于解决这个问题的方法

我一直在寻找可能有助于为单个实例提供特定权重的多种策略，但大多数策略都侧重于类级别而不是实例级别的权重

这是不准确的；大多数scikit学习分类器在其

fit

方法中提供了一个

sample\u weight

参数，该参数正是这样做的。例如，以下是逻辑回归的参考：

样本重量：类似阵列的形状（n个样本）可选

分配给单个样本的权重数组。如果未提供，则每个样品均为单位重量

对于大多数scikit学习分类器，例如etc，甚至对于（非分类器）也存在类似的参数。请务必检查文档中的示例

其他框架的情况大致相同；例如，请参见中自己的答案

此外，scikit learn还提供了一个实用函数，用于在数据集不平衡的情况下计算

sample\u weight

：