Machine learning 为训练实例分配特定权重的策略

Machine learning 为训练实例分配特定权重的策略,machine-learning,scikit-learn,classification,Machine Learning,Scikit Learn,Classification,我正在研究一个机器学习分类模型,在这个模型中,用户可以提供有助于改进模型的标签实例。 与以前可用于培训的实例相比,需要给予用户提供的最新实例更多的相关性 特别是,我正在使用Sklearn库用python开发我的机器学习模型 到目前为止,我只发现过采样特定实例的策略是问题的可能解决方案。使用此策略,我将创建实例的多个副本,以便提供更高的相关性 我发现的其他策略,但在这些情况下似乎没有帮助: 注重为每门课赋予权重的策略。默认情况下,此策略在多个库(如Sklearn)中得到高度使用。然而,这将想法推

我正在研究一个机器学习分类模型,在这个模型中,用户可以提供有助于改进模型的标签实例。 与以前可用于培训的实例相比,需要给予用户提供的最新实例更多的相关性

特别是,我正在使用Sklearn库用python开发我的机器学习模型

到目前为止,我只发现过采样特定实例的策略是问题的可能解决方案。使用此策略,我将创建实例的多个副本,以便提供更高的相关性

我发现的其他策略,但在这些情况下似乎没有帮助:

  • 注重为每门课赋予权重的策略。默认情况下,此策略在多个库(如Sklearn)中得到高度使用。然而,这将想法推广到了类级别,并不能帮助我将重点放在特定的实例上
我一直在寻找可能有助于为单个实例提供特定权重的多种策略,但大多数策略都侧重于类级别而不是实例级别的权重

我阅读了一些建议,以张量流模型中的实例为例,将损失函数乘以一些因子,但这似乎最适用于张量流中的神经网络模型

我想知道是否有人知道其他可能有助于解决这个问题的方法

我一直在寻找可能有助于为单个实例提供特定权重的多种策略,但大多数策略都侧重于类级别而不是实例级别的权重

这是不准确的;大多数scikit学习分类器在其
fit
方法中提供了一个
sample\u weight
参数,该参数正是这样做的。例如,以下是逻辑回归的参考:

样本重量:类似阵列的形状(n个样本)可选

分配给单个样本的权重数组。如果未提供,则每个样品均为单位重量

对于大多数scikit学习分类器,例如etc,甚至对于(非分类器)也存在类似的参数。请务必检查文档中的示例

其他框架的情况大致相同;例如,请参见中自己的答案

此外,scikit learn还提供了一个实用函数,用于在数据集不平衡的情况下计算
sample\u weight