Machine learning 为训练实例分配特定权重的策略
我正在研究一个机器学习分类模型,在这个模型中,用户可以提供有助于改进模型的标签实例。 与以前可用于培训的实例相比,需要给予用户提供的最新实例更多的相关性 特别是,我正在使用Sklearn库用python开发我的机器学习模型 到目前为止,我只发现过采样特定实例的策略是问题的可能解决方案。使用此策略,我将创建实例的多个副本,以便提供更高的相关性 我发现的其他策略,但在这些情况下似乎没有帮助:Machine learning 为训练实例分配特定权重的策略,machine-learning,scikit-learn,classification,Machine Learning,Scikit Learn,Classification,我正在研究一个机器学习分类模型,在这个模型中,用户可以提供有助于改进模型的标签实例。 与以前可用于培训的实例相比,需要给予用户提供的最新实例更多的相关性 特别是,我正在使用Sklearn库用python开发我的机器学习模型 到目前为止,我只发现过采样特定实例的策略是问题的可能解决方案。使用此策略,我将创建实例的多个副本,以便提供更高的相关性 我发现的其他策略,但在这些情况下似乎没有帮助: 注重为每门课赋予权重的策略。默认情况下,此策略在多个库(如Sklearn)中得到高度使用。然而,这将想法推
- 注重为每门课赋予权重的策略。默认情况下,此策略在多个库(如Sklearn)中得到高度使用。然而,这将想法推广到了类级别,并不能帮助我将重点放在特定的实例上
fit
方法中提供了一个sample\u weight
参数,该参数正是这样做的。例如,以下是逻辑回归的参考:
样本重量:类似阵列的形状(n个样本)可选
分配给单个样本的权重数组。如果未提供,则每个样品均为单位重量
对于大多数scikit学习分类器,例如etc,甚至对于(非分类器)也存在类似的参数。请务必检查文档中的示例
其他框架的情况大致相同;例如,请参见中自己的答案
此外,scikit learn还提供了一个实用函数,用于在数据集不平衡的情况下计算sample\u weight
: