Python sklearn：具有负样本的多类分类器_Python_Scikit Learn_Classification

Python sklearn：具有负样本的多类分类器

python scikit-learn

Python sklearn：具有负样本的多类分类器,python,scikit-learn,classification,Python,Scikit Learn,Classification,我是机器学习新手，然而，我是一名资深程序员我有很多关于客户/代理互动的数据，从客户的角度来看，这些互动的评级为正面/负面。。。我也有很多关于客户的特性（年龄、性别、以前的花费、购买的产品等等）我想培训一个模型，可以从客户特征中学习，谁是处理这些特征的最佳代理，可能会产生最高的评级。。。假设相似的客户（相似的功能）将导致代理能够以相同的方式为他们提供服务假设以下数据帧：dataset AgentID Score Cust_F1 Cust_F2 Cust_F3 ..... Cust_F

我是机器学习新手，然而，我是一名资深程序员

我有很多关于客户/代理互动的数据，从客户的角度来看，这些互动的评级为正面/负面。。。我也有很多关于客户的特性（年龄、性别、以前的花费、购买的产品等等）

我想培训一个模型，可以从客户特征中学习，谁是处理这些特征的最佳代理，可能会产生最高的评级。。。假设相似的客户（相似的功能）将导致代理能够以相同的方式为他们提供服务

假设以下数据帧：dataset

    AgentID Score Cust_F1 Cust_F2 Cust_F3 ..... Cust_Fn
0   1        10      1      0       1             2
1   1         0      0      1       2             0
2   1         9      1      2       1             2
3   2        10      0      1       1             1 
4   2         9      0      1       2             1
5   2         0      1      0       2             2


X = dataset.drop([['AgendID','Score']],1).values
y = dataset['AgentID'].values

clf = RandomForestClassifier(n_estimators=100, random_state=1)
clf.fit(X,y)

我想要一种方法来训练模型拒绝（否定训练）所有得分为0的样本。我找不到用sklearn做这件事的方法。。。当然，我可以从训练数据中删除分数为0的样本，但是，我相信它们是非常有价值的信息，有助于算法正确分类

我还查看了sample_weight参数，我认为如果我在那里输入负值，这会有所帮助，但是，文档中没有提到这一点

有人能帮我吗

首先回答以下问题。1.这是回归问题还是分类问题？2.如果分类，有多少类。您可能会将

score=0

编码到其中一个类中。这是一个分类问题。。。我需要知道哪个是处理客户的最佳代理。有数千个代理，即数千个类。。。我不理解您关于

score=0

的评论，我将查看文档以了解更多信息。