Python sklearn:具有负样本的多类分类器

Python sklearn:具有负样本的多类分类器,python,scikit-learn,classification,Python,Scikit Learn,Classification,我是机器学习新手,然而,我是一名资深程序员 我有很多关于客户/代理互动的数据,从客户的角度来看,这些互动的评级为正面/负面。。。我也有很多关于客户的特性(年龄、性别、以前的花费、购买的产品等等) 我想培训一个模型,可以从客户特征中学习,谁是处理这些特征的最佳代理,可能会产生最高的评级。。。假设相似的客户(相似的功能)将导致代理能够以相同的方式为他们提供服务 假设以下数据帧:dataset AgentID Score Cust_F1 Cust_F2 Cust_F3 ..... Cust_F

我是机器学习新手,然而,我是一名资深程序员

我有很多关于客户/代理互动的数据,从客户的角度来看,这些互动的评级为正面/负面。。。我也有很多关于客户的特性(年龄、性别、以前的花费、购买的产品等等)

我想培训一个模型,可以从客户特征中学习,谁是处理这些特征的最佳代理,可能会产生最高的评级。。。假设相似的客户(相似的功能)将导致代理能够以相同的方式为他们提供服务

假设以下数据帧:dataset

    AgentID Score Cust_F1 Cust_F2 Cust_F3 ..... Cust_Fn
0   1        10      1      0       1             2
1   1         0      0      1       2             0
2   1         9      1      2       1             2
3   2        10      0      1       1             1 
4   2         9      0      1       2             1
5   2         0      1      0       2             2


X = dataset.drop([['AgendID','Score']],1).values
y = dataset['AgentID'].values

clf = RandomForestClassifier(n_estimators=100, random_state=1)
clf.fit(X,y)
我想要一种方法来训练模型拒绝(否定训练)所有得分为0的样本。我找不到用sklearn做这件事的方法。。。当然,我可以从训练数据中删除分数为0的样本,但是,我相信它们是非常有价值的信息,有助于算法正确分类

我还查看了sample_weight参数,我认为如果我在那里输入负值,这会有所帮助,但是,文档中没有提到这一点


有人能帮我吗

首先回答以下问题。1.这是回归问题还是分类问题?2.如果分类,有多少类。您可能会将
score=0
编码到其中一个类中。这是一个分类问题。。。我需要知道哪个是处理客户的最佳代理。有数千个代理,即数千个类。。。我不理解您关于
score=0
的评论,我将查看文档以了解更多信息。