Python sklearn:具有负样本的多类分类器
我是机器学习新手,然而,我是一名资深程序员 我有很多关于客户/代理互动的数据,从客户的角度来看,这些互动的评级为正面/负面。。。我也有很多关于客户的特性(年龄、性别、以前的花费、购买的产品等等) 我想培训一个模型,可以从客户特征中学习,谁是处理这些特征的最佳代理,可能会产生最高的评级。。。假设相似的客户(相似的功能)将导致代理能够以相同的方式为他们提供服务 假设以下数据帧:datasetPython sklearn:具有负样本的多类分类器,python,scikit-learn,classification,Python,Scikit Learn,Classification,我是机器学习新手,然而,我是一名资深程序员 我有很多关于客户/代理互动的数据,从客户的角度来看,这些互动的评级为正面/负面。。。我也有很多关于客户的特性(年龄、性别、以前的花费、购买的产品等等) 我想培训一个模型,可以从客户特征中学习,谁是处理这些特征的最佳代理,可能会产生最高的评级。。。假设相似的客户(相似的功能)将导致代理能够以相同的方式为他们提供服务 假设以下数据帧:dataset AgentID Score Cust_F1 Cust_F2 Cust_F3 ..... Cust_F
AgentID Score Cust_F1 Cust_F2 Cust_F3 ..... Cust_Fn
0 1 10 1 0 1 2
1 1 0 0 1 2 0
2 1 9 1 2 1 2
3 2 10 0 1 1 1
4 2 9 0 1 2 1
5 2 0 1 0 2 2
X = dataset.drop([['AgendID','Score']],1).values
y = dataset['AgentID'].values
clf = RandomForestClassifier(n_estimators=100, random_state=1)
clf.fit(X,y)
我想要一种方法来训练模型拒绝(否定训练)所有得分为0的样本。我找不到用sklearn做这件事的方法。。。当然,我可以从训练数据中删除分数为0的样本,但是,我相信它们是非常有价值的信息,有助于算法正确分类
我还查看了sample_weight参数,我认为如果我在那里输入负值,这会有所帮助,但是,文档中没有提到这一点
有人能帮我吗 首先回答以下问题。1.这是回归问题还是分类问题?2.如果分类,有多少类。您可能会将
score=0
编码到其中一个类中。这是一个分类问题。。。我需要知道哪个是处理客户的最佳代理。有数千个代理,即数千个类。。。我不理解您关于score=0
的评论,我将查看文档以了解更多信息。