Python R';sklearn用户的插入符号

Python R';sklearn用户的插入符号,python,r,machine-learning,scikit-learn,Python,R,Machine Learning,Scikit Learn,在过去的几年中,我将sklearn用于机器学习建模,并逐渐习惯于一个看起来非常逻辑和内聚的框架: from sklearn.ensemble import RandomForestClassifier # define a model clf = RandomForestClassifier() # fit the model to data clf.fit(X,y) #make prediction on a test set preds = clf.predict_proba(X_te

在过去的几年中,我将sklearn用于机器学习建模,并逐渐习惯于一个看起来非常逻辑和内聚的框架:

from sklearn.ensemble import RandomForestClassifier

# define a model
clf = RandomForestClassifier()

# fit the model to data
clf.fit(X,y)

#make prediction on a test set
preds = clf.predict_proba(X_test)[:,1]
我现在正试图学习一些R,并想开始做一些和我在sklearn中做的一样的事情。从sklearn世界中,您注意到的第一件事是跨包的不同语法。这是可以理解的,但有点不方便。 插入符号似乎是这个问题的一个很好的解决方案,它可以在所有不同的R包(如randomForest、gbm等)之间创建内聚。 尽管我仍然对一些默认选择感到困惑(例如,train()方法似乎默认为某种网格搜索)。此外,插入符号似乎在幕后使用plyr,这会弄乱一些dplyr方法,如Summary。因为我用dplyr做了很多数据处理,这是一个问题。
你能帮我弄清楚插入符号与sklearn的model/fit/predict\u proba的等价物是什么吗?另外,是否有办法处理plyr/dplyr问题?

插入符号库中进行预测的等效方法是更改
?predict.train
中的类型。应将其更改为:

predict(model, data, type="prob")
如果要混合使用dplyr/plyr,那么使用以下命令显式调用它的最简单方法是:

dplyr::summarise

如果您已经尝试过使用
predict(…,type=“prob”)
并出现了一个奇怪的错误,但您不理解并放弃了,我建议您阅读以下内容:

plyr::summarise