Python R'；sklearn用户的插入符号_Python_R_Machine Learning_Scikit Learn

Python R'；sklearn用户的插入符号

python r machine-learning scikit-learn

Python R'；sklearn用户的插入符号,python,r,machine-learning,scikit-learn,Python,R,Machine Learning,Scikit Learn,在过去的几年中，我将sklearn用于机器学习建模，并逐渐习惯于一个看起来非常逻辑和内聚的框架： from sklearn.ensemble import RandomForestClassifier # define a model clf = RandomForestClassifier() # fit the model to data clf.fit(X,y) #make prediction on a test set preds = clf.predict_proba(X_te

在过去的几年中，我将sklearn用于机器学习建模，并逐渐习惯于一个看起来非常逻辑和内聚的框架：

from sklearn.ensemble import RandomForestClassifier

# define a model
clf = RandomForestClassifier()

# fit the model to data
clf.fit(X,y)

#make prediction on a test set
preds = clf.predict_proba(X_test)[:,1]

我现在正试图学习一些R，并想开始做一些和我在sklearn中做的一样的事情。从sklearn世界中，您注意到的第一件事是跨包的不同语法。这是可以理解的，但有点不方便。插入符号似乎是这个问题的一个很好的解决方案，它可以在所有不同的R包（如randomForest、gbm等）之间创建内聚。尽管我仍然对一些默认选择感到困惑（例如，train（）方法似乎默认为某种网格搜索）。此外，插入符号似乎在幕后使用plyr，这会弄乱一些dplyr方法，如Summary。因为我用dplyr做了很多数据处理，这是一个问题。

你能帮我弄清楚插入符号与sklearn的model/fit/predict\u proba的等价物是什么吗？另外，是否有办法处理plyr/dplyr问题？

在

插入符号库中进行预测的等效方法是更改？predict.train
中的类型。应将其更改为：
predict(model, data, type="prob")

如果要混合使用dplyr/plyr，那么使用以下命令显式调用它的最简单方法是：
dplyr::summarise

或
如果您已经尝试过使用predict（…，type=“prob”）
并出现了一个奇怪的错误，但您不理解并放弃了，我建议您阅读以下内容：
plyr::summarise