rpart中的Minbucket和weights
向革命党和政党专家提出几个问题 1) 我试图理解rpart和party中控制参数“minbucket”的区别。rpart中的minbucket未称重是否正确(即使提供了适合树的重量) 2) 有人能简要描述一下rpart算法中如何使用权重吗?我试图下载并查看源代码,但作为一名新手,我无法理解它的意义。rpart调用一个C函数(C_rpart),它似乎是rpart的主要部分,但我找不到更多关于它的信息rpart中的Minbucket和weights,r,rpart,R,Rpart,向革命党和政党专家提出几个问题 1) 我试图理解rpart和party中控制参数“minbucket”的区别。rpart中的minbucket未称重是否正确(即使提供了适合树的重量) 2) 有人能简要描述一下rpart算法中如何使用权重吗?我试图下载并查看源代码,但作为一名新手,我无法理解它的意义。rpart调用一个C函数(C_rpart),它似乎是rpart的主要部分,但我找不到更多关于它的信息 非常感谢。可以认为rpart(以及大多数其他机器学习算法)中的权重参数完全等同于多次复制这些训练项
非常感谢。可以认为rpart(以及大多数其他机器学习算法)中的权重参数完全等同于多次复制这些训练项目。权重为5等于将该行重复5次。如果您的数据集足够小,您可以使用一些简单的代码显式创建:
data[rep(1:nrow(data),times=data$weights),]
我的问题和原来的海报一样,但我认为这个答案不符合事实。我的数据的最小权重为500。当我将minbucket设置为500时,根本没有树,所以就重量而言,它无法工作。当我将其设置回8(接近默认值)时,我得到了一个合理的树。