Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/url/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
rpart中的Minbucket和weights_R_Rpart - Fatal编程技术网

rpart中的Minbucket和weights

rpart中的Minbucket和weights,r,rpart,R,Rpart,向革命党和政党专家提出几个问题 1) 我试图理解rpart和party中控制参数“minbucket”的区别。rpart中的minbucket未称重是否正确(即使提供了适合树的重量) 2) 有人能简要描述一下rpart算法中如何使用权重吗?我试图下载并查看源代码,但作为一名新手,我无法理解它的意义。rpart调用一个C函数(C_rpart),它似乎是rpart的主要部分,但我找不到更多关于它的信息 非常感谢。可以认为rpart(以及大多数其他机器学习算法)中的权重参数完全等同于多次复制这些训练项

向革命党和政党专家提出几个问题

1) 我试图理解rpart和party中控制参数“minbucket”的区别。rpart中的minbucket未称重是否正确(即使提供了适合树的重量)

2) 有人能简要描述一下rpart算法中如何使用权重吗?我试图下载并查看源代码,但作为一名新手,我无法理解它的意义。rpart调用一个C函数(C_rpart),它似乎是rpart的主要部分,但我找不到更多关于它的信息


非常感谢。

可以认为rpart(以及大多数其他机器学习算法)中的权重参数完全等同于多次复制这些训练项目。权重为5等于将该行重复5次。如果您的数据集足够小,您可以使用一些简单的代码显式创建:

data[rep(1:nrow(data),times=data$weights),] 

我的问题和原来的海报一样,但我认为这个答案不符合事实。我的数据的最小权重为500。当我将minbucket设置为500时,根本没有树,所以就重量而言,它无法工作。当我将其设置回8(接近默认值)时,我得到了一个合理的树。