Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/78.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/powershell/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用r识别给定数据的分布_R - Fatal编程技术网

如何使用r识别给定数据的分布

如何使用r识别给定数据的分布,r,R,我有以下数据,我需要确定数据的分布。请帮忙 x <- c(37.50,46.79,48.30,46.04,43.40,39.25,38.49,49.51,40.38,36.98,40.00,38.49,37.74,47.92,44.53,44.91,44.91,40.00,41.51,47.92,36.98,43.40) x首先,您可以绘制直方图并覆盖密度 hist(x, freq = FALSE) lines(density(x)) 然后,您会看到分布是双峰的,它可以是两个分布或

我有以下数据,我需要确定数据的分布。请帮忙

 x <-  c(37.50,46.79,48.30,46.04,43.40,39.25,38.49,49.51,40.38,36.98,40.00,38.49,37.74,47.92,44.53,44.91,44.91,40.00,41.51,47.92,36.98,43.40)

x首先,您可以绘制直方图并覆盖密度

hist(x, freq = FALSE)
lines(density(x))
然后,您会看到分布是双峰的,它可以是两个分布或任何其他分布的混合


一旦确定了候选分布,“qqplot”可以帮助您直观地比较分位数。

一种简洁的方法是使用提供分布拟合工具的
FitDistripPlus
软件包。以您的数据为例

library(fitdistrplus)
descdist(x, discrete = FALSE)

现在,您可以尝试适应不同的分布。例如:

normal_dist <- fitdist(x, "norm")



作为一般观点,我建议您看看交叉验证,在交叉验证中详细讨论了主题。您也可以阅读Delignette Muller和Dutang的论文-FitDistripPlus:拟合分布的R软件包,如果您对如何使用Cullen和Frey图的更详细解释感兴趣,可以使用。

请定义(在统计语言方面有严格要求)你所说的“确定数据的分布”是什么意思?你所说的“确定分布”是什么意思?你可以使用
hist(x)
查看其形状。关于“严格的证明”(实际上从来都不严格…),做假设检验…。这似乎更多的是一个统计数据而不是一个编程问题。请OP澄清您正在尝试做什么。我认为OP正在寻找一种工具,可以识别哪个已知分布最能描述数据。是否有一个功能/代码/包可以自动识别给定数据的分布?是否有其他方法可以自动识别分布?CV讨论的链接是这个答案非常重要。(+1)如何解释这个cullen和freygraph@VanathaiyanSCF图将给定分布的偏斜和峰度与指定分布进行比较。我建议你看看简历、帮助文件和链接文件中的链接讨论。用几句话概括/过于简化:*对于某些分布,如正态分布,偏度和峰度只有一个可能值,因此图上有一个点。对于其他分布,表示可能值的区域。这是非常简单的回答,你也应该考虑其他方法,但是CF图是一个很好的开始。
plot(normal_dist)