通过Kolmogorov的拟合优度;用R语言进行Smirnov检验

通过Kolmogorov的拟合优度;用R语言进行Smirnov检验,r,R,拟合优度检验允许我们检验变量的经验分布(此处为城市规模)是否遵循已知的理论分布(此处为帕累托分布) 该检验的无效假设是假设分布是可接受的,而替代假设是数据不遵循该分布 我想用R语言编程。我想做蒙特卡罗模拟来检查我的数据的拟合度,包括美国的城市规模 我这里的经验分布是美国城市规模的分布。我想测试我的数据是否符合帕累托分布。在上面给出的图像中,定义了用于计算P.值的所有函数。我知道有一个名为“dgof”的包,运行Kolmogorov-Smirnow测试的命令是ks.test(x,y,alternat

拟合优度检验允许我们检验变量的经验分布(此处为城市规模)是否遵循已知的理论分布(此处为帕累托分布)

该检验的无效假设是假设分布是可接受的,而替代假设是数据不遵循该分布

我想用R语言编程。我想做蒙特卡罗模拟来检查我的数据的拟合度,包括美国的城市规模

我这里的经验分布是美国城市规模的分布。我想测试我的数据是否符合帕累托分布。在上面给出的图像中,定义了用于计算P.值的所有函数。我知道有一个名为
“dgof”
的包,运行Kolmogorov-Smirnow测试的命令是
ks.test(x,y,alternative=c(“双面”、“更少”、“更大”)
,但我不知道如何将其应用于上述情况

data<-read.csv("C:/Users/Shah/Desktop/US data 452 cities 2000.csv") 
attach(data) 
y<-Population 
require(dgof) 
x<-rlnorm(100,5,1) 
ks.test(x, y,alternative = c("two.sided", "less", "greater"), 
   exact = NULL, tol=1e-8, simulate.p.value=TRUE, B=1000)

data首先,了解
ks.test()函数的工作原理

因此,假设您将数据加载到名为
data
data.frame
中,您希望对名为
population
的列执行KS测试,并且您希望测试您的数据是否符合帕累托分布。请注意,
精算师
包包含两个参数的帕累托分布。当然,您需要估计这些参数的值(我留给您)

现在,只需这样做:

library(actuar)
library(stats)
ks.test(data$population, 'ppareto', shape=yourShapeEstimate, scale=yourScaleEstimate)

一些评论:首先,我认为你的问题与StackOverflow无关,可能更适合StackOverflow。其次,在提问之前,你应该做一些研究;R是一个伟大的软件,但它需要一些艰苦的工作来使用它;我建议你找一个好的R教程(我个人的建议:)。第三:你可以在问之前用谷歌搜索一些答案。两个推荐读物:以及上述。。。谢谢你的回复。。我已经在stackflow上搜索过了。但是这个问题还没有在stackflow上讨论过。如果你能帮忙的话,请。这个问题似乎离题了,因为它是关于统计的,可能应该迁移到。此外,它没有显示出在提出问题之前努力寻找解决方案的证据。StackOverflow不是唯一的信息来源。。。特别是在R上,有很多其他地方可以找到解决方案,特别是如果你是新手的话。检查我在评论中提供的链接。此外,与统计学相关的问题可能更适合,并且可能已经有了一些答案。单样本Kolmogorov-Smirnov检验数据:数据$population D=0.8335,p值<2.2e-16替代假设:双侧我得到了以下结果。这表明这些数据不遵循帕累托分布,而在一篇研究文章中,他们使用了相同的数据并得出结论,这些数据遵循帕累托分布。所以我有点困惑,我这样做是正确的还是错误的。虽然我认为之前关于你的问题的一些评论有点苛刻,但关于结果的问题可能确实应该放在stats.stackexchange.com上。是的,答案是苛刻的,我认为,如果人们不想帮忙,那么他们就没有任何权利羞辱提出问题的人。我的帖子已经被转移到StATS.STACKExchange。com,但是我收到了同样的无用的评论。考虑使用替代的拟合优度测试…卡方检验也是一个很好的检验。并考虑到这一点:“对于该检验(KS)和Anderson-Darling检验[…]而言,只有当零假设完全指定了模型时,临界值才是正确的。当数据集用于估计零Hipothezid分布的参数[…]时,正确的临界值较小”(Klugman,S.“损失模型”)我建议你不要接受任何预期的结论:做完整的统计分析:做一个直方图,并将其与一些分布进行比较。读一些关于这个主题的文章。我向您推荐Stuart Klugman等人提出的上述“损失模型”。此外,请检查您的参数估计。我的回答可能有些苛刻,但这并不意味着我的回答是错的。如果你想解决一个问题(在统计学或任何其他领域),你需要努力工作。进行探索性分析,得出自己的结论。