通过Kolmogorov的拟合优度；用R语言进行Smirnov检验_R

通过Kolmogorov的拟合优度；用R语言进行Smirnov检验

通过Kolmogorov的拟合优度；用R语言进行Smirnov检验,r,R,拟合优度检验允许我们检验变量的经验分布（此处为城市规模）是否遵循已知的理论分布（此处为帕累托分布）该检验的无效假设是假设分布是可接受的，而替代假设是数据不遵循该分布我想用R语言编程。我想做蒙特卡罗模拟来检查我的数据的拟合度，包括美国的城市规模我这里的经验分布是美国城市规模的分布。我想测试我的数据是否符合帕累托分布。在上面给出的图像中，定义了用于计算P.值的所有函数。我知道有一个名为“dgof”的包，运行Kolmogorov-Smirnow测试的命令是ks.test（x，y，alternat

拟合优度检验允许我们检验变量的经验分布（此处为城市规模）是否遵循已知的理论分布（此处为帕累托分布）

该检验的无效假设是假设分布是可接受的，而替代假设是数据不遵循该分布

我想用R语言编程。我想做蒙特卡罗模拟来检查我的数据的拟合度，包括美国的城市规模

我这里的经验分布是美国城市规模的分布。我想测试我的数据是否符合帕累托分布。在上面给出的图像中，定义了用于计算P.值的所有函数。我知道有一个名为

“dgof”

的包，运行Kolmogorov-Smirnow测试的命令是

ks.test（x，y，alternative=c（“双面”、“更少”、“更大”）

，但我不知道如何将其应用于上述情况

data<-read.csv("C:/Users/Shah/Desktop/US data 452 cities 2000.csv") 
attach(data) 
y<-Population 
require(dgof) 
x<-rlnorm(100,5,1) 
ks.test(x, y,alternative = c("two.sided", "less", "greater"), 
   exact = NULL, tol=1e-8, simulate.p.value=TRUE, B=1000)

data首先，了解ks.test（）函数的工作原理
因此，假设您将数据加载到名为data
的data.frame
中，您希望对名为population
的列执行KS测试，并且您希望测试您的数据是否符合帕累托分布。请注意，精算师
包包含两个参数的帕累托分布。当然，您需要估计这些参数的值（我留给您）
现在，只需这样做：
library(actuar)
library(stats)
ks.test(data$population, 'ppareto', shape=yourShapeEstimate, scale=yourScaleEstimate)

一些评论：首先，我认为你的问题与StackOverflow无关，可能更适合StackOverflow。其次，在提问之前，你应该做一些研究；R是一个伟大的软件，但它需要一些艰苦的工作来使用它；我建议你找一个好的R教程（我个人的建议：）。第三：你可以在问之前用谷歌搜索一些答案。两个推荐读物：以及上述。。。谢谢你的回复。。我已经在stackflow上搜索过了。但是这个问题还没有在stackflow上讨论过。如果你能帮忙的话，请。这个问题似乎离题了，因为它是关于统计的，可能应该迁移到。此外，它没有显示出在提出问题之前努力寻找解决方案的证据。StackOverflow不是唯一的信息来源。。。特别是在R上，有很多其他地方可以找到解决方案，特别是如果你是新手的话。检查我在评论中提供的链接。此外，与统计学相关的问题可能更适合，并且可能已经有了一些答案。单样本Kolmogorov-Smirnov检验数据：数据$population D=0.8335，p值<2.2e-16替代假设：双侧我得到了以下结果。这表明这些数据不遵循帕累托分布，而在一篇研究文章中，他们使用了相同的数据并得出结论，这些数据遵循帕累托分布。所以我有点困惑，我这样做是正确的还是错误的。虽然我认为之前关于你的问题的一些评论有点苛刻，但关于结果的问题可能确实应该放在stats.stackexchange.com上。是的，答案是苛刻的，我认为，如果人们不想帮忙，那么他们就没有任何权利羞辱提出问题的人。我的帖子已经被转移到StATS.STACKExchange。com，但是我收到了同样的无用的评论。考虑使用替代的拟合优度测试…卡方检验也是一个很好的检验。并考虑到这一点：“对于该检验（KS）和Anderson-Darling检验[…]而言，只有当零假设完全指定了模型时，临界值才是正确的。当数据集用于估计零Hipothezid分布的参数[…]时，正确的临界值较小”（Klugman，S.“损失模型”）我建议你不要接受任何预期的结论：做完整的统计分析：做一个直方图，并将其与一些分布进行比较。读一些关于这个主题的文章。我向您推荐Stuart Klugman等人提出的上述“损失模型”。此外，请检查您的参数估计。我的回答可能有些苛刻，但这并不意味着我的回答是错的。如果你想解决一个问题（在统计学或任何其他领域），你需要努力工作。进行探索性分析，得出自己的结论。