R中按间隔组织的数据的连续分布_R_Intervals_Cut_Probability Density

R中按间隔组织的数据的连续分布

R中按间隔组织的数据的连续分布,r,intervals,cut,probability-density,R,Intervals,Cut,Probability Density,我有以下问题。我的数据集如下： Income Numerosity from 6000 to 7500 704790 from 7500 to 10000 1294784 from 10000 to 12000 1051902 from 12000 to 15000 1585132 from 15000 to 20000 704012 from 20000 to 25000 206901 from 25000 to 300

我有以下问题。我的数据集如下：

Income              Numerosity
from 6000 to 7500       704790
from 7500 to 10000     1294784
from 10000 to 12000    1051902
from 12000 to 15000    1585132
from 15000 to 20000     704012
from 20000 to 25000     206901
from 25000 to 30000     156661

我想用连续密度函数来近似这些数据。

在R中有没有一种简单的方法可以做到这一点？关于函数“cut”所做的事情，我想到了一个类似“逆”的过程。

我是这样解决的：首先，我对每一行使用

sample（6000:7500，704790，replace=TRUE）

来创建生成的观测向量。然后，我将函数

density

应用于向量，得到了我要寻找的密度函数。当然有更好、更优雅的方法，但这是可行的。

@Arun难道他不能拟合一个模型并从中插值吗？仅供参考，这种类型的数据称为“区间删失”——这可能有助于你寻找现有的方法。你的最终目标是什么？你想用得到的连续密度（假设你能得到）做什么？这个问题似乎离题了，因为它涉及到对统计学的理解。（OP：“谢谢。但我如何才能拟合模型？”）见下面我自己的答案：我试图理解的是如何使用R从上述形式的数据中获得密度。我找到了一个可能的解决方案，尽管可能有更好的方法。我绝对不想用参数分布来拟合数据。请注意，这种方法假设数据在每个区间内均匀分布。如果这是你想要的，这就可以了。数据是不统一的。但是，我没有关于每个时间间隔内数据分布的信息。欢迎就如何做出更合理的假设和改善我的健康状况提出任何建议。