R 使用一组样本插值新值

R 使用一组样本插值新值,r,curve-fitting,linear-regression,R,Curve Fitting,Linear Regression,我是R新手。有一组样本和目标,我想拟合一个数值函数来解决新样本的目标。我的示例是以秒为单位的时间,表示用户在此停留的时间: >b <- c(101,25711,13451,19442,26,3083,133,184,4403,9713,6918,10056,12201,10624,14984,5241, +21619,44285,3262,2115,1822,11291,3243,12989,3607,12882,4462,11553,7596,2926,12955, +1832,3

我是R新手。有一组样本和目标,我想拟合一个数值函数来解决新样本的目标。我的示例是以秒为单位的时间,表示用户在此停留的时间:

>b <- c(101,25711,13451,19442,26,3083,133,184,4403,9713,6918,10056,12201,10624,14984,5241,
+21619,44285,3262,2115,1822,11291,3243,12989,3607,12882,4462,11553,7596,2926,12955,
+1832,3539,6897,13571,16668,813,1824,10304,2508,1493,4407,7820,507,15866,7442,7738,
+5705,2869,10137,11276,12884,11298,...)
b历史(c,xlim=c(0,13),prob=T,breaks=seq(0,24,by=0.5)) >线条(密度(x),颜色=红色)

我想拟合图上的红线,插入新的值,以找到这个位置上特定持续时间的概率,比如p(持续时间=1.5小时)


谢谢你的关注

如上所述,您可以使用
MASS
包中的
fitdistr
来拟合分布。 如果使用连续分布,则时间有可能在间隔内。如果使用离散分布,则可以计算某一时间的概率(以小时为单位)

对于连续情况,您可以使用伽马分布:
fitdistr(b,“Gamma”)
将为您提供参数估计值,然后您可以使用这些估计值和间隔

对于离散情况,可以使用泊松分布:
fitdisr(b,“泊松”)
,然后使用带有估计值和所需值的
dpois
函数


要决定使用哪一个,我只需要用直方图绘制pdf并看一看。

尝试
MASS:fitdire
optim
,如果你知道分布的似然函数……注意单个点的概率密度为零,你必须定义一个区域,即
p(持续时间<1.6,持续时间>1.4)
。为什么不使用密度
呢。。类似于
dd的东西我认为我们在这里应该更加小心。。。为什么选择伽马分布?他的密度可以是任何东西。如果没有进一步的知识,我建议使用非参数密度估计器,使用核函数或者仅仅是直方图。是的。我只是通过看他提供的直方图说gamma。当然,这是值得考虑的,但我想由他来决定什么是足够正确的。
> b <- b/3600
> hist(c,xlim=c(0,13),prob=T,breaks=seq(0,24,by=0.5))
> lines(density(x), col=red)