R中2个值的插值和预测

R中2个值的插值和预测,r,interpolation,R,Interpolation,我有一个从1980年到2020年的年度人口数据向量,只有2000年和2010年的两个值,我需要预测缺失的数据。 我的第一个想法是使用na.approx来填充2000年和2010年之间缺失的数据,然后使用ARIMA模型。然而,随着人口的下降,在遥远的未来,其价值将变为负值,这是不合逻辑的。 我的第二个想法是使用样本数据之间的对数差除以10,因为实际值之间有10年的差距,并使用它作为百分比变化来预测缺失数据。 然而,我对R和统计学还不熟悉,所以我不确定这是否是获得预测的最佳方法。如果您有任何想法,我

我有一个从1980年到2020年的年度人口数据向量,只有2000年和2010年的两个值,我需要预测缺失的数据。 我的第一个想法是使用na.approx来填充2000年和2010年之间缺失的数据,然后使用ARIMA模型。然而,随着人口的下降,在遥远的未来,其价值将变为负值,这是不合逻辑的。 我的第二个想法是使用样本数据之间的对数差除以10,因为实际值之间有10年的差距,并使用它作为百分比变化来预测缺失数据。
然而,我对R和统计学还不熟悉,所以我不确定这是否是获得预测的最佳方法。如果您有任何想法,我将不胜感激。

由于这两个数据点提供的数据线没有直观意义,我建议您仅使用这两个数据点的平均值,除非您可以获得其他数据。如果您能够获得更多的年度数据,甚至是预期的变化值,那么您可以进行一些额外的分析。但现在,你有点被卡住了。

这个问题似乎离题了,因为它是关于选择一种合适的统计方法;它不是关于编程或R的。这个问题更适合像这样的统计论坛。一旦你知道什么样的分析适合你的数据,但不确定如何在R中进行分析,那么在这里发布可能是有意义的。我有一个1980年到2020年的年度人口数据向量,只有2000年和2010年的两个值-所以你实际拥有的是两个数据点,而不是年度人口数据。我认为你将很难用如此稀少的数据做出合理的预测。无论如何,这是一个统计数据,而不是编程问题,可能更适合交叉验证。