丢失数据警告R

丢失数据警告R,r,missing-data,R,Missing Data,我有一个气候值的数据框,比如温度最大值,温度最小值。。。在不同的地点。数据收集是一个时间序列数据,在某些特定的日子里没有数据注册。我想在考虑日期和位置的情况下进行插补(在数据框中放置变量) 我试图用amelia来估算那些缺失的值。但没有对警告信息进行插补 检查变量: head(df): PLACE, DATE, TEMP_MAX, TEMP_MIN, TEMP_AVG PLACE DATE TEMP_MAX TEMP_MIN TEMP_AVG F

我有一个气候值的数据框,比如温度最大值,温度最小值。。。在不同的地点。数据收集是一个时间序列数据,在某些特定的日子里没有数据注册。我想在考虑日期和位置的情况下进行插补(在数据框中放置变量)

我试图用
amelia
来估算那些缺失的值。但没有对警告信息进行插补

检查变量:

head(df): PLACE, DATE, TEMP_MAX, TEMP_MIN, TEMP_AVG

PLACE    DATE        TEMP_MAX      TEMP_MIN     TEMP_AVG
F      12/01/2007       19.7         2.5          10.1
F      13/01/2007       18.8         3.5          10.4
F      14/01/2007       17.3         2.4          10.4
F      15/01/2007       19.5         4.0          9.2
F      16/01/2007       
F      17/01/2007       21.5         2.8          9.7
F      18/01/2007       17.7         3.3          12.9
F      19/01/2007       18.3         3.8          9.7
A      16/01/2007       17.7         3.4          9.7
A      17/01/2007       
A      18/01/2007       19.7         6.2          10.4
A      19/01/2007       17.7         3.8          10.1
A      20/01/2007       18.6        3.8          12.9
这只是我的数据集的一些记录

DF = amelia(df, m=4, ts= c("DATE"), cs = c("PLACE")) 
其中日期是时间序列数据(2001年1月1日、2001年2月1日、2001年3月1日…),但如果按位置过滤,则时间序列不相等(不是相同的星号和结束时间)

我有3个问题:

  • 我不确定是否所有地方的时间序列数据都完整,我的意思是所有地方的开始和结束时间都相同

  • 我没有使用滞后或多时间参数,因此,我是否正确输入了时间序列影响?我不确定如何使用lag参数,尽管我已经检查了R包信息

  • 最后一个问题是,当我尝试使用该代码时,会出现警告 没有进行插补

  • 警告:数据中存在完全缺失的观测值。 这些观察结果在最终数据集中不会受到影响

    --插补1--

    引导示例中没有丢失的数据:不需要EM链

    --插补2--

    引导示例中没有丢失的数据:不需要EM链

    --插补3--

    引导示例中没有丢失的数据:不需要EM链

    --插补4--

    引导示例中没有丢失的数据:不需要EM链

    有人能帮我吗

    非常感谢您抽出时间

  • 对于软件来说,不同地点的开始和结束日期是否不同并不重要。我认为这更取决于你和你对数据的看法。我会问自己,如果这些数据丢失(随机丢失),那么我会在您的数据集中创建空行还是不创建

  • 您希望使用滞后,以便使用变量的过去值来改进缺失值的预测。它不是强制性的(即,即使没有这样的规范,函数也可以插补缺失的数据),但它是有用的


  • 我联系了软件包的作者,他告诉我需要指定splinetime或polytime参数,以确保Amelia将使用时间序列信息进行插补。例如,如果将polytime设置为3,它将基于立方时间进行插补。如果你这样做,我想你不应该再看到那个错误了

  • 对于软件来说,不同地点的开始和结束日期是否不同并不重要。我认为这更取决于你和你对数据的看法。我会问自己,如果这些数据丢失(随机丢失),那么我会在您的数据集中创建空行还是不创建

  • 您希望使用滞后,以便使用变量的过去值来改进缺失值的预测。它不是强制性的(即,即使没有这样的规范,函数也可以插补缺失的数据),但它是有用的


  • 我联系了软件包的作者,他告诉我需要指定splinetime或polytime参数,以确保Amelia将使用时间序列信息进行插补。例如,如果将polytime设置为3,它将基于立方时间进行插补。如果你这样做,我想你不应该再看到那个错误了


  • 请添加一些数据,因为这是不可复制的。还要确保指定您正在使用的所有包以及导致错误的代码行。在不知道你到底做了什么的情况下,很难帮助你。阿米莉亚在上周之前一直工作得很好。现在,我使用上周使用的相同代码收到了相同的消息错误。但我不知道发生了什么。我联系了软件包的作者。我会随时通知你。请添加一些你的数据,因为这是不可复制的。还要确保指定您正在使用的所有包以及导致错误的代码行。在不知道你到底做了什么的情况下,很难帮助你。阿米莉亚在上周之前一直工作得很好。现在,我使用上周使用的相同代码收到了相同的消息错误。但我不知道发生了什么。我联系了软件包的作者。我会随时通知你的。