Python 关于插值函数的不确定性

Python 关于插值函数的不确定性,python,numpy,pandas,scipy,Python,Numpy,Pandas,Scipy,我正在使用pandas中的插值函数。下面是一个玩具示例,用于制作说明性案例: df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) df.iloc[1, 0] = np.nan print df print df.interpolate('nearest') 我的问题是:interpolate函数在多个列上工作吗?也就是说,它是否使用多元分析来确定缺失字段的值?或

我正在使用
pandas
中的插值函数。下面是一个玩具示例,用于制作说明性案例:

df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) 

df.iloc[1, 0] = np.nan

print df

print df.interpolate('nearest')
我的问题是:
interpolate
函数在多个列上工作吗?也就是说,它是否使用多元分析来确定缺失字段的值?或者它只是查看单个列吗?

参考了各种可用的方法-大多数只依赖于
索引
,可能通过单变量
scipy.interp1d
或其他单变量
scipy
方法:

方法:{‘线性’、‘时间’、‘索引’、‘值’、‘最近’、‘零’, '直线','二次','立方','重心','克罗','多项式', '样条曲线''分段多项式','pchip'}

  • “线性”:忽略索引并将值视为等距。这是多索引支持的唯一方法
  • 默认“时间”:插值对每日和更高分辨率的数据起作用,以插值给定长度的间隔“索引”,“值”:使用索引的实际数值
  • “最近”、“零”、“直线”、“二次”、“三次”、“重心”、“多项式”传递给scipy.interpolate.interp1d。“多项式”和“样条曲线”都要求您还指定顺序(int),例如df.interpolate(method='polymonery',order=4)。它们使用索引的实际数值
  • “krogh”、“分段多项式”、“样条曲线”和“pchip”都是类似名称的scipy插值方法的包装。它们使用索引的实际数值
说明输出的图表参考了各种可用的方法-大多数仅依赖于
索引,可能通过单变量
scipy.interp1d
或其他单变量
scipy
方法:

方法:{‘线性’、‘时间’、‘索引’、‘值’、‘最近’、‘零’, '直线','二次','立方','重心','克罗','多项式', '样条曲线''分段多项式','pchip'}

  • “线性”:忽略索引并将值视为等距。这是多索引支持的唯一方法
  • 默认“时间”:插值对每日和更高分辨率的数据起作用,以插值给定长度的间隔“索引”,“值”:使用索引的实际数值
  • “最近”、“零”、“直线”、“二次”、“三次”、“重心”、“多项式”传递给scipy.interpolate.interp1d。“多项式”和“样条曲线”都要求您还指定顺序(int),例如df.interpolate(method='polymonery',order=4)。它们使用索引的实际数值
  • “krogh”、“分段多项式”、“样条曲线”和“pchip”都是类似名称的scipy插值方法的包装。它们使用索引的实际数值

以及显示输出的图表

单个列(如果轴=1,则为行)。单个列(如果轴=1,则为行)。我看到了。但我不明白他们是在使用多元插补还是仅仅
interp1d
。我希望它能通过多元分析做到这一点。如果你看一下scipy文档,你会发现scipy函数采用一维参数,因此它们根据给定的
关键字`(
默认值=0
,因此使用单个列作为输入)。我看到了。但我不明白他们是在使用多元插补还是仅仅
interp1d
。我希望它能通过多元分析做到这一点。如果你看一下scipy文档,你会发现scipy函数采用一维参数,因此它们根据给定的
关键字`(
default=0
,因此使用单个列作为输入)使用单个列或行的值。