Python 关于插值函数的不确定性_Python_Numpy_Pandas_Scipy

Python 关于插值函数的不确定性

python numpy pandas

Python 关于插值函数的不确定性,python,numpy,pandas,scipy,Python,Numpy,Pandas,Scipy,我正在使用pandas中的插值函数。下面是一个玩具示例，用于制作说明性案例： df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) df.iloc[1, 0] = np.nan print df print df.interpolate('nearest') 我的问题是：interpolate函数在多个列上工作吗？也就是说，它是否使用多元分析来确定缺失字段的值？或

我正在使用

pandas

中的插值函数。下面是一个玩具示例，用于制作说明性案例：

df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) 

df.iloc[1, 0] = np.nan

print df

print df.interpolate('nearest')

我的问题是：

interpolate

函数在多个列上工作吗？也就是说，它是否使用多元分析来确定缺失字段的值？或者它只是查看单个列吗？

参考了各种可用的方法-大多数只依赖于

索引

，可能通过单变量

scipy.interp1d

或其他单变量

scipy

方法：

方法：{‘线性’、‘时间’、‘索引’、‘值’、‘最近’、‘零’， '直线'，'二次'，'立方'，'重心'，'克罗'，'多项式'， '样条曲线''分段多项式'，'pchip'}

“线性”：忽略索引并将值视为等距。这是多索引支持的唯一方法
默认“时间”：插值对每日和更高分辨率的数据起作用，以插值给定长度的间隔“索引”，“值”：使用索引的实际数值
“最近”、“零”、“直线”、“二次”、“三次”、“重心”、“多项式”传递给scipy.interpolate.interp1d。“多项式”和“样条曲线”都要求您还指定顺序（int），例如df.interpolate（method='polymonery'，order=4）。它们使用索引的实际数值
“krogh”、“分段多项式”、“样条曲线”和“pchip”都是类似名称的scipy插值方法的包装。它们使用索引的实际数值

说明输出的图表参考了各种可用的方法-大多数仅依赖于

索引，可能通过单变量scipy.interp1d
或其他单变量scipy
方法：
方法：{‘线性’、‘时间’、‘索引’、‘值’、‘最近’、‘零’，
'直线'，'二次'，'立方'，'重心'，'克罗'，'多项式'，
'样条曲线''分段多项式'，'pchip'}

“线性”：忽略索引并将值视为等距。这是多索引支持的唯一方法
默认“时间”：插值对每日和更高分辨率的数据起作用，以插值给定长度的间隔“索引”，“值”：使用索引的实际数值
“最近”、“零”、“直线”、“二次”、“三次”、“重心”、“多项式”传递给scipy.interpolate.interp1d。“多项式”和“样条曲线”都要求您还指定顺序（int），例如df.interpolate（method='polymonery'，order=4）。它们使用索引的实际数值
“krogh”、“分段多项式”、“样条曲线”和“pchip”都是类似名称的scipy插值方法的包装。它们使用索引的实际数值

以及显示输出的图表
单个列（如果轴=1，则为行）。单个列（如果轴=1，则为行）。我看到了。但我不明白他们是在使用多元插补还是仅仅interp1d
。我希望它能通过多元分析做到这一点。如果你看一下scipy文档，你会发现scipy函数采用一维参数，因此它们根据给定的轴关键字`（默认值=0
，因此使用单个列作为输入）。我看到了。但我不明白他们是在使用多元插补还是仅仅interp1d
。我希望它能通过多元分析做到这一点。如果你看一下scipy文档，你会发现scipy函数采用一维参数，因此它们根据给定的轴关键字`（default=0
，因此使用单个列作为输入）使用单个列或行的值。