Python 熊猫中不同列的不同填充方法
我正在以标准方式重新为数据帧编制索引,即Python 熊猫中不同列的不同填充方法,python,pandas,Python,Pandas,我正在以标准方式重新为数据帧编制索引,即 df.reindex(newIndex,method='ffill') 但我意识到我需要在每列的基础上以不同的方式处理丢失的数据。也就是说,对于某些列,我希望填充,但对于其他列,我希望缺少记录为NAs的值 为了简单起见,假设我有一列X,我想填充它,还有一列Y,我想填充NA。如何调用.reindex来完成此操作 您可以先调用reindex(),然后调用ffill()以获取列: import pandas as pd df = pd.DataFrame({
df.reindex(newIndex,method='ffill')
但我意识到我需要在每列的基础上以不同的方式处理丢失的数据。也就是说,对于某些列,我希望填充,但对于其他列,我希望缺少记录为NAs的值
为了简单起见,假设我有一列X,我想填充它,还有一列Y,我想填充NA。如何调用.reindex来完成此操作 您可以先调用reindex()
,然后调用ffill()
以获取列:
import pandas as pd
df = pd.DataFrame({"A":[10, 20, 30], "B":[100, 200, 300],
"C":[100, 200, 300]}, index=[2, 6, 8])
df2 = df.reindex([2,4,6,8,10])
for col in ["A", "B"]:
df2[col].ffill(inplace=True)
print df2
输出:
A B C
2 10 100 100
4 10 100 NaN
6 20 200 200
8 30 300 300
10 30 300 NaN
你不能叫它两次吗?使用
columns=[Y]
argument和columns=[X]
argument?@jaor你的意思是做两个单独的索引,然后合并两个结果数据帧?我猜。参数列
仅影响指定的列。我想都在这里了,reindex
,然后根据需要对各个列进行fillna