Python 熊猫数据帧上最干净的迭代/功能应用程序，不考虑长度_Python_Pandas_Apply

Python 熊猫数据帧上最干净的迭代/功能应用程序，不考虑长度

python pandas

Python 熊猫数据帧上最干净的迭代/功能应用程序，不考虑长度,python,pandas,apply,Python,Pandas,Apply,我一直在努力对可变长度的数据帧进行干净的迭代或应用函数。具体来说，长度为1的数据帧片（熊猫系列）一个简单的例子，一个数据帧和一个作用于它的每一行的函数。数据帧的格式是已知的/预期的 def stringify(row): return "-".join([row["y"], str(row["x"]), str(row["z"])]) df = pd.DataFrame(dict(x=[1,2,3],y=["foo","bar","bro"],z=[-99,1.04,213])) O

我一直在努力对可变长度的数据帧进行干净的迭代或应用函数。具体来说，长度为1的数据帧片（熊猫系列）

一个简单的例子，一个数据帧和一个作用于它的每一行的函数。数据帧的格式是已知的/预期的

def stringify(row):
    return "-".join([row["y"], str(row["x"]), str(row["z"])])

df = pd.DataFrame(dict(x=[1,2,3],y=["foo","bar","bro"],z=[-99,1.04,213]))
Out[600]:
   x    y       z
0  1  foo  -99.00
1  2  bar    1.04
2  3  bro  213.00

df_slice = df.iloc[0]   # This is a Series

通常，您可以通过以下方式之一应用该功能：

stringy = df.apply(stringify,axis=1)
# or 
stringy = [stringify(row) for _,row in df.iterrows()]

Out[611]: ['foo-1--99.0', 'bar-2-1.04', 'bro-3-213.0']

## Error with same syntax if Series
stringy = df_slice.apply(stringify, axis=1)

如果数据帧为空，或者只有一个条目，则这些方法不再工作。序列没有

iterrows（）

方法，并且

apply

将函数应用于每个列（而不是行）

是否有更干净的内置方法来迭代/应用函数到可变长度的数据帧？否则，您必须不断编写繁琐的逻辑

if type(df) is pd.DataFrame:
    if len(df) == 0:
        return None
    else:
        return df.apply(stringify, axis=1)
elif type(df) is pd.Series:
    return stringify(df)

我意识到有一些方法可以确保形成长度为1的数据帧，但我要求的是一种干净的方法，可以像格式化的数据帧或序列一样应用/迭代各种数据结构

没有通用的方法来编写一个似乎可以同时处理这两个问题的函数数据帧和系列。您可能需要使用

if语句来检查
对于类型，或使用try..except
处理异常
我认为在调用apply
之前，最好确保创建了正确类型的对象，而不是执行这两种操作。例如，使用df.iloc[：1]
选择长度为1的数据帧，而不是使用返回序列的df.iloc[0]
。只要将一个切片范围而不是单个值传递给df.iloc
，就会返回一个数据帧
In [155]: df.iloc[0]
Out[155]: 
x      1
y    foo
z    -99
Name: 0, dtype: object

In [156]: df.iloc[:1]
Out[156]: 
   x    y   z
0  1  foo -99

你可以用try/except语句来包装东西。。。您应该知道，长度为1的数据帧和系列数据帧之间存在差异。您希望看到一行数据帧的系列文章是如何结束的？[dinkelk]尝试例外是可以的，但它们对代码来说同样杂乱无章。[exp1orer]没错，这是有区别的。当您获取数据帧的子集：df.iloc[0]
时，这会给您一个series@EdChum：谢谢你指出这一点。我做了一个小编辑，s/need to if/need to use/
，然后在不检查结果的情况下退出浏览器。显然，这可能导致重复的职位。有一个问题。