Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/317.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 基于lengt函数从df内的数组中检索值_Python_Pandas - Fatal编程技术网

Python 基于lengt函数从df内的数组中检索值

Python 基于lengt函数从df内的数组中检索值,python,pandas,Python,Pandas,如何从数据帧中的数组中检索前n个值 其中n是同一数组的长度-1:(len[array]-1) 为了阐明我的目标,我从jupyter笔记本上获得了到目前为止的代码: import numpy as np import pandas as pd #load csv into pandas data frame df1 = pd.read_csv(r"accounts.csv") #define the range for clarity xi = 60 xn = 70 df1['splt_acc']

如何从数据帧中的数组中检索前n个值

其中n是同一数组的长度-1:(len[array]-1)

为了阐明我的目标,我从jupyter笔记本上获得了到目前为止的代码:

import numpy as np
import pandas as pd
#load csv into pandas data frame
df1 = pd.read_csv(r"accounts.csv")
#define the range for clarity
xi = 60
xn = 70
df1['splt_acc'] = df1.Account.str.split('.')
df1['len'] = df1.splt_acc.apply(lambda x: len(x)-1).astype(int)
df1['parent'] = df1.splt_acc.str.join('.')
pd.DataFrame(df1)[xi:xn]
显示以下内容

    Account Rubriek       splt_acc  len parent
60  9.5     Inkoop        [9, 5]    1   9.5
61  9.6     Overige res.. [9, 6]    1   9.6
62  9.7     Buitengewon.. [9, 7]    1   9.7
63  9.8     Incidentele.. [9, 8]    1   9.8
64  9.9     Vennootschap. [9, 9]    1   9.9
65  0.0.0   Terreinen     [0, 0, 0] 2   0.0.0
66  0.0.1   Gebouwen      [0, 0, 1] 2   0.0.1
67  0.0.2   Verbouwingen  [0, 0, 2] 2   0.0.2
68  0.0.3   Machines      [0, 0, 3] 2   0.0.3
69  0.0.4   Gereedschappen[0, 0, 4] 2   0.0.4
接下来我想要的是:

df1['y'] = df1.splt_acc.apply(lambda splt_acc: splt_acc[0:df1.len])
pd.DataFrame(df1)[xi:xn]
这将导致以下错误:切片索引必须是整数或无,或具有索引方法

使用更简单的方法,我可以得到每行的结果,在本例中是第60行:

account = df1['Account'][60]
x = account.split('.')

if len(x) - 1 == 0:
    y = 'null'
else:
    y = x[0:(len(x)-1)]

print(y)
['9']

九,


但问题是,如何在数据帧中获得相同的结果?

您要做的是

df1['y'] = df1.splt_acc.apply(lambda x: x[:-1])
这意味着您要获取从0到最后第二个值的所有值。 比如说,

a = [5,3,6,4]
然后,
a[:-1]返回[5,3,6]

而且,你可以在一开始就这样做

df1['y'] = df1.Account.str.split('.')[:-1]

第一个n值,其中n始终是数组的长度?i、 e,除了最后一个以外的所有值?正确!我要检索除该数组的最后一个值之外的所有值。目标是基于帐户值创建父帐户。所以在第68行,account=0.0.4,parent应该是0.0。这是非常紧凑的!谢谢有一个)失踪的btwThanks。我添加了额外的右括号。
df1['y'] = df1.Account.str.split('.')[:-1]
df1 = pd.DataFrame({'Account': ['9', '9.5', '9.6', '9.7', '9.8', '9.9', '0.0.0', '0.0.1', '0.0.2', '0.0.3', '0.0.4']})

df1.assign(
    parent=df1['Account'].str.split('.').apply(lambda x: '.'.join(x[:-1]) or 'null'))
>>> df1
   Account parent
0        9   null
1      9.5      9
2      9.6      9
3      9.7      9
4      9.8      9
5      9.9      9
6    0.0.0    0.0
7    0.0.1    0.0
8    0.0.2    0.0
9    0.0.3    0.0
10   0.0.4    0.0