使用Python进行提取和分组

使用Python进行提取和分组,python,scripting,Python,Scripting,下面是日志文件的一部分,它记录了一段时间内的各个请求。编写一个python程序,生成每个客户步行的总步数报告。我有一个日志文件,其中包含以下几行 01-01-2012 01:13:36 ygyfyeic vyeywq Customerid:1231 walked 245 steps 01-09-2013 01:18:34 gghjjhkl fyuftf Customerid:56789 walked 678 steps 01-09-2013 01:18:34 hugigygu hoiigy

下面是日志文件的一部分,它记录了一段时间内的各个请求。编写一个python程序,生成每个客户步行的总步数报告。我有一个日志文件,其中包含以下几行

01-01-2012 01:13:36 ygyfyeic  vyeywq Customerid:1231 walked 245 steps
01-09-2013 01:18:34 gghjjhkl  fyuftf Customerid:56789 walked 678 steps
01-09-2013 01:18:34 hugigygu  hoiigy Customerid:1231  walked 456 steps
01-09-2013 01:18:34  ghguh   kjhih    Customerid:1678 walked 600 steps
我能够在不同的列表中提取客户id和步骤数,但我无法创建一个报告,比如每个客户采取的步骤数


注意:日期保持更改,并且客户ID的数量不相同。

如果您已经将数据提取到两个单独的列表中,让我们调用它们
ID
步骤
。我们可以通过执行以下操作打印报告:

for i in range(len(ids)):
    print('Customer number %s took %s steps' % (ids[i], steps[i]))
您也可以使用,它将两个或多个列表放在一个元组列表中,其中包含每个元组的相应元素:

for cid, csteps in zip(ids, steps):
    print('Customer number %s took %s steps' % (cid, csteps))

如果您已经将数据提取到两个单独的列表中,让我们调用它们
ids
steps
。我们可以通过执行以下操作打印报告:

for i in range(len(ids)):
    print('Customer number %s took %s steps' % (ids[i], steps[i]))
您也可以使用,它将两个或多个列表放在一个元组列表中,其中包含每个元组的相应元素:

for cid, csteps in zip(ids, steps):
    print('Customer number %s took %s steps' % (cid, csteps))

使用熊猫和数据框

通过此我可以提取不同列表中的客户id和步骤编号我假设您在2个不同列表中有customerid和步骤

作为pd进口熊猫

cid = [1231,56789,1231,1678]
steps=[1,2,3,4]

df = pd.DataFrame({
    'cid': cid,
    'steps':steps
})

print(df.groupby(['cid']).sum())
o/p


参考:

使用熊猫和数据帧

通过此我可以提取不同列表中的客户id和步骤编号我假设您在2个不同列表中有customerid和步骤

作为pd进口熊猫

cid = [1231,56789,1231,1678]
steps=[1,2,3,4]

df = pd.DataFrame({
    'cid': cid,
    'steps':steps
})

print(df.groupby(['cid']).sum())
o/p


参考:答案解决了你的问题吗?答案解决了你的问题吗?