使用Python进行提取和分组_Python_Scripting

使用Python进行提取和分组

python scripting

使用Python进行提取和分组,python,scripting,Python,Scripting,下面是日志文件的一部分，它记录了一段时间内的各个请求。编写一个python程序，生成每个客户步行的总步数报告。我有一个日志文件，其中包含以下几行 01-01-2012 01:13:36 ygyfyeic vyeywq Customerid:1231 walked 245 steps 01-09-2013 01:18:34 gghjjhkl fyuftf Customerid:56789 walked 678 steps 01-09-2013 01:18:34 hugigygu hoiigy

下面是日志文件的一部分，它记录了一段时间内的各个请求。编写一个python程序，生成每个客户步行的总步数报告。我有一个日志文件，其中包含以下几行

01-01-2012 01:13:36 ygyfyeic  vyeywq Customerid:1231 walked 245 steps
01-09-2013 01:18:34 gghjjhkl  fyuftf Customerid:56789 walked 678 steps
01-09-2013 01:18:34 hugigygu  hoiigy Customerid:1231  walked 456 steps
01-09-2013 01:18:34  ghguh   kjhih    Customerid:1678 walked 600 steps

我能够在不同的列表中提取客户id和步骤数，但我无法创建一个报告，比如每个客户采取的步骤数

注意：日期保持更改，并且客户ID的数量不相同。

如果您已经将数据提取到两个单独的列表中，让我们调用它们

ID

和

步骤

。我们可以通过执行以下操作打印报告：

for i in range(len(ids)):
    print('Customer number %s took %s steps' % (ids[i], steps[i]))

您也可以使用，它将两个或多个列表放在一个元组列表中，其中包含每个元组的相应元素：

for cid, csteps in zip(ids, steps):
    print('Customer number %s took %s steps' % (cid, csteps))

如果您已经将数据提取到两个单独的列表中，让我们调用它们

ids

和

steps

。我们可以通过执行以下操作打印报告：

for i in range(len(ids)):
    print('Customer number %s took %s steps' % (ids[i], steps[i]))

您也可以使用，它将两个或多个列表放在一个元组列表中，其中包含每个元组的相应元素：

for cid, csteps in zip(ids, steps):
    print('Customer number %s took %s steps' % (cid, csteps))

使用熊猫和数据框

通过此我可以提取不同列表中的客户id和步骤编号我假设您在2个不同列表中有customerid和步骤

作为pd进口熊猫

cid = [1231,56789,1231,1678]
steps=[1,2,3,4]

df = pd.DataFrame({
    'cid': cid,
    'steps':steps
})

print(df.groupby(['cid']).sum())

o/p

参考：

使用熊猫和数据帧

通过此我可以提取不同列表中的客户id和步骤编号我假设您在2个不同列表中有customerid和步骤

作为pd进口熊猫

cid = [1231,56789,1231,1678]
steps=[1,2,3,4]

df = pd.DataFrame({
    'cid': cid,
    'steps':steps
})

print(df.groupby(['cid']).sum())

o/p

参考：答案解决了你的问题吗？答案解决了你的问题吗？