Python 对具有相同日期的单元格求和

Python 对具有相同日期的单元格求和,python,pandas,Python,Pandas,我完全不懂Python和Jupiter笔记本之类的东西。我正在学习Python入门课程,并被分配了一项任务。这是为了从.csv文件中提取信息。下面是我的.csv文件名为“feeds1.csv”的快照 我可以将.csv导入Jupyter笔记本,并尝试使用groupby函数对其进行排序。但由于专栏中也有时间,所以它不起作用 import pandas as pd df = pd.read_csv("feeds1.csv") 我需要它输出如下: 最终的目标是用这些累积的数据创建一个csv文件,并

我完全不懂Python和Jupiter笔记本之类的东西。我正在学习Python入门课程,并被分配了一项任务。这是为了从.csv文件中提取信息。下面是我的.csv文件名为“feeds1.csv”的快照

我可以将.csv导入Jupyter笔记本,并尝试使用groupby函数对其进行排序。但由于专栏中也有时间,所以它不起作用

import pandas as pd
df = pd.read_csv("feeds1.csv")
我需要它输出如下:


最终的目标是用这些累积的数据创建一个csv文件,并使用它绘制图表,

首先,您需要正确解析日期:

df["date_string"] = df["created_at"].str.split(" ").str[0]
df["date_time"] = pd.to_datetime(df["date_string"])
# You can chose to drop earlier columns

# Now you just want to groupby with the date and apply the aggregation/function you want to 
df = df.groupby(["date_time"]).sum("field2").reset_index() # for example
df.to_csv("abc.csv", index=False)

如果您不需要一天中的时间,只需要日期,您可以简单地使用:

df.created_at = df.created_at.str.split(' ').str[0]  
dfout = df.groupby(['created_at']).count()
dfout.reset_index(level=0, inplace=True)
finaldf = dfout[['created_at', 'entry_id']]
finaldf.columns = ['Date', 'field2']
finaldf.to_csv('outputfile.csv', index=False)
第一行将在日期和时间之间的空格处拆分在列创建的
.str[0]
表示只保留拆分的第一部分(即日期)。
第二行按日期对它们进行分组,并给出计数。

在写入csv时,如果您不想显示索引(如您的pic),请使用
index=False
。如果您需要索引,那么只需删除该部分。

因此.csv是一个从服务器提取的文件,该服务器每分钟接收来自微控制器的ping,并将其记录下来。该值在field2列下输入。因此,我需要添加所有具有相同日期的field2值,并将这些数据导出到一个单独的文件中,其中所有field2值的总和就是该日期的总时间。然后我的答案是正确的。请使用它,向上投票并选择:)由于某种原因,它会得到一个错误:KeyError:“['created_at''date_string']未在axis中找到”KeyError:“['created_at''date_string']未在axis中找到”@NavitJammu修复了这个问题。现在尝试将同一日期(不包括时间)的所有field2值相加。但是如何将这两列导出到一个新文件中呢?在标题为“日期”的列和标题为“时间”的“字段2”列中创建_。谢谢你的帮助。从昨天开始,我一直在看教程,想弄明白这一点,并决定在这里问一下,作为最后的手段。再一次,很抱歉成为这样一个傻瓜。我调整了答案以解决您的最后一个问题。所以我尝试了一下,但我首先遇到一个错误,即名称“dfout”未定义。很抱歉,第2行已调整以更正该错误。如果一切顺利,请接受我的回答并投票。我是新来的,可以使用代表更正,似乎正在工作。非常感谢。你是救世主。