Python 对具有相同日期的单元格求和_Python_Pandas

Python 对具有相同日期的单元格求和

python pandas

Python 对具有相同日期的单元格求和,python,pandas,Python,Pandas,我完全不懂Python和Jupiter笔记本之类的东西。我正在学习Python入门课程，并被分配了一项任务。这是为了从.csv文件中提取信息。下面是我的.csv文件名为“feeds1.csv”的快照我可以将.csv导入Jupyter笔记本，并尝试使用groupby函数对其进行排序。但由于专栏中也有时间，所以它不起作用 import pandas as pd df = pd.read_csv("feeds1.csv") 我需要它输出如下：最终的目标是用这些累积的数据创建一个csv文件，并

我完全不懂Python和Jupiter笔记本之类的东西。我正在学习Python入门课程，并被分配了一项任务。这是为了从.csv文件中提取信息。下面是我的.csv文件名为“feeds1.csv”的快照

我可以将.csv导入Jupyter笔记本，并尝试使用groupby函数对其进行排序。但由于专栏中也有时间，所以它不起作用

import pandas as pd
df = pd.read_csv("feeds1.csv")

我需要它输出如下：

最终的目标是用这些累积的数据创建一个csv文件，并使用它绘制图表，

首先，您需要正确解析日期：

df["date_string"] = df["created_at"].str.split(" ").str[0]
df["date_time"] = pd.to_datetime(df["date_string"])
# You can chose to drop earlier columns

# Now you just want to groupby with the date and apply the aggregation/function you want to 
df = df.groupby(["date_time"]).sum("field2").reset_index() # for example
df.to_csv("abc.csv", index=False)

如果您不需要一天中的时间，只需要日期，您可以简单地使用：

df.created_at = df.created_at.str.split(' ').str[0]  
dfout = df.groupby(['created_at']).count()
dfout.reset_index(level=0, inplace=True)
finaldf = dfout[['created_at', 'entry_id']]
finaldf.columns = ['Date', 'field2']
finaldf.to_csv('outputfile.csv', index=False)

第一行将在日期和时间之间的空格处拆分在列创建的

。.str[0]
表示只保留拆分的第一部分（即日期）。

第二行按日期对它们进行分组，并给出计数。

在写入csv时，如果您不想显示索引（如您的pic），请使用index=False
。如果您需要索引，那么只需删除该部分。
因此.csv是一个从服务器提取的文件，该服务器每分钟接收来自微控制器的ping，并将其记录下来。该值在field2列下输入。因此，我需要添加所有具有相同日期的field2值，并将这些数据导出到一个单独的文件中，其中所有field2值的总和就是该日期的总时间。然后我的答案是正确的。请使用它，向上投票并选择：）由于某种原因，它会得到一个错误：KeyError:“['created_at''date_string']未在axis中找到”KeyError:“['created_at''date_string']未在axis中找到”@NavitJammu修复了这个问题。现在尝试将同一日期（不包括时间）的所有field2值相加。但是如何将这两列导出到一个新文件中呢？在标题为“日期”的列和标题为“时间”的“字段2”列中创建_。谢谢你的帮助。从昨天开始，我一直在看教程，想弄明白这一点，并决定在这里问一下，作为最后的手段。再一次，很抱歉成为这样一个傻瓜。我调整了答案以解决您的最后一个问题。所以我尝试了一下，但我首先遇到一个错误，即名称“dfout”未定义。很抱歉，第2行已调整以更正该错误。如果一切顺利，请接受我的回答并投票。我是新来的，可以使用代表更正，似乎正在工作。非常感谢。你是救世主。