用Pythonic方法读取数据，为热图创建分数列表？_Python_Pandas_Dataframe_Plotly Dash

用Pythonic方法读取数据，为热图创建分数列表？

python pandas dataframe

用Pythonic方法读取数据，为热图创建分数列表？,python,pandas,dataframe,plotly-dash,Python,Pandas,Dataframe,Plotly Dash,我正试图找出一种方法，从熊猫df生成一个“z分数”，用于日历热图。它沿“x”轴显示一周中的哪一天，沿“y”轴显示几周。每个日期都有一个数值“z分数”，创建这个z分数是我遇到麻烦的地方 My df是从csv文件创建的，该文件列出了几个不同的任务，其中包含以下列和一些示例数据： Job,Tool,Start,End A,Hammer,2020-10-03,2020-11-02 A,Drill,2020-11-05,2020-12-02 A,Hammer,2020-12-03,2020-12-30

我正试图找出一种方法，从熊猫df生成一个“z分数”，用于日历热图

。它沿“x”轴显示一周中的哪一天，沿“y”轴显示几周。每个日期都有一个数值“z分数”，创建这个z分数是我遇到麻烦的地方

My df是从csv文件创建的，该文件列出了几个不同的任务，其中包含以下列和一些示例数据：

Job,Tool,Start,End
A,Hammer,2020-10-03,2020-11-02
A,Drill,2020-11-05,2020-12-02
A,Hammer,2020-12-03,2020-12-30

该数据适用于甘特图，但需要稍加修改以用于热图。我已经能够使用熊猫来生成重要的日期：

def calendarmap():
    d1 = min(dff['Start'])

    d2 = max(dff['End'])

    delta = d2 - d1

    dates_that_matter = [d1 + dt.timedelta(i) for i in range(delta.days+1)]

    etc

不管使用什么热图方法（sns、go.heatmap等），我都需要创建一个与所用工具（z分数）对应的列表

我想写一个简单的脚本：

重复我的重要约会

检查该日期是否在my df中每一行的开始日期或结束日期之间

如果日期出现在我的df中，它应该将z分数写入对应于每个唯一工具的列表中。有了这个示例数据，我会很高兴Hammer=0.5，Drill=1.0

如果日期不存在，则分配的z分数应为0。日期仍然存在，但它应该反映出那天没有工作

允许使用不同数量的工具。在此示例中，有3个z分数状态（0=无，0.5=锤击，1.0=钻孔），但z分数状态的数量可能在2到10之间波动

第2步和第5步是目前我面临的挑战。在此方面的任何帮助都将不胜感激。谢谢。

只回答数据创建问题。工艺流程：

从原始数据框的每一行创建一个从开始日期到结束日期的数据框，并将其添加到新数据框中。（创建垂直数据）

添加工作负载列

按日期合计工作量

添加缺少的日期。（dfs.reindex（））

为周、周中的天和月中的月添加列。这就完成了图形数据。顺便说一句，为了验证，我把它转换成了一种水平格式，其中有月和日列，就像日历一样