Python 熊猫基础设施数据统计图与每个用户的日期

Python 熊猫基础设施数据统计图与每个用户的日期,python,pandas,matplotlib,Python,Pandas,Matplotlib,我试图用熊猫来展示一些基础设施使用情况的每日统计数据,但我是一个初学者,经过数小时的研究,我还是搞不懂 以下是我的每列数据类型: 名称对象UserService对象 ItemSize int64 ItemScont int64 提取日期日期时间64[ns] 每天,我都会为每个用户进行一次新的提取,因此我可能需要在绘图之前使用group_by 数据样本: Name UserService ItemSize ItemsCount ExtractionDate 1 xyzf

我试图用熊猫来展示一些基础设施使用情况的每日统计数据,但我是一个初学者,经过数小时的研究,我还是搞不懂

以下是我的每列数据类型:

名称对象UserService对象 ItemSize int64 ItemScont int64 提取日期日期时间64[ns]

每天,我都会为每个用户进行一次新的提取,因此我可能需要在绘图之前使用group_by

数据样本:

          Name UserService  ItemSize  ItemsCount ExtractionDate
1   xyzf_s        xyfz        40           1     2018-12-12
2    xyzf1        xyzf        53           5     2018-12-12
3    xyzf2        xyzf        71           4     2018-12-12
4    xyzf3        xyzf        91           3     2018-12-12
14   vo12         vo          41           5     2018-12-12
我试图显示的图形之一如下所示:

x轴应为提取日期 y轴应该是项目计数(它被1000除以,所以它被1到100的数千个项目所除) 图表上的每一行都应该代表一个用户的发展(为了查看数据峰值),我想我必须显示前10或前50位,因为很难有一个1500个用户的图表


我还对利用这些数据寻找数据增长和数据消耗异常的任何其他方式感兴趣

假设用户显示在名称列中,并且每个用户每天只有一行,要获得明确要求的绘图,可以使用以下代码:

 # Limit to 10 users
 users_to_plot = df.Name.unique()[:10]
 for u in users_to_plot:
      mask = (df['Name'] == u)
      values = df[mask]
      plt.plot('ExtractionDate','ItemsCount',data=values.sort_values('ExtractionDate'))

查看数据并思考您试图提取的信息以及这些信息是什么样子是很重要的。这可能值得先和一些人探讨一下,了解一下你想要识别的东西是什么。想想是什么让它独一无二,如果你能让它出现在一张图表上

我假设名称显示用户是谁。用户是否有重复的行项目?例如,用户vo12可以有多行具有相同提取日期吗?刚才看到这个评论,没有,每个用户和每个日期只有一行。这是从Powershell脚本中自动检索的每日数据。哇,太快了,感谢您的帮助,非常感谢。我的代码有以下错误:ValueError:由于参数的模糊性,不支持对数据使用任意长参数。改为使用多个打印调用。你的假设是正确的,每个用户每天一行。现在试试,我想我有一个打字错误。刚刚试过,似乎你已经纠正了你的打字错误。但结果有点奇怪,可能是因为我的数据。不幸的是,我目前无法上传工作中的照片。Axe Y的范围从0到140,看起来不错,但日期范围从1680到2000。下周我将根据您的建议进行一些测试,本周末我将无法访问我的开发环境。我还假设数据已排序。我的数据存储在一个CSV中,我用DF检索它们,就像我通常想的那样。我不明白你最后的评论?我清理了数据帧,用ItemCount除以1000替换了一些值,并将其转换为一个int,与ItemSize相同,但乘以10,我还删除了一些无用的列。结果就是我提供的样本。在图表中,日期范围是从1680年到2000年,在我的DF中,我有过去3周的datetime格式的每日数据。图中的直线看起来像一条从1680开始的直线,在2000年直线上升90°,我也不明白这一点。