Python Pyplot堆叠直方图-列中出现的数量

Python Pyplot堆叠直方图-列中出现的数量,python,pandas,matplotlib,histogram,stacked,Python,Pandas,Matplotlib,Histogram,Stacked,我试图在柱状图中显示从防火墙日志收集的数据表,这样文件中的每个日期都有一个条形图,并且在条形图中叠加了某一列中的发生次数 我在这里查看了几个示例,但它们似乎都是基于这样一个事实,即我知道特定列中有哪些值,而我在这里试图实现的是在不需要知道所有可能字段的情况下呈现直方图的方法 在本例中,我使用protocol作为列: #!/usr/bin/python import pandas as pd import numpy as np import glob import matplotlib.pyp

我试图在柱状图中显示从防火墙日志收集的数据表,这样文件中的每个日期都有一个条形图,并且在条形图中叠加了某一列中的发生次数

我在这里查看了几个示例,但它们似乎都是基于这样一个事实,即我知道特定列中有哪些值,而我在这里试图实现的是在不需要知道所有可能字段的情况下呈现直方图的方法

在本例中,我使用protocol作为列:

#!/usr/bin/python

import pandas as pd
import numpy as np
import glob
import matplotlib.pyplot as plt

csvs = glob.glob("*log-export.csv")
dfs = [pd.read_csv(csv, sep="\xff", engine="python") for csv in csvs]

df_merged = pd.concat(dfs).fillna("")

data = df_merged[['date', 'proto']]
np_data = np.array(data)

plt.hist(np_data, stacked=True)
plt.show()
但这显示了下图:

我想完成这样的事情:

如何实现这一点有什么建议吗?

设置
我必须补充数据,因为你没有提供任何数据

df = pd.DataFrame(dict(
    Date=pd.date_range(end=pd.to_datetime('now'), periods=100, freq='H'),
    Proto=np.random.choice('UDP TCP ICMP'.split(), 100, p=(.3, .5, .2))
))

解决方案
使用
pd.交叉表
然后打印

pd.crosstab(df.Date.dt.date, df.Proto).plot.bar(stacked=True)

您应该在每个日期(或相反方向)填写一个(协议)柱状图,然后像这样绘制它们。现在你用日期和协议填充一个柱状图,这没有意义。这正是我想要的-谢谢!