Python 熊猫连续数据的计数图
我想做一个二元变量与连续变量的计数图,这样它就应该被相应地装箱。目前我可以做:Python 熊猫连续数据的计数图,python,pandas,count,Python,Pandas,Count,我想做一个二元变量与连续变量的计数图,这样它就应该被相应地装箱。目前我可以做: import matplotlib.pyplot as plt import numpy as np import pandas as pd ( pd.DataFrame({ "ind": np.random.random(100) > 0.5, "value": np.random.random(100), })
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
(
pd.DataFrame({
"ind": np.random.random(100) > 0.5,
"value": np.random.random(100),
})
.assign(cut=lambda df: pd.cut(df.value, bins=10, labels=False))
.groupby("cut")
.agg({"ind": sum})
.plot.bar()
)
plt.show()
但我对实施情况不满意,因为:
- 它需要创建一个仅用于打印的变量
- 它在图形中放置了错误的记号和标签
我想绘制实际数据,并有一个包含真实相关信息的x轴。如果您的
ind
是布尔值,并且您想按照问题标题中的建议计算true
值,您可以使用hist
:
(
pd.DataFrame({
"ind": np.random.random(100) > 0.5,
"value": np.random.random(100),
})
.query('ind>0')
.hist('value', bins=10, edgecolor='w', grid=False)
)
输出:
删除
labels=False
后,x轴将显示真实的相关信息,是否有任何绘图操作可以自己执行剪切+分组?是否ind
始终True/False
(或1/0
)?