如何使用python/pandas中的seaborn为基于两部分文本的图形数据绘制频率分布
我有一个70k行的数据帧,看起来像这样:如何使用python/pandas中的seaborn为基于两部分文本的图形数据绘制频率分布,python,python-3.x,pandas,matplotlib,seaborn,Python,Python 3.x,Pandas,Matplotlib,Seaborn,我有一个70k行的数据帧,看起来像这样: mirna gene_id osa-miR2873a Os01g0100100 osa-miR169d Os01g0100100 osa-miR169a Os01g0100100 osa-miR396a-3p Os01g0100200 osa-miR396b-3p Os01g0100200 ... ... 我正在使用matplotlib和seaborn绘制数据。 &我已经使用value\u counts()函数计算
mirna gene_id
osa-miR2873a Os01g0100100
osa-miR169d Os01g0100100
osa-miR169a Os01g0100100
osa-miR396a-3p Os01g0100200
osa-miR396b-3p Os01g0100200
... ...
我正在使用matplotlib和seaborn绘制数据。
&我已经使用value\u counts()
函数计算了频率
我需要绘制一个图表来显示“mirna”出现频率的特定范围在数据集中出现的次数。例如,有多少“mirna”有1-5对mirna-gene_id对,或5-15对,或15-30对等等
因此,从本质上讲,绘图应该显示(1-5)对出现x次,(5-15)对出现y次等等。如果我能按排序顺序绘制值,那就更好了。我尝试过sns.distplot(),但它对我不起作用
有什么线索吗?谢谢。你可以根据mirna进行分组,并根据基因id计数进行总结。然后你可以做一个柱状图