Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/292.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何将单独的数据帧绘制为子图?_Python_Matplotlib_Pandas - Fatal编程技术网

Python 如何将单独的数据帧绘制为子图?

Python 如何将单独的数据帧绘制为子图?,python,matplotlib,pandas,Python,Matplotlib,Pandas,我有几个数据帧共享相同的值范围,但有不同的列和索引。调用df.plot()时,我会得到单独的绘图图像。我真正想要的是把它们都作为子情节放在同一个情节中,但不幸的是,我没能想出一个解决方案,我非常感谢你的帮助 您可以使用matplotlib手动创建子地块,然后使用ax关键字在特定子地块上绘制数据帧。例如,对于4个子批次(2x2): 这里的axes是一个数组,它包含不同的子批次轴,您可以通过索引axes 如果您想要共享x轴,那么您可以向plt.subplot提供sharex=True,您可以看到e.

我有几个数据帧共享相同的值范围,但有不同的列和索引。调用
df.plot()
时,我会得到单独的绘图图像。我真正想要的是把它们都作为子情节放在同一个情节中,但不幸的是,我没能想出一个解决方案,我非常感谢你的帮助

您可以使用matplotlib手动创建子地块,然后使用
ax
关键字在特定子地块上绘制数据帧。例如,对于4个子批次(2x2):

这里的
axes
是一个数组,它包含不同的子批次轴,您可以通过索引
axes

如果您想要共享x轴,那么您可以向
plt.subplot
提供
sharex=True
,您可以看到e.gs。答案是这样的。同样从文档中,您还可以在pandas
plot
函数中设置
subplot=True
layout=(,)

df.plot(subplots=True, layout=(1,2))

您还可以使用
图add_subplot()
,它获取子地块网格参数,如221、222、223、224等,如本文所述。pandas数据框上的绘图示例(包括子绘图)可以在中看到。

您可以使用熟悉的Matplotlib样式调用
图和
子绘图
,但只需使用
plt.gca()
指定当前轴即可。例如:

plt.figure(1)
plt.subplot(2,2,1)
df.A.plot() #no need to specify for first axis
plt.subplot(2,2,2)
df.B.plot(ax=plt.gca())
plt.subplot(2,2,3)
df.C.plot(ax=plt.gca())

等等。

基于上面的@joris响应,如果您已经建立了子地块的引用,您也可以使用该引用。比如说,

ax1 = plt.subplot2grid((50,100), (0, 0), colspan=20, rowspan=10)
...

df.plot.barh(ax=ax1, stacked=True)
您可以使用以下选项:

fig = plt.figure()
ax = fig.add_subplot(221)
plt.plot(x,y)

ax = fig.add_subplot(222)
plt.plot(x,z)
...

plt.show()

你可能根本不需要使用熊猫。以下是cat频率的matplotlib图:


您可以使用matplotlib绘制多个pandas数据帧的多个子图,只需制作所有数据帧的列表。然后使用for循环绘制子地块

工作代码:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
#define number of rows and columns for subplots
nrow=3
ncol=2
# make a list of all dataframes 
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)
# plot counter
count=0
for r in range(nrow):
    for c in range(ncol):
        df_list[count].plot(ax=axes[r,c])
        count=+1

使用此代码,您可以在任何配置中绘制子地块。您只需定义行数
nrow
和列数
ncol
。此外,您还需要列出要打印的数据帧
df_list

如何从包含长(整齐)数据的数据帧字典中创建多个打印
  • 假设

    • 有一个包含多个整齐数据帧的字典
      • 通过从文件中读入创建
      • 通过将单个数据帧分离为多个数据帧创建
    • 类别
      cat
      可能重叠,但所有数据帧可能不包含
      cat
    • hue='cat'
  • 因为数据帧正在迭代,所以不能保证每个绘图的颜色映射相同

    • 需要从所有数据帧的唯一
      'cat'
      值创建自定义颜色映射
    • 由于颜色相同,请在绘图的一侧放置一个图例,而不是在每个绘图中放置一个图例
进口和合成数据
将熊猫作为pd导入
将numpy导入为np#用于随机数据
导入随机#用于随机数据
将matplotlib.pyplot作为plt导入
从matplotlib.patches导入用于自定义图例的补丁#
导入seaborn作为sns
导入数学导入单元#确定子批次的正确数量
#合成数据
df_dict=dict()
对于范围(1,7)内的i:
np.随机种子(i)
随机种子(一)
数据长度=100
数据={'cat':[random.choice(['A','B','C']),用于范围内的u(数据长度)],
“x”:np.random.rand(数据长度),
“y”:np.random.rand(数据长度)}
df_dict[i]=局部放电数据帧(数据)
#显示(df_dict[1].head())
猫x y
0 A 0.417022 0.326645
1 C 0.720324 0.527058
2 A 0.000114 0.885942
3 B 0.302333 0.357270
4 A 0.146756 0.908535
创建颜色映射和打印

这里是一个工作子批示例,其中modes是数据帧的列名

    dpi=200
    figure_size=(20, 10)
    fig, ax = plt.subplots(len(modes), 1, sharex="all", sharey="all", dpi=dpi)
    for i in range(len(modes)):
        ax[i] = pivot_df.loc[:, modes[i]].plot.bar(figsize=(figure_size[0], figure_size[1]*len(modes)),
                                                   ax=ax[i], title=modes[i], color=my_colors[i])
        ax[i].legend()
    fig.suptitle(name)

请注意,令人烦恼的是,
.subplot()
根据要创建的子地块数组的尺寸返回不同的坐标系。因此,如果返回子批,例如,
nrows=2,ncols=1
,则需要将轴索引为
轴[0]
轴[1]
。在我的数据里看到“金丝雀”谢谢,这真的很烦人。。。您的评论为我节省了一些时间:)无法理解为什么我会得到
索引器错误:数组中的数组
@canary\u索引太多,只有在使用
.subplot()
的默认参数时,这才令人讨厌。设置
squage=False
强制
.subplot()
在任何行和列的情况下始终返回
ndarray
。尽管joris的答案对于matplotlib的一般用法来说是非常好的,但对于希望使用pandas进行快速数据可视化的任何人来说都是非常好的。它也更适合这个问题。请记住,
子图
布局
kwargs将仅为单个数据帧生成多个图。这与OP将多个数据帧绘制到一个绘图中的问题有关,但不是一个解决方案。这是纯熊猫使用的更好答案。这不需要直接导入matplotlib(尽管您通常应该这样做),也不需要对任意形状进行循环(例如,可以使用
layout=(df.shape[1],1)
)。请注意最后一行的打字错误:不是
count=+1
,而是
count+=1
我认为使用
ax=plt.gca()
也在第一个绘图上。
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
#define number of rows and columns for subplots
nrow=3
ncol=2
# make a list of all dataframes 
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)
# plot counter
count=0
for r in range(nrow):
    for c in range(ncol):
        df_list[count].plot(ax=axes[r,c])
        count=+1
# create color mapping based on all unique values of cat
unique_cat = {cat for v in df_dict.values() for cat in v.cat.unique()}  # get unique cats
colors = sns.color_palette('husl', n_colors=len(unique_cat))  # get a number of colors
cmap = dict(zip(unique_cat, colors))  # zip values to colors

# iterate through dictionary and plot
col_nums = 3  # how many plots per row
row_nums = math.ceil(len(df_dict) / col_nums)  # how many rows of plots
plt.figure(figsize=(10, 5))  # change the figure size as needed
for i, (k, v) in enumerate(df_dict.items(), 1):
    plt.subplot(row_nums, col_nums, i)  # create subplots
    p = sns.scatterplot(data=v, x='x', y='y', hue='cat', palette=cmap)
    p.legend_.remove()  # remove the individual plot legends
    plt.title(f'DataFrame: {k}')

plt.tight_layout()
# create legend from cmap
patches = [Patch(color=v, label=k) for k, v in cmap.items()]
# place legend outside of plot; change the right bbox value to move the legend up or down
plt.legend(handles=patches, bbox_to_anchor=(1.06, 1.2), loc='center left', borderaxespad=0)
plt.show()
    dpi=200
    figure_size=(20, 10)
    fig, ax = plt.subplots(len(modes), 1, sharex="all", sharey="all", dpi=dpi)
    for i in range(len(modes)):
        ax[i] = pivot_df.loc[:, modes[i]].plot.bar(figsize=(figure_size[0], figure_size[1]*len(modes)),
                                                   ax=ax[i], title=modes[i], color=my_colors[i])
        ax[i].legend()
    fig.suptitle(name)