Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/cmake/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python:如何跨多个间隔创建固定范围的散点图?_Python_Pandas_Matplotlib_Dataframe_Scatter Plot - Fatal编程技术网

Python:如何跨多个间隔创建固定范围的散点图?

Python:如何跨多个间隔创建固定范围的散点图?,python,pandas,matplotlib,dataframe,scatter-plot,Python,Pandas,Matplotlib,Dataframe,Scatter Plot,我有以下数据帧: import pandas as pd df = pd.read_table(...) df >>> df >>> interval location type y_axis 0 01 1230 X 50 1 01 1609 X 55 2 01 1903 Y 54 3 01 2574

我有以下数据帧:

import pandas as pd
df = pd.read_table(...)
df

>>> df
>>>    interval  location type  y_axis
0        01      1230    X      50
1        01      1609    X      55
2        01      1903    Y      54
3        01      2574    A      58
4        01      3151    A      57
5        01      3198    B      46
6        01      3312    X      50
...                 .....
         02      42      X      31
         02      214     A      23
         02      598     X      28
....
有几个间隔,例如
01
02
等。在每个间隔内,数据点位于1到10000之间。在
df
中,第一个数据点位于40,下一个数据点位于136,以此类推

间隔
02
的范围也在1到15000之间

我想创建一个散点图,以便为每个间隔按比例绘制1到15000的范围。然后第一个点将在1230处绘制,下一个点将在1609处绘制,等等。我还想要一条显示间隔位置的垂直线。散点图的x轴间距应为1到10000。每个间隔是一个“区域”,包含从1到10000的x轴。因此,x轴上的坐标是1:1到15000之间、2:1到15000之间、3:1到15000之间,等等(这几乎就像几个单独的散点图连接在一起)

如何做到这一点?如果没有这种复杂的间隔,如果希望从该数据帧创建散点图,可以使用:

df.plot(kind='scatter', x = "location", y = "y_axis")
以下是前50行:

d = {"interval" : ["01",                                                                                                                                                                                                              
 "01", "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",                                                                                                                                                                                                          
 "01", "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",                                                                                                                                                                                                          
 "01", "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",                                                                                                                                                                                                          
 "01", "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",                                                                                                                                                                                                          
 "01", "01", "01", "01", "01"], "location" : [1230, 1609,                                                                                                                                                                                                      
 1903, 2574, 3151, 3198, 3312, 3659, 3709,                                                                                                                                                                                                      
 3725, 4172, 4542, 4860, 4900, 5068, 5220,                                                                                                                                                                                                      
 5260, 5339, 5442, 5529, 5773, 6128, 6165,                                                                                                                                                                                                      
 6177, 6269, 6275, 6460, 7167, 7361, 7361,                                                                                                                                                                                                      
 8051, 8222, 8305, 8992, 9104, 9439, 9844,                                                                                                                                                                                                      
 10045, 10764, 10787, 11104, 11478, 11508,                                                                                                                                                                                                          
 11684, 12490, 12590, 12794, 12803, 13823,                                                                                                                                                                                                          
 13982], "type" : ["X", "X", "Y", "A", "A",                                                                                                                                                                                                              
     "B", "X", "X", "X", "B", "B", "A", "A", "A", "B", "B", "X",                                                                                                                                                                                                            
     "B", "Y", "X", "X", "Y", "Y", "C", "A", "X", "X", "Z", "Z",                                                                                                                                                                                                            
     "B", "X", "X", "A", "A", "Y", "X", "A", "X", "X", "Z", "Z",                                                                                                                                                                                                            
     "C", "X", "Y", "Y", "Z", "Z", "Z", "Z", "Z"],  "y_axis" : [50, 55, 
    54, 58, 57, 46, 50, 55, 46, 42, 56, 55, 55, 45, 52, 51, 45, 48, 50,
     49, 53, 55, 45, 40, 49, 37, 52, 58, 52, 4, 58, 52, 49, 58, 50, 55, 
    56, 53, 58, 43, 55, 55, 44, 52, 59, 49, 53, 39, 60, 52]}

似乎您希望为每个类别“间隔”绘制不同的散点图。
这可以通过按相应列对数据帧进行分组来实现

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

cat = ["01"] *5 + ["02"]*4
x = np.append(np.arange(1,6), np.arange(2.5,4.1,0.5))
y = np.random.randint(12,24, size=len(cat))
df = pd.DataFrame({"cat":cat, "x":x, "y":y})

fig, ax = plt.subplots()
colors={"01":"crimson", "02":"darkblue"}
for cat, grouped in df.groupby("cat"):
    grouped.plot(kind="scatter", x="x", y="y", ax=ax, label=cat, color=colors[cat])

plt.show()

这里的主要挑战似乎是,您希望x轴既是分类的(间隔
01
02
,等等)又是度量的(值
1
-
15000
)。正如你在文章中指出的,你实际上是在用一个共享的y轴绘制几个散点图。我建议您使用
subplot
groupby
来实现这一点。您可以使用
子图\u adjust()
调整图之间的间距,正如我在本答案中所做的那样

首先,使用OP中的
d
生成一些样本数据。我们还将随机选择一半的观察值,并将其更改为
interval=02
,以演示所需的面板:

import pandas as pd
import numpy as np

df = pd.DataFrame(d)

# shuffle rows 
# (taken from this answer: http://stackoverflow.com/a/15772330/2799941)
df = df.reindex(np.random.permutation(df.index))

# randomly select half of the rows for changing to interval 02
interval02 = df.sample(int(df.shape[0]/2.)).index
df.loc[interval02, 'interval'] = "02"
现在使用
pyplot
指定并排子图,并删除图之间的任何填充

from matplotlib import pyplot as plt

# n_plots = number of different interval values
n_plots = len(df.interval.unique())

fig, axes = plt.subplots(1, n_plots, figsize=(10,5), sharey=True)

# remove space between plots
fig.subplots_adjust(hspace=0, wspace=0)
最后,
groupby
interval
并绘制:

for i, (name, group) in enumerate(df.groupby('interval')):
    group.plot(kind="scatter", x='location', y='y_axis', 
               ax=axes[i], title="Interval {}".format(name))

使用Altair,您可以轻松地将两个间隔分隔为不同的列/颜色

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

cat = ["01"] *5 + ["02"]*4
x = np.append(np.arange(1,6), np.arange(2.5,4.1,0.5))
y = np.random.randint(12,24, size=len(cat))
df = pd.DataFrame({"cat":cat, "x":x, "y":y})
按列

按颜色

理解您的问题有点困难,因为存在一些不一致之处。(1) 你说的
dt
是指
df
?(2) 你说第一个数据点是40,第二个是136。但是这些值在您的示例数据中的什么位置?(3) 前50行仅包含一个
interval
值。您能否提供捕获多个时间间隔的示例数据?(4)如果你能为你想要的情节提供一个草图或链接,这将是有帮助的。根据你的描述,这是不容易想象的。我甚至会认为这个问题完全不清楚,因此无法回答。我修正了一些数值。(1) 现在一切都是
df
(2)查看示例数据(3)事物迅速变大。假设
位置
类型
y_轴
的数据相同,除了
间隔
值都
02
。我将提供一个例子graph@andrew_reece这里有一个例子来说明我的意思。这是一个散点图,已划分为几个区域。每个区域具有相同的数据点间隔,从1到15000。因此,很难设置x轴,因为这些点将混合在一起。我现在明白了吗?@ImportanceOfBeingErnest给定的编辑/评论,现在清楚了吗?现在我看到了图片,这不是我的意思。见@andrew_reece的答案。红/蓝点应该分开。你总是得到你想要的。如果这个问题像这里的问题一样不够清楚,你可以得到任何类型的答案。你可以决定下次提供一个清晰的问题描述,然后得到更符合你需要的答案。这是非常公平的。谢谢你指出它有多不清楚——我已经编辑过了。我也感谢你的帮助。没有不愉快的感觉或任何事。。。。
from altair import *
Chart(df).mark_point().encode(x='x', y='y', column='cat').configure_cell(width=200, height=150)
from altair import *
Chart(df).mark_point().encode(x='x', y='y', color='cat').configure_cell(width=200, height=150)