Matplotlib 可视化大型数据系列

Matplotlib 可视化大型数据系列,matplotlib,visualization,matlab-figure,Matplotlib,Visualization,Matlab Figure,我有一个看似简单的问题,但一个简单的解决办法却暗指着我。我有一个非常大的系列(几万或几十万个点),我只需要在不同的缩放级别上对它进行可视化,但通常都会放大。基本上,我想用Matlab或Pyplot这样的工具来绘制它,但是知道每个像素不能代表映射到它的可能数百个点,我想看到映射到一个像素的所有数组项的最小值和最大值,这样我就可以大致了解发生了什么。有没有一种简单的方法可以做到这一点?您可能想尝试的第一个选项是Gephi- 这是另一个选择,尽管我不太确定它是否会起作用。很难说没有看到数据 尝试转到此

我有一个看似简单的问题,但一个简单的解决办法却暗指着我。我有一个非常大的系列(几万或几十万个点),我只需要在不同的缩放级别上对它进行可视化,但通常都会放大。基本上,我想用Matlab或Pyplot这样的工具来绘制它,但是知道每个像素不能代表映射到它的可能数百个点,我想看到映射到一个像素的所有数组项的最小值和最大值,这样我就可以大致了解发生了什么。有没有一种简单的方法可以做到这一点?

您可能想尝试的第一个选项是Gephi-

这是另一个选择,尽管我不太确定它是否会起作用。很难说没有看到数据

尝试转到此链接-。您是否看到data.tsv页面底部有所有值?如果您可以保存类似于此的数据,那么上面的HTML代码应该能够在该链接中显示的散点图示例中构建数据。
否则,请尝试访问链接,将数据调整为更合适的网页

您可能想尝试的第一个选项是Gephi-

这是另一个选择,尽管我不太确定它是否会起作用。很难说没有看到数据

尝试转到此链接-。您是否看到data.tsv页面底部有所有值?如果您可以保存类似于此的数据,那么上面的HTML代码应该能够在该链接中显示的散点图示例中构建数据。 否则,请尝试访问链接,将数据调整为更合适的网页

试试看。通过设置
reduce\u C\u函数
我想你可以得到你想要的。例:

import matplotlib.pyplot as plt
import numpy as np
plt.hexbin(x,y,C=C, reduce_C_function=np.max) # C = f(x,y)
将为您提供一个六边形的热图,其中像素中的颜色是容器中的最大值

如果您只想在一个方向上装箱,请参阅此方法。

试试。通过设置
reduce\u C\u函数
我想你可以得到你想要的。例:

import matplotlib.pyplot as plt
import numpy as np
plt.hexbin(x,y,C=C, reduce_C_function=np.max) # C = f(x,y)
将为您提供一个六边形的热图,其中像素中的颜色是容器中的最大值


如果您只想将数据存储在一个方向上,请参阅此方法。

有一套称为的研究工具,提供了一些如何处理大型时间序列数据集的示例。下面是TimeSearcher 2和3的一些示例图像


有一套称为的研究工具,提供了一些如何处理大型时间序列数据集的示例。下面是TimeSearcher 2和3的一些示例图像


我意识到MATLAB中的simple
plot()
实际上或多或少给了我想要的东西。缩小后,它会将映射到像素列的所有数据点渲染为集合中从最小值到最大值的垂直线段,以避免模糊函数的实际行为。我使用
area()
来增加对比度。

我意识到MATLAB中的simple
plot()
实际上或多或少给了我想要的东西。缩小后,它会将映射到像素列的所有数据点渲染为集合中从最小值到最大值的垂直线段,以避免模糊函数的实际行为。我使用
area()
来增加对比度。

它必须是matlab类型的应用程序,还是可以在网页可视化中打开数据?我完全愿意接受任何直接的选择。我以前从未使用过d3,如果它是一个快速的片段,你能发布一个答案吗?先给gephi或cytoscape一个镜头。它必须是matlab类型的应用程序,还是你能在网页可视化中打开你的数据?我完全愿意接受任何直接的选择。我以前从未使用过d3,如果它是一个简短的片段,你能发布一个答案吗?先给gephi或cytoscape一个镜头。我不是真的想做一个散点图。那就太多了。基本上,我只想要一个最大箱和最小箱的图,如果这有意义的话。我不是真的想做一个散点图。那就太多了。基本上我只想要一个能把我的数据点分成最大和最小两部分的图,如果这有意义的话。哇,非常有趣。我来看看。哇,很有趣。我会查一查。