Python自适应直方图宽度
我目前正在从事一个项目,我必须存储多达10维的数据。这在numpy.historogramdd中完全可以使用,但是在一个应用中有一个严重的障碍: 我的参数空间相当大,但实际上只有一小部分是由数据占据的(比如,可能只有几%左右…)。在这些区域中,数据非常丰富,因此我希望使用相对较小的箱子宽度。然而,这里的问题是RAM的使用量完全爆炸了。我看到20GB+仅用于5个维度,这已经绝对不实用了。我尝试自己定义网格,但问题仍然存在 我的想法是手动指定箱子边缘,在这里我只对数据空间中的空白区域使用非常大的箱子宽度。只有在我实际拥有数据的地区,我才需要更精细的尺度 我想知道这里是否有人知道这样一个实现已经可以在任意数量的维度上工作了Python自适应直方图宽度,python,numpy,Python,Numpy,我目前正在从事一个项目,我必须存储多达10维的数据。这在numpy.historogramdd中完全可以使用,但是在一个应用中有一个严重的障碍: 我的参数空间相当大,但实际上只有一小部分是由数据占据的(比如,可能只有几%左右…)。在这些区域中,数据非常丰富,因此我希望使用相对较小的箱子宽度。然而,这里的问题是RAM的使用量完全爆炸了。我看到20GB+仅用于5个维度,这已经绝对不实用了。我尝试自己定义网格,但问题仍然存在 我的想法是手动指定箱子边缘,在这里我只对数据空间中的空白区域使用非常大的箱子
谢谢我认为您应该首先重新映射数据,然后创建直方图,然后在知道值已转换的情况下解释直方图。一种可能是调整直方图刻度标签,以便它们显示映射值 例如,一种可能的方法是:
哼。我不知道如何将此方法与任意数量的维度集成。现在,我正试图在重要的地方评估密度,即在我的数据所在的离散网格坐标处,这意味着我让数据选择了垃圾箱…无论如何,谢谢!!