Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/date/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 是否有一种直观显示高维数据的好方法?_Python_Language Agnostic_Graph_Machine Learning - Fatal编程技术网

Python 是否有一种直观显示高维数据的好方法?

Python 是否有一种直观显示高维数据的好方法?,python,language-agnostic,graph,machine-learning,Python,Language Agnostic,Graph,Machine Learning,有人能告诉我是否有一个好的(简单的)方法来可视化高维数据吗?我的数据目前是21维,但我想看看它是密集的还是稀疏的。有没有实现这一点的技术?是可视化高维数据的常用方法 什么样的可视化最适合您的数据将取决于数据的特征——不同维度之间的关联程度如何?如果维度相互关联,可能会有所帮助。星型模式 适用于高维数据 如果事实数据表的基数接近维度大小的乘积,则数据密集 如果事实表的基数小于维度大小的乘积,则数据稀疏 中间有一个判断电话 我要搜索的流行词是。这是一种从高维空间到低维空间(2维或3维)的投影技术,

有人能告诉我是否有一个好的(简单的)方法来可视化高维数据吗?我的数据目前是21维,但我想看看它是密集的还是稀疏的。有没有实现这一点的技术?

是可视化高维数据的常用方法

什么样的可视化最适合您的数据将取决于数据的特征——不同维度之间的关联程度如何?

如果维度相互关联,可能会有所帮助。

星型模式

适用于高维数据

如果事实数据表的基数接近维度大小的乘积,则数据密集

如果事实表的基数小于维度大小的乘积,则数据稀疏


中间有一个判断电话

我要搜索的流行词是。这是一种从高维空间到低维空间(2维或3维)的投影技术,其方式是使在整个空间中接近的点在投影中也接近

它通常用于可视化集群算法的输出(即,如果您的集群在MDS投影中是紧凑的,那么它们很可能也在整个空间中)


编辑:这不一定有助于确定数据是密集的还是稀疏的,因为在投影中会丢失比例,但它会显示数据是均匀的还是密集的(也许这就是你的意思).

数据探索软件设计用于高维数据的可视化:数据显示为三维对象的集合(每个数据组一个),可同时显示多达13个变量。数据变量和视觉特征之间的关系比其他技术(如平行坐标)更容易记住。

不确定您希望从数据中看到什么样的模式。t-SNE及其更快的变体Barnes-Hut-SNE在可视化高维数据的相关概念组方面做得非常好。可通过R

有一个简短的教程,介绍如何对大约300维的高维数据使用它。

看看(巡更、平行坐标、散点图矩阵)可用于实值变量。也适用于最近的。R.

中的tourr软件包我一直在寻找可视化高维数据的方法,并发现这种方法已经得到了有效的使用。也可能帮助他人。

尝试使用


HyperTools是一个用Python可视化和操作高维数据的库。

我不知道答案,但是,我可以告诉你,优化这是一个非常热门的研究课题。我建议使用可视化工具,如Tableau或Spotfire。即便如此,21维还是很多,所以你可能需要执行一些降维技术,以使其达到一个有意义的水平,非常垃圾的样子,什么是,@Cory?当我试图搜索我正在使用的高维数据的良好可视化时,我发现了这个问题,我链接的t-SNE页面是一个很好的开源软件,我认为它会让其他人受益寻找一个抱歉,第一篇帖子,一个链接,我浏览了一下页面,它看起来很可信,但我已经看到无数的垃圾帖子都有同样的内容。很抱歉我的困惑,请你编辑你的帖子,这样我就可以更改投票了。