R tsne初始pca步骤在做什么

R tsne初始pca步骤在做什么,r,cluster-analysis,dimensionality-reduction,mds,R,Cluster Analysis,Dimensionality Reduction,Mds,查看Rtsne函数的参数: 有一个名为“pca”的参数定义为“逻辑;是否应执行初始pca步骤(默认值:TRUE)” 假设您有一个10维特征集,并且运行TSNE。我想你应该缩放10-D矩阵,然后将其传递给Rtsne() pca参数指示的pca做什么 是否需要10-D矩阵并对其运行PCA?如果是这样,它会将PCA空间中的所有10维传递给Rtsne吗 关于PCA初始步骤是什么,还有其他信息吗 多谢各位 原始tSNE纸张使用PCA 在运行tSNE之前减少MNIST数据的维数。Ah,很高兴知道!他们写道

查看Rtsne函数的参数:

有一个名为“pca”的参数定义为“逻辑;是否应执行初始pca步骤(默认值:TRUE)”

假设您有一个10维特征集,并且运行TSNE。我想你应该缩放10-D矩阵,然后将其传递给Rtsne()

pca参数指示的pca做什么

是否需要10-D矩阵并对其运行PCA?如果是这样,它会将PCA空间中的所有10维传递给Rtsne吗

关于PCA初始步骤是什么,还有其他信息吗

多谢各位

原始tSNE纸张使用PCA


在运行tSNE之前减少MNIST数据的维数。

Ah,很高兴知道!他们写道:“在我们所有的实验中,我们首先使用PCA将数据的维数降低到30。这加快了数据点之间成对距离的计算,并在不严重扭曲插值距离的情况下抑制了一些噪声。”能够为复杂的数据集调整神奇的数字30可能会有用吗?对于大型数据集,PCA步骤显然比tSNE步骤花费更多的时间。我想PCA的论点是这样的,如果你的数据已经进行了PCA转换,你可以跳过它。PCA应该比tSNE便宜得多,除非你的维度太多,维度的诅咒破坏了距离。t-SNE在单细胞转录组学领域非常成功地使用,通常需要减少约20000个维度,但其中许多维度为0或共线,因此维度的诅咒并不太糟糕。在这里,SVD是更耗时的步骤,例如,在这种情况下,可能值得跳过PCA,因为如果没有n>>p。。。另外,您可能希望使用更合适的相似性度量。。。