减少python中的数据帧行

减少python中的数据帧行,python,dataframe,scikit-learn,pca,Python,Dataframe,Scikit Learn,Pca,我有8000*1600的数据帧,我想在不改变值的情况下减少行数,我尝试了pca,但值已经改变了 例如: a 10 20 30 40 b 20 70 40 50 c 10 00 80 40 d 20 30 99 50 e 10 20 30 40 f 59 30 40 50 g 10 20 30 40 h 90 30 40 50 i 91 20 34 18 进入: a 10 20 30 40 c 10 00 8

我有8000*1600的数据帧,我想在不改变值的情况下减少行数,我尝试了pca,但值已经改变了 例如:

    a 10 20 30 40
    b 20 70 40 50
    c 10 00 80 40
    d 20 30 99 50
    e 10 20 30 40
    f 59 30 40 50
    g 10 20 30 40
    h 90 30 40 50
    i 91 20 34 18
进入:

    a 10 20 30 40
    c 10 00 80 40
    h 90 30 40 50
    i 91 20 34 18

我认为解释过的方差比会用for循环处理这个问题,请提供任何帮助

除非我误解了你的问题,否则我认为你混淆了PCA(降维)的目的,只需简单的数据帧操作来减少行数。这些是非常不同的事情:

维度缩减,您可以通过PCA获得,它将修改数据帧的值(这就是重点),是一种有用但不是非常简单的方法,用于从数据中创建/提取新特征以进行分析、可视化高维数据等。请查看和上的wikipedia页面,看看这是否真的是你想要的。如果这是你想要的,我建议你重新表述你的问题

减少行数是完全不同的,在
pandas
中非常简单。根据您的示例,看起来您希望从数据帧中提取大量随机行,而无需修改。这可以通过以下方法实现

例如,在您发布的数据上,下面选择4个随机行:

>>> df.sample(4)
   0   1   2   3   4
0  a  10  20  30  40
2  c  10   0  80  40
7  h  90  30  40  50
5  f  59  30  40  50

我强烈建议大家阅读PCA及其功能。这些值的不同有一个很好的原因,如果你试图防止这种情况发生,那么你就没有做PCA(你在做其他事情,非常非常不正确)。我只是想知道,我的需求在示例中,减少rowssacul的数量。愿上帝保佑你