减少python中的数据帧行
我有8000*1600的数据帧,我想在不改变值的情况下减少行数,我尝试了pca,但值已经改变了 例如:减少python中的数据帧行,python,dataframe,scikit-learn,pca,Python,Dataframe,Scikit Learn,Pca,我有8000*1600的数据帧,我想在不改变值的情况下减少行数,我尝试了pca,但值已经改变了 例如: a 10 20 30 40 b 20 70 40 50 c 10 00 80 40 d 20 30 99 50 e 10 20 30 40 f 59 30 40 50 g 10 20 30 40 h 90 30 40 50 i 91 20 34 18 进入: a 10 20 30 40 c 10 00 8
a 10 20 30 40
b 20 70 40 50
c 10 00 80 40
d 20 30 99 50
e 10 20 30 40
f 59 30 40 50
g 10 20 30 40
h 90 30 40 50
i 91 20 34 18
进入:
a 10 20 30 40
c 10 00 80 40
h 90 30 40 50
i 91 20 34 18
我认为解释过的方差比会用for循环处理这个问题,请提供任何帮助除非我误解了你的问题,否则我认为你混淆了PCA(降维)的目的,只需简单的数据帧操作来减少行数。这些是非常不同的事情: 维度缩减,您可以通过PCA获得,它将修改数据帧的值(这就是重点),是一种有用但不是非常简单的方法,用于从数据中创建/提取新特征以进行分析、可视化高维数据等。请查看和上的wikipedia页面,看看这是否真的是你想要的。如果这是你想要的,我建议你重新表述你的问题 减少行数是完全不同的,在
pandas
中非常简单。根据您的示例,看起来您希望从数据帧中提取大量随机行,而无需修改。这可以通过以下方法实现
例如,在您发布的数据上,下面选择4个随机行:
>>> df.sample(4)
0 1 2 3 4
0 a 10 20 30 40
2 c 10 0 80 40
7 h 90 30 40 50
5 f 59 30 40 50
我强烈建议大家阅读PCA及其功能。这些值的不同有一个很好的原因,如果你试图防止这种情况发生,那么你就没有做PCA(你在做其他事情,非常非常不正确)。我只是想知道,我的需求在示例中,减少rowssacul的数量。愿上帝保佑你