Statistics PCA对重复的不平衡数据的结果

Statistics PCA对重复的不平衡数据的结果,statistics,pca,variance,Statistics,Pca,Variance,我正在使用sklearn IPCA分解,如果我从数据集中删除重复项,结果会与“不干净”的结果不同,这让我感到惊讶 原因是什么?我认为,方差是一样的 答案很简单。数据集中的重复项会改变方差 欢迎来到SO,这是关于编程问题的;请考虑把这个贴出来。但除此之外,“结果不同”的确切含义可能还不清楚…@desertnaut我这么做了,但在这里我收到了我名誉上的负号只要删除这篇文章,负号就会随之消失。。。

我正在使用sklearn IPCA分解,如果我从数据集中删除重复项,结果会与“不干净”的结果不同,这让我感到惊讶


原因是什么?我认为,方差是一样的

答案很简单。数据集中的重复项会改变方差


欢迎来到SO,这是关于编程问题的;请考虑把这个贴出来。但除此之外,“结果不同”的确切含义可能还不清楚…@desertnaut我这么做了,但在这里我收到了我名誉上的负号只要删除这篇文章,负号就会随之消失。。。