Pandas 关于熊猫。示例()
我有一个数据帧。i、 e.“df”,它有10000行和4列(一列的值为“是/否”,仅命名为“购买”,4000是和6000否) 如果我写这段代码:Pandas 关于熊猫。示例(),pandas,Pandas,我有一个数据帧。i、 e.“df”,它有10000行和4列(一列的值为“是/否”,仅命名为“购买”,4000是和6000否) 如果我写这段代码: sample = df.sample(df.shape[0], replace = True) 然后我假设它将返回带有无序的整个数据帧。因此,我使用了.shape(),结果表明该示例具有与df相同数量的记录。(10000) 然后我用 sample.query('purchased == "Yes"').info() 现在…这次的结果让我很困惑…每次
sample = df.sample(df.shape[0], replace = True)
然后我假设它将返回带有无序的整个数据帧。因此,我使用了.shape(),结果表明该示例具有与df相同数量的记录。(10000)
然后我用
sample.query('purchased == "Yes"').info()
现在…这次的结果让我很困惑…每次我运行它时,info()给出的记录数…(2333;3000;1540;…)
为什么呢?如果示例只是整个df,那么.info()不应该每次都相同吗?(4000)正如您在pandas文档中看到的那样,如果将replace参数设置为True,它可以多次添加同一行,因此“sample”变量可能包含一个与原始数据集不同的数据集,其中不同行数的购买值等于“yes” 参考:
正如您在pandas文档中看到的那样,如果将replace参数设置为True,它可以多次添加同一行,因此“sample”变量可能包含与原始数据集不同的数据集,数据集的行数不同,购买值等于“yes” 参考: