Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/perl/10.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Pandas 关于熊猫。示例()_Pandas - Fatal编程技术网

Pandas 关于熊猫。示例()

Pandas 关于熊猫。示例(),pandas,Pandas,我有一个数据帧。i、 e.“df”,它有10000行和4列(一列的值为“是/否”,仅命名为“购买”,4000是和6000否) 如果我写这段代码: sample = df.sample(df.shape[0], replace = True) 然后我假设它将返回带有无序的整个数据帧。因此,我使用了.shape(),结果表明该示例具有与df相同数量的记录。(10000) 然后我用 sample.query('purchased == "Yes"').info() 现在…这次的结果让我很困惑…每次

我有一个数据帧。i、 e.“df”,它有10000行和4列(一列的值为“是/否”,仅命名为“购买”,4000是和6000否)

如果我写这段代码:

sample = df.sample(df.shape[0], replace = True)
然后我假设它将返回带有无序的整个数据帧。因此,我使用了.shape(),结果表明该示例具有与df相同数量的记录。(10000)

然后我用

sample.query('purchased == "Yes"').info()
现在…这次的结果让我很困惑…每次我运行它时,info()给出的记录数…(2333;3000;1540;…)


为什么呢?如果示例只是整个df,那么.info()不应该每次都相同吗?(4000)

正如您在pandas文档中看到的那样,如果将replace参数设置为True,它可以多次添加同一行,因此“sample”变量可能包含一个与原始数据集不同的数据集,其中不同行数的购买值等于“yes”

参考:


正如您在pandas文档中看到的那样,如果将replace参数设置为True,它可以多次添加同一行,因此“sample”变量可能包含与原始数据集不同的数据集,数据集的行数不同,购买值等于“yes”

参考: