Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/mongodb/13.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
MongoDB Compass显示密钥数据分布的错误最小值_Mongodb_Mongodb Compass - Fatal编程技术网

MongoDB Compass显示密钥数据分布的错误最小值

MongoDB Compass显示密钥数据分布的错误最小值,mongodb,mongodb-compass,Mongodb,Mongodb Compass,我使用的是适用于mac的MongoDB Compass 1.5.1版 当我查看值的分布时,Compass返回如下图: 如您所见,min和max值可用。但最小值是错误的。我知道这两个键的最小值是1和1,而不是9和13 有人知道如何解决这个问题吗?明白了。标准报告基于最多1000份文档的样本 从文档: MongoDB Compass中的采样是选择一个子集的实践 来自所需收集的数据,并分析其中的文档 样本集 抽样通常用于统计分析,因为分析 数据子集给出了与分析所有数据类似的结果。在里面 此外,采样允

我使用的是适用于mac的MongoDB Compass 1.5.1版

当我查看值的分布时,Compass返回如下图:

如您所见,
min
max
值可用。但最小值是错误的。我知道这两个键的最小值是
1
1
,而不是
9
13


有人知道如何解决这个问题吗?

明白了。标准报告基于最多1000份文档的样本

从文档:

MongoDB Compass中的采样是选择一个子集的实践 来自所需收集的数据,并分析其中的文档 样本集

抽样通常用于统计分析,因为分析 数据子集给出了与分析所有数据类似的结果。在里面 此外,采样允许快速生成结果,而不是 执行可能很长且计算代价高昂的集合 扫描

MongoDB罗盘采用两种不同的采样机制

MongoDB 3.2中的集合通过 核心服务器的聚合框架。这提供了高效的 在整个采集过程中不进行替换的随机抽样,或 在查询指定的文档子集上

MongoDB 3.0和2.6中的集合是通过一个反向 完全在Compass内执行的兼容算法。它包括 三个阶段:

  • 查询_id值流,按_id降序限制10000
  • 读取_id流并保存随机选择的值。我们 采用储层取样来有效地执行此操作
  • 然后通过_id查询所选的随机文档。选择采样>方法对最终用户来说是透明的
  • sampleSize
    当前设置为1000个文档


    有没有办法增加
    sampleSize
    ?现在没有,限制是硬编码到1000个文档。如何硬编码样本大小?在数亿文档的总体中,1000个样本大小是否有意义(甚至只有几十万??在实践中,当我让compass重新分析收集模式时,每次都会得到非常不同的结果和分布,这取决于多少随机进入样本的文档。这些非常不同的快照如何与分析所有数据的结果相似?我想k、 证明这样一个样本大小的前提对于数据特征的有限区域是有效的。