MongoDB Compass显示密钥数据分布的错误最小值_Mongodb_Mongodb Compass

MongoDB Compass显示密钥数据分布的错误最小值

mongodb

MongoDB Compass显示密钥数据分布的错误最小值,mongodb,mongodb-compass,Mongodb,Mongodb Compass,我使用的是适用于mac的MongoDB Compass 1.5.1版当我查看值的分布时，Compass返回如下图：如您所见，min和max值可用。但最小值是错误的。我知道这两个键的最小值是1和1，而不是9和13 有人知道如何解决这个问题吗？明白了。标准报告基于最多1000份文档的样本从文档： MongoDB Compass中的采样是选择一个子集的实践来自所需收集的数据，并分析其中的文档样本集抽样通常用于统计分析，因为分析数据子集给出了与分析所有数据类似的结果。在里面此外，采样允

我使用的是适用于mac的MongoDB Compass 1.5.1版

当我查看值的分布时，Compass返回如下图：

如您所见，

min

和

max

值可用。但最小值是错误的。我知道这两个键的最小值是

和

，而不是

和

有人知道如何解决这个问题吗？

明白了。标准报告基于最多1000份文档的样本

从文档：

MongoDB Compass中的采样是选择一个子集的实践来自所需收集的数据，并分析其中的文档样本集

抽样通常用于统计分析，因为分析数据子集给出了与分析所有数据类似的结果。在里面此外，采样允许快速生成结果，而不是执行可能很长且计算代价高昂的集合扫描

MongoDB罗盘采用两种不同的采样机制

MongoDB 3.2中的集合通过核心服务器的聚合框架。这提供了高效的在整个采集过程中不进行替换的随机抽样，或在查询指定的文档子集上

MongoDB 3.0和2.6中的集合是通过一个反向完全在Compass内执行的兼容算法。它包括三个阶段：

查询_id值流，按_id降序限制10000

读取_id流并保存随机选择的值。我们采用储层取样来有效地执行此操作

然后通过_id查询所选的随机文档。选择采样>方法对最终用户来说是透明的

sampleSize

当前设置为1000个文档

有没有办法增加

sampleSize

？现在没有，限制是硬编码到1000个文档。如何硬编码样本大小？在数亿文档的总体中，1000个样本大小是否有意义（甚至只有几十万？？在实践中，当我让compass重新分析收集模式时，每次都会得到非常不同的结果和分布，这取决于多少随机进入样本的文档。这些非常不同的快照如何与分析所有数据的结果相似？我想k、证明这样一个样本大小的前提对于数据特征的有限区域是有效的。