MongoDB Compass显示密钥数据分布的错误最小值
我使用的是适用于mac的MongoDB Compass 1.5.1版 当我查看值的分布时,Compass返回如下图: 如您所见,MongoDB Compass显示密钥数据分布的错误最小值,mongodb,mongodb-compass,Mongodb,Mongodb Compass,我使用的是适用于mac的MongoDB Compass 1.5.1版 当我查看值的分布时,Compass返回如下图: 如您所见,min和max值可用。但最小值是错误的。我知道这两个键的最小值是1和1,而不是9和13 有人知道如何解决这个问题吗?明白了。标准报告基于最多1000份文档的样本 从文档: MongoDB Compass中的采样是选择一个子集的实践 来自所需收集的数据,并分析其中的文档 样本集 抽样通常用于统计分析,因为分析 数据子集给出了与分析所有数据类似的结果。在里面 此外,采样允
min
和max
值可用。但最小值是错误的。我知道这两个键的最小值是1
和1
,而不是9
和13
有人知道如何解决这个问题吗?明白了。标准报告基于最多1000份文档的样本 从文档: MongoDB Compass中的采样是选择一个子集的实践 来自所需收集的数据,并分析其中的文档 样本集 抽样通常用于统计分析,因为分析 数据子集给出了与分析所有数据类似的结果。在里面 此外,采样允许快速生成结果,而不是 执行可能很长且计算代价高昂的集合 扫描 MongoDB罗盘采用两种不同的采样机制 MongoDB 3.2中的集合通过 核心服务器的聚合框架。这提供了高效的 在整个采集过程中不进行替换的随机抽样,或 在查询指定的文档子集上 MongoDB 3.0和2.6中的集合是通过一个反向 完全在Compass内执行的兼容算法。它包括 三个阶段:
sampleSize
当前设置为1000个文档
有没有办法增加
sampleSize
?现在没有,限制是硬编码到1000个文档。如何硬编码样本大小?在数亿文档的总体中,1000个样本大小是否有意义(甚至只有几十万??在实践中,当我让compass重新分析收集模式时,每次都会得到非常不同的结果和分布,这取决于多少随机进入样本的文档。这些非常不同的快照如何与分析所有数据的结果相似?我想k、 证明这样一个样本大小的前提对于数据特征的有限区域是有效的。