Amazon web services 关于aws雅典娜中伯努利样本大小的问题

Amazon web services 关于aws雅典娜中伯努利样本大小的问题,amazon-web-services,amazon-athena,sample-data,Amazon Web Services,Amazon Athena,Sample Data,我从雅典娜表中得到了1%的伯努利随机样本。但是,返回的示例表的大小仅为原始表的0.4%。两者都是拼花地板形式。为什么会这样?然后Bernoulli选项将选择具有给定概率的行,只有平均情况下,您才能获得给定百分比的输出行,但任何单个查询都会有不同数量的行。根据经验,如果表中有N行,则输出表中的行数应在N+/-sqrt(N)

我从雅典娜表中得到了1%的伯努利随机样本。但是,返回的示例表的大小仅为原始表的0.4%。两者都是拼花地板形式。为什么会这样?

然后Bernoulli选项将选择具有给定概率的行,只有平均情况下,您才能获得给定百分比的输出行,但任何单个查询都会有不同数量的行。根据经验,如果表中有
N
行,则输出表中的行数应在
N+/-sqrt(N)