Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/10.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 在SQL外部使用HLL_COUNT.MERGE_Algorithm_Google Bigquery_Hyperloglog - Fatal编程技术网

Algorithm 在SQL外部使用HLL_COUNT.MERGE

Algorithm 在SQL外部使用HLL_COUNT.MERGE,algorithm,google-bigquery,hyperloglog,Algorithm,Google Bigquery,Hyperloglog,我可以使用以下查询来概括不同计数的所有HLL草图: SELECT category, count(distinct city), HLL_COUNT.INIT(city) FROM `table` GROUP BY category 我得到了这样的结果: 虽然我通常会使用HLL\u COUNT.merge(…)函数来获取总计数,例如: select 'all -- hll', HLL_COUNT.MERGE(x), null from (select category, count(dist

我可以使用以下查询来概括不同计数的所有HLL草图:

SELECT category, count(distinct city), HLL_COUNT.INIT(city) FROM `table`
GROUP BY category
我得到了这样的结果:

虽然我通常会使用
HLL\u COUNT.merge(…)
函数来获取总计数,例如:

select 'all -- hll', HLL_COUNT.MERGE(x), null from (select category, count(distinct city), HLL_COUNT.INIT(city) x from `datadocs-163219.010ff92f6a62438aa47c10005fe98fc9.inv` group by category) _

出于各种原因,我需要在SQL/BigQuery之外执行
合并
。是否有某种库/开源库,我可以在其中执行以下操作:

>>> hll_set
>>> {'CHAQMBgCIAuCBz8QFBgPIBQyN8hxlqEBvMMBnLMBgWnD5gTB3AH+ROgD/YMEpM8Jr70C6Q2LwwfZlQ3QMNu8AYDSBKf7AbOSqgE=',  'CHAQDhgCIAuCBxwQBxgPIBQyFP3PBMBtibMR3sgC77oViasKwfMF', 'CHAQJxgCIAuCBzIQEBgPIBQyKshxlqEBvMMBzfECh6gJxJABoNwF/rEGwf0PgYYFvOoFmzjJPZwg2y3nbw==', 'CHAQBBgCIAuCBw4QAhgPIBQyBpSJAfapKA==', 'CHAQBRgCIAuCBxEQAxgPIBQyCbaJBfqsH57tBw==', 'CHAQGBgCIAuCBykQDRgPIBQyId6SAtNvwJ0XgO8Ct/EFlvUOskG1E87ZA7/OApwg2y3nbw==', 'CHAQZhgCIAuCB2MQIxgPIBQyW5SJAcqJAbzDAcvcAoIV2xSMFsTyA42IAYkl+Wvj/AHqdJxRlEGbywG/WNjoAqS9BP3CAuPrBNSFAfdDt+YEoeIBr+ICmIYF6CL/MaLNAqKdA8k9rxntBrPVrAE=', 'CHAQEBgCIAuCByQQChgPIBQyHN6SAqjtArAJ/esCj9wSg+8KiVKNygHrpgXIogU=', 'CHAQpgkYAiALggfZAhChARgPIBQyzwKPBMwRkAzxP+wPogyqC8qJAeBo8BHsSOypAbAJriL+MYYR/1jnKqIyzR3wJIkI/QXkecNH7WCzQZgMuDvxFLh+xkboA7QB12akDhu5E+4+3KgBjAZ4nxLBRMw0xRWvIPZYszt+v1gnz2a0BZoF4wzQggHqOewsJeAxgguGErUCjGG3KuhKgUyfCtItkjOMZZwCpi3phgHlA+wRknEhwiq1Os4slgmhELEWl1f1rgH+B6e4AdCtAdkE4R7fK/gihHSRFqipAbYY9BmqP5oBgqsBvhrvEKGRAcpj7XHEVaAUrY8BylLRDgWn1wGpT6IS6irPHewb/AbKHqgQjQPyAeU82zuSHpgQ04UBzwqkFIADiBD4X6ABjBihFsIy6wmovgHNKssPsQOvGcADrQOQevMQvxKMBtANizqbP7l21+kB0UDxY92rVYCBMcD5H8CiEA=='}

>>> hll_merge_method(hll_set)
>>> 193

使用BQ之外的库以及由此生成的散列,是否可以以任何方式实现这一点?

这是一个功能请求,您可能已经在问题跟踪程序中找到了:当前的散列是Google专有的,但有一天BigQuery可以使用开放的散列。投票赞成那个请求


可能很快就会有消息,订阅该期会让您不断更新


2019更新:在以下位置查找BigQuery的HyperLogLog++的开源版本:


您可能已经在问题跟踪程序中找到了这一功能请求:当前哈希是谷歌专有的,但有一天BigQuery可能会使用开放的哈希。投票表决这项请求up@FelipeHoffa--我明白了,这是一个与云数据流相关的问题,我投了更高的票--Hey@FelipeHoffa-你可以把你的评论推广到子孙后代的答案吗?谢谢。你知道何时或是否会实施吗?它似乎已经被搁置了两年了。可能很快就会有新闻,订阅该期会让你不断更新。看起来这已经完成了。您现在可以更新您的答案,以显示它是如何可能的:)感谢ping!你现在接受答案吗?