Twitter 实时流-使用Apache Storm进行多级字数统计

Twitter 实时流-使用Apache Storm进行多级字数统计,twitter,apache-storm,Twitter,Apache Storm,我想使用ApacheStorm查找基于twitter提要的热门地理词汇。我看到了许多非常有效的例子 但我想基于地理位置增强上述解决方案。许多twitter状态推文都带有地理位置。我想将单词计数示例拆分为m x n矩阵,其中m和n表示相对地理坐标,例如3x4=30.x40。经纬度 我想根据ApacheStorm拓扑将输入流拆分为多个计数器。为单个坐标单元(如x,y)唯一运行的地理单词计数器螺栓 我得到的一个解决方案是,为每个组合注册mxn螺栓数量。但这几乎是蛮力。 第二种解决方案:使用fiel

我想使用ApacheStorm查找基于twitter提要的热门地理词汇。我看到了许多非常有效的例子

但我想基于地理位置增强上述解决方案。许多twitter状态推文都带有地理位置。我想将单词计数示例拆分为m x n矩阵,其中m和n表示相对地理坐标,例如3x4=30.x40。经纬度

我想根据ApacheStorm拓扑将输入流拆分为多个计数器。为单个坐标单元(如x,y)唯一运行的地理单词计数器螺栓

我得到的一个解决方案是,为每个组合注册mxn螺栓数量。但这几乎是蛮力。 第二种解决方案:使用fieldsGroupingx,y字段无法正常工作。我可以看到相同的螺栓在相同的x和y组合下运行。我正在本地集群中运行


请提出一些建议

您的方法应该有效,但如果无效,请尝试将纬度和经度转换为字符串,然后将它们连接到单个字段中,并将该字段用于字段分组