Twitter 实时流-使用Apache Storm进行多级字数统计_Twitter_Apache Storm

Twitter 实时流-使用Apache Storm进行多级字数统计

twitter apache-storm

Twitter 实时流-使用Apache Storm进行多级字数统计,twitter,apache-storm,Twitter,Apache Storm,我想使用ApacheStorm查找基于twitter提要的热门地理词汇。我看到了许多非常有效的例子但我想基于地理位置增强上述解决方案。许多twitter状态推文都带有地理位置。我想将单词计数示例拆分为m x n矩阵，其中m和n表示相对地理坐标，例如3x4=30.x40。经纬度我想根据ApacheStorm拓扑将输入流拆分为多个计数器。为单个坐标单元（如x，y）唯一运行的地理单词计数器螺栓我得到的一个解决方案是，为每个组合注册mxn螺栓数量。但这几乎是蛮力。第二种解决方案：使用fiel

我想使用ApacheStorm查找基于twitter提要的热门地理词汇。我看到了许多非常有效的例子

但我想基于地理位置增强上述解决方案。许多twitter状态推文都带有地理位置。我想将单词计数示例拆分为m x n矩阵，其中m和n表示相对地理坐标，例如3x4=30.x40。经纬度

我想根据ApacheStorm拓扑将输入流拆分为多个计数器。为单个坐标单元（如x，y）唯一运行的地理单词计数器螺栓

我得到的一个解决方案是，为每个组合注册mxn螺栓数量。但这几乎是蛮力。第二种解决方案：使用fieldsGroupingx，y字段无法正常工作。我可以看到相同的螺栓在相同的x和y组合下运行。我正在本地集群中运行

请提出一些建议

您的方法应该有效，但如果无效，请尝试将纬度和经度转换为字符串，然后将它们连接到单个字段中，并将该字段用于字段分组