从PubSub到javaapi的雪犁数据处理

从PubSub到javaapi的雪犁数据处理,java,snowplow,Java,Snowplow,我正在使用雪犁进行行为数据跟踪。我可以使用Snowplow loader(&mutator)开源代码()将数据从Pub/Sub消费到BigQuery,但我希望将数据从Pub/Sub直接消费到Java API 但是,Pub/Sub中的数据是非结构化的,没有字符串格式的模式。数据包括“\t”作为分隔符以及“{}”来存储一些模式,这可能需要字符串处理来进行数据格式化 还有其他更好的方法将数据从Pub/Sub解码到javaapi,而不是编写复杂的字符串处理。谢谢大家! Snowplow维护了许多所谓的“

我正在使用雪犁进行行为数据跟踪。我可以使用Snowplow loader(&mutator)开源代码()将数据从Pub/Sub消费到BigQuery,但我希望将数据从Pub/Sub直接消费到Java API

但是,Pub/Sub中的数据是非结构化的,没有字符串格式的模式。数据包括“\t”作为分隔符以及“{}”来存储一些模式,这可能需要字符串处理来进行数据格式化


还有其他更好的方法将数据从Pub/Sub解码到javaapi,而不是编写复杂的字符串处理。谢谢大家!

Snowplow维护了许多所谓的“分析SDK”,可以让您将丰富的混合tsv+JSON格式转换为纯JSON,然后在下游应用程序中使用

对于Java,您最好的选择可能是Scala Analytics SDK:


还有用于
.NET
Go
JavaScript
Python
的SDK:。

谢谢!很抱歉迟了答复。我在他们的官方网站上找到了SDK。