Google cloud dataflow 在云数据流中使用Beam SDK

Google cloud dataflow 在云数据流中使用Beam SDK,google-cloud-dataflow,apache-beam,Google Cloud Dataflow,Apache Beam,我们目前正在使用Google的云数据流SDK(1.6.0)在GCP中运行数据流作业,但是,我们正在考虑迁移到Apache Beam SDK(0.1.0)。我们仍将使用数据流服务在GCP中运行我们的作业。有没有人经历过这一转变并提出了建议?这里是否存在任何兼容性问题?GCP是否鼓励这一举措?正式地说,数据流还不支持Beam(尽管这肯定是我们正在努力的方向)。我们建议继续使用Dataflow SDK,尤其是在SLA或支持对您很重要的情况下。这就是说,我们的测试表明Beam在数据流上运行,尽管这可能会

我们目前正在使用Google的云数据流SDK(1.6.0)在GCP中运行数据流作业,但是,我们正在考虑迁移到Apache Beam SDK(0.1.0)。我们仍将使用数据流服务在GCP中运行我们的作业。有没有人经历过这一转变并提出了建议?这里是否存在任何兼容性问题?GCP是否鼓励这一举措?

正式地说,数据流还不支持Beam(尽管这肯定是我们正在努力的方向)。我们建议继续使用Dataflow SDK,尤其是在SLA或支持对您很重要的情况下。这就是说,我们的测试表明Beam在数据流上运行,尽管这可能会在任何时候中断,但当然欢迎您自己冒险尝试

更新:
自Dataflow SDK 2.0()发布以来,Dataflow SDK现在基于Beam。Beam和Dataflow SDK目前都在Cloud Dataflow上受支持。

您现在可以在Dataflow上运行Beam SDK管道。见:


您需要向pom.xml添加一个依赖项,可能还需要添加一些命令行选项,如该页所述。

知道这是否会很快改变吗?Dataflow 2.0 SDK最近发布,是基于Apache Beam的Dataflow Java SDK的第一个受支持版本。过来看: