预计ETA将在使用python的apache beam GCP数据流管道中使用管道I/O和运行时参数?

预计ETA将在使用python的apache beam GCP数据流管道中使用管道I/O和运行时参数?,python,google-cloud-platform,google-cloud-dataflow,apache-beam,apache-beam-io,Python,Google Cloud Platform,Google Cloud Dataflow,Apache Beam,Apache Beam Io,只是想知道新版本(3.X)的python是否提供了更多的管道I/O和运行时参数。如果我是正确的,那么当前ApacheBeam只提供基于文件的IOs:使用python时提供textio、avroio、tfrecordio。但在Java中,我们有更多的选项,如基于文件的IOs、BigQueryIO、BigtableIO、PubSubIO和SpanRio 在我的需求中,我希望使用Python3.X在GCP数据流管道中使用BigQueryIO,但目前它不可用。是否有人有一些关于ETA的更新,什么时候Ap

只是想知道新版本(3.X)的python是否提供了更多的管道I/O和运行时参数。如果我是正确的,那么当前ApacheBeam只提供基于文件的IOs:使用python时提供textio、avroio、tfrecordio。但在Java中,我们有更多的选项,如基于文件的IOs、BigQueryIO、BigtableIO、PubSubIO和SpanRio


在我的需求中,我希望使用Python3.X在GCP数据流管道中使用BigQueryIO,但目前它不可用。是否有人有一些关于ETA的更新,什么时候ApacheBeam可以使用它

Python 3的BigTable连接器已经开发了一段时间了。目前还没有ETA,但您可以按照官方Apache Beam存储库中的相关信息进行进一步更新。

Python 3的BigTable连接器正在开发中一段时间。目前,没有ETA,但您可以按照官方Apache Beam存储库中的相关信息进行进一步更新。

在Apache Beam Python SDK中已经有相当一段时间了

还有一个,还有一个。就在我们说话的时候

这一页有更多的细节

更新:

根据OP提供的更多细节,事实证明在BigQuery查询字符串中确实不支持使用值提供程序

这已在以下PR中得到纠正:并且很可能是2.21.0版本的一部分

更新2: Apache Beam的2.20.0版本中添加了此新功能

希望它能解决你的问题

已经在ApacheBeam Python SDK中提供了相当长的一段时间

还有一个,还有一个。就在我们说话的时候

这一页有更多的细节

更新:

根据OP提供的更多细节,事实证明在BigQuery查询字符串中确实不支持使用值提供程序

这已在以下PR中得到纠正:并且很可能是2.21.0版本的一部分

更新2: Apache Beam的2.20.0版本中添加了此新功能


希望它能解决你的问题

我的问题中有一个打字错误,我刚刚改正了。在我的需求中,我正在寻找Python3的BigQueryIO连接器。我的问题中有一个打字错误,我刚刚纠正了它。在我的需求中,我正在寻找python 3的BigQueryIO连接器。仅供参考,我已经打开了。未完成的PR位于:预计该功能很可能是2.21.0版本的一部分。@KaustubhHole该PR已经合并,很可能是2.21.0版本的一部分。同时,如果愿意,您可以将PR中的更改添加到本地安装的Beam中,并使用此修改后的软件包运行带有自定义SDK标志的数据流。2.21.0可能还需要至少2个月的时间。他们可能会将此修补程序添加到2.20.0中,但很快就会发布。该修补程序已添加到上周周五发布的2.20.0中:希望它能解决您的问题!仅供参考,我已打开。未完成的PR位于:预计该功能很可能是2.21.0版本的一部分。@KaustubhGhole PR已合并,很可能是2.21.0版本的一部分。同时,如果愿意,您可以将PR中的更改添加到本地安装的Beam中,并使用此修改后的软件包运行带有自定义SDK标志的数据流。2.21.0可能还需要至少2个月的时间。他们可能会将此修补程序添加到2.20.0中,但很快就会发布。该修补程序已添加到上周周五发布的2.20.0中:希望它能解决您的问题!