1亿条记录的jdbc/jdbcio apache beam性能比较

1亿条记录的jdbc/jdbcio apache beam性能比较,jdbc,google-cloud-dataflow,apache-beam,apache-beam-io,Jdbc,Google Cloud Dataflow,Apache Beam,Apache Beam Io,我们将选择ApacheBeam进行数据流编程。考虑到所有涉及的复杂DML操作,当我使用jdbc/jdbcio时,1亿条记录的性能统计是多少。jdbc和jdbcio哪一种更快更简单?我认为很难为一般情况提供一个数字。您可能需要设计一个小的基准来测试它。性能瓶颈可能是您读/写的源/汇,而不是Beam。我同意这取决于源和汇,而不是Apache Beam,但我想知道我是否继续使用普通的java jdbc for db操作,而不是在Apache Beam中实现复杂的jdbcio,如果我选择其中一个,有什么

我们将选择ApacheBeam进行数据流编程。考虑到所有涉及的复杂DML操作,当我使用jdbc/jdbcio时,1亿条记录的性能统计是多少。jdbc和jdbcio哪一种更快更简单?

我认为很难为一般情况提供一个数字。您可能需要设计一个小的基准来测试它。性能瓶颈可能是您读/写的源/汇,而不是Beam。我同意这取决于源和汇,而不是Apache Beam,但我想知道我是否继续使用普通的java jdbc for db操作,而不是在Apache Beam中实现复杂的jdbcio,如果我选择其中一个,有什么优点和缺点。Beam已经有一个JdbcIO:。它能满足您的需要吗?我已经阅读了jdbcio文档,它的用法和代码。实际上,我遇到的问题是,所有的db都是用beam sdk 2.2.0开发的,当时没有可用的jdbcio。用jdbcio重新编写现有的jdbc代码对我们来说是一项巨大的工作,因此我正在用现有的jdbc进行优化。我认为很难为一般情况提供一个数字。您可能需要设计一个小的基准来测试它。性能瓶颈可能是您读/写的源/汇,而不是Beam。我同意这取决于源和汇,而不是Apache Beam,但我想知道我是否继续使用普通的java jdbc for db操作,而不是在Apache Beam中实现复杂的jdbcio,如果我选择其中一个,有什么优点和缺点。Beam已经有一个JdbcIO:。它能满足您的需要吗?我已经阅读了jdbcio文档,它的用法和代码。实际上,我遇到的问题是,所有的db都是用beam sdk 2.2.0开发的,当时没有可用的jdbcio。用jdbcio重新编写现有的jdbc代码对我们来说是一项巨大的工作,因此我正在用现有的jdbc进行优化。