Apache spark Google Dataflow vs Apache Spark Streaming(在Google云上或使用Google Dataproc)

Apache spark Google Dataflow vs Apache Spark Streaming(在Google云上或使用Google Dataproc),apache-spark,google-cloud-dataflow,google-cloud-dataproc,Apache Spark,Google Cloud Dataflow,Google Cloud Dataproc,我不熟悉云和大数据,但我对这些很感兴趣,而且我在Java编程方面有丰富的经验。我目前正在进行我的uni项目,以比较apachespark流和googleclouddataflow的性能。我已经读了很多文章,包括所做的比较 我知道Spark和Dataflow的编程模型是不同的,但是由于我在这方面的有限和新知识,我试图了解是否仍然可以进行性能比较? 什么类型的用例对此是正确的?对于流媒体应用程序,这里应该考虑哪些性能参数 在阅读有关Dataflow和Spark的文章时,我也遇到了Dataproc,我

我不熟悉云和大数据,但我对这些很感兴趣,而且我在Java编程方面有丰富的经验。我目前正在进行我的uni项目,以比较apachespark流和googleclouddataflow的性能。我已经读了很多文章,包括所做的比较

我知道Spark和Dataflow的编程模型是不同的,但是由于我在这方面的有限和新知识,我试图了解是否仍然可以进行性能比较? 什么类型的用例对此是正确的?对于流媒体应用程序,这里应该考虑哪些性能参数

在阅读有关Dataflow和Spark的文章时,我也遇到了Dataproc,我也在想,在Dataproc上比较Dataflow和Spark,还是比较Dataflow和Spark+Google云更好


如果您对此有任何建议,我将不胜感激,因为我在这方面没有明确的方向。

比较性能的最佳方法是使用真正的端到端数据处理管道。因此,您首先需要回答自己的问题“哪种类型的用例适用于此?”因为有几乎无限的种类


您可能会从中得到一些启发。

比较性能的最佳方法是使用真正的端到端数据处理管道。因此,您首先需要回答自己的问题“哪种类型的用例适用于此?”因为有几乎无限的种类

你可能会从中找到一些灵感