Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark ApacheStorm vs ApacheSamza vs ApacheSpark_Apache Spark_Apache Storm_Apache Samza - Fatal编程技术网

Apache spark ApacheStorm vs ApacheSamza vs ApacheSpark

Apache spark ApacheStorm vs ApacheSamza vs ApacheSpark,apache-spark,apache-storm,apache-samza,Apache Spark,Apache Storm,Apache Samza,我曾在《风暴与火花》上工作过,但桑扎是个新手 我不明白为什么在Storm已经在实时处理时引入Samza。Spark提供内存中的近实时处理,并具有其他非常有用的组件,如graphx和mllib Samza带来了哪些改进?还有哪些进一步的改进是可能的?很好地总结了不同之处和优缺点 我想补充的是,Samza实际上并不是那么新,它带来了某种简单性,因为它坚持使用卡夫卡作为其后端,而其他人则试图以简单性为代价来实现更通用性。萨姆萨是由创建卡夫卡的同一批人开创的,他们也是卡夫卡背后的同一批人——主要是前Li

我曾在《风暴与火花》上工作过,但桑扎是个新手

我不明白为什么在Storm已经在实时处理时引入Samza。Spark提供内存中的近实时处理,并具有其他非常有用的组件,如graphx和mllib

Samza带来了哪些改进?还有哪些进一步的改进是可能的?

很好地总结了不同之处和优缺点

我想补充的是,Samza实际上并不是那么新,它带来了某种简单性,因为它坚持使用卡夫卡作为其后端,而其他人则试图以简单性为代价来实现更通用性。萨姆萨是由创建卡夫卡的同一批人开创的,他们也是卡夫卡背后的同一批人——主要是前LinkedIn的杰伊·克雷普斯(Jay Kreps)。那很酷

此外,Samza的实时流、Spark流中的微批次(与Spark流不完全相同)以及Storm中带有元组的喷口和螺栓之间的编程模型完全不同

这一切都取决于你的用例、你的团队的实力、API如何与你的心智模型相匹配、支持的质量等等


你们也忘了还有推特,他们之所以这么做是因为暴风雪开始让他们失望。同样,很少有人需要像Twitter那样运作。

还有卡夫卡流:顺便说一句:萨姆扎已经在2013年进入了Apache孵化器——这不是一个真正的新问题:有趣的问题,但如果这样表述的话,它在StackOverflow方面是不符合主题的:太广泛,容易产生主观意见。试着提出一个更具体的问题,用事实来回答。@HonzaZidek,如果我能把这个问题限制在具体的问题上就好了。我怀疑这是一个广泛的问题,但没有看到一个更好的平台来提出这样的问题。忘了那个。最重要的是要认识到有这么多的选项