Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/fortran/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark Spark Streaming与Kafka的实时集成_Apache Spark_Spark Streaming - Fatal编程技术网

Apache spark Spark Streaming与Kafka的实时集成

Apache spark Spark Streaming与Kafka的实时集成,apache-spark,spark-streaming,Apache Spark,Spark Streaming,我将Spark Streaming Process与卡夫卡结合起来阅读特定主题。创建了Spark上下文,轮询时间为5秒,工作正常。但是,如果我想实时访问提要,我可以进一步将其减少到1秒(是否会过度杀戮?),或者是否有其他更好的选择来处理这种情况 Spark Structured streaming为处理时间提供了多种模式或“触发器”。通过使用连续处理模式,您可以牺牲吞吐量以减少延迟。您可以通过增加触发器持续时间来牺牲延迟以获得更大的吞吐量。在Scala上将微批处理持续时间设置为1s,在Pytho

我将Spark Streaming Process与卡夫卡结合起来阅读特定主题。创建了Spark上下文,轮询时间为5秒,工作正常。但是,如果我想实时访问提要,我可以进一步将其减少到1秒(是否会过度杀戮?),或者是否有其他更好的选择来处理这种情况

Spark Structured streaming为处理时间提供了多种模式或“触发器”。通过使用连续处理模式,您可以牺牲吞吐量以减少延迟。您可以通过增加触发器持续时间来牺牲延迟以获得更大的吞吐量。在Scala上将微批处理持续时间设置为1s,在Python上将微批处理持续时间设置为2s,这应该很好