elasticsearch logstah vs spark streaming and storm,elasticsearch,apache-spark,logstash,apache-storm,spark-streaming,elasticsearch,Apache Spark,Logstash,Apache Storm,Spark Streaming" /> elasticsearch logstah vs spark streaming and storm,elasticsearch,apache-spark,logstash,apache-storm,spark-streaming,elasticsearch,Apache Spark,Logstash,Apache Storm,Spark Streaming" />

elasticsearch logstah vs spark streaming and storm

elasticsearch logstah vs spark streaming and storm,elasticsearch,apache-spark,logstash,apache-storm,spark-streaming,elasticsearch,Apache Spark,Logstash,Apache Storm,Spark Streaming,我正致力于构建一个分布式实时集群系统来监控和分析网络。我在互联网上做了几项研究,得出的技术很少: 用于实时处理:logstash、storm和apache流媒体 用于存储:elasticsearch 用于分析:ApacheSpark over Hadoop(我将使用ES Hadoop连接Elasticsearch) 对于数据可视化:kibana、D3js、c3js 然而,logstash并不经常被称为火花流和风暴。我在互联网上发现了下图所示的架构: 我有两个问题: 我不明白为什么logst

我正致力于构建一个分布式实时集群系统来监控和分析网络。我在互联网上做了几项研究,得出的技术很少:

  • 用于实时处理:logstash、storm和apache流媒体
  • 用于存储:elasticsearch
  • 用于分析:ApacheSpark over Hadoop(我将使用ES Hadoop连接Elasticsearch)
  • 对于数据可视化:kibana、D3js、c3js
然而,logstash并不经常被称为火花流和风暴。我在互联网上发现了下图所示的架构:

我有两个问题:

  • 我不明白为什么logstash不常被提及为真正的tim处理系统,比如spark streaming和storm。主要原因是什么?我一直在用它,它很强大

  • 关于分析部分,我可以在该配置中使用机器学习库吗

  • Logstash不是群集流处理系统。它只是一个基于JVM的进程。最新版本支持磁盘缓冲区,但没有与Spark或Storm几乎相同的交付保证。看看
  • 是的,但不确定为什么首先使用弹性存储数据。为什么不HDFS->SparkML->Elastic?这里要考虑的主要问题是管理模型、培训和测试

  • 也许我的问题不清楚,但我想问的是,在spark streaming和storm方面,不选择logstash的主要原因是什么?我很难回答这个问题,因为我在网上找不到任何比较。再次感谢你。