Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/ant/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache flink Hazelcast Jet和Apache Flink之间有什么区别_Apache Flink_Hazelcast Jet - Fatal编程技术网

Apache flink Hazelcast Jet和Apache Flink之间有什么区别

Apache flink Hazelcast Jet和Apache Flink之间有什么区别,apache-flink,hazelcast-jet,Apache Flink,Hazelcast Jet,更具体地说,Hazelcast Jet解决了Flink无法解决的哪些用例(同样好),反之亦然?注:我属于Hazelcast Jet的核心工程团队 我想说,Hazelcast Jet的主要优势不在于提供一种全新的计算模型,而在于为基于DAG的分布式计算领域带来与Hazelcast相同的便利性 如果您当前有一个Java应用程序在集群中运行,那么添加Jet将是一个简单的过程:添加Maven依赖项并编写一行代码在本地成员上启动Jet实例。实例将自我发现以形成自己的集群,您现在可以向其提交作业 如果您想

更具体地说,Hazelcast Jet解决了Flink无法解决的哪些用例(同样好),反之亦然?

注:我属于Hazelcast Jet的核心工程团队


我想说,Hazelcast Jet的主要优势不在于提供一种全新的计算模型,而在于为基于DAG的分布式计算领域带来与Hazelcast相同的便利性

如果您当前有一个Java应用程序在集群中运行,那么添加Jet将是一个简单的过程:添加Maven依赖项并编写一行代码在本地成员上启动Jet实例。实例将自我发现以形成自己的集群,您现在可以向其提交作业

如果您想要一个专用的分布式计算集群,可以将分发ZIP下载到集群计算机。Jet对最流行的云环境具有本机支持,允许您开始自我发现节点。然后,您可以使用Jet客户端连接到集群

不用说,Jet使得使用Hazelcast
IMap
IList
作为数据源非常方便。射流群可以直接承载Hazelcast结构;然后,您将受益于数据局部性,并在没有网络流量的情况下获得数据。另一方面,数据源的选择是完全不受限制的,并且有专门用于实现快速、任意分区的自定义数据源的公共API

Jet解决了无限流处理的问题,如在基于时间的窗口上聚合、处理重新排序的事件和对集群拓扑变化的恢复能力(例如,单个Jet节点的故障),同时保持一次处理的保证

Jet的主要编程范例是管道API,它与
java.util.stream
API非常相似,但适合于分布式计算的具体情况(lambda序列化和其他关注点)


管道API建立在一个较低级别的基于DAG的模型之上,该模型也作为公共API公开。

在我看来,flink似乎提供了一些非常有用的流媒体功能,而hatecast jet尚未提供这些功能

  • 不同的灵活窗口操作员,wich还可以处理无序和迟到的项目
  • 集群的容错性和交付保证
除此之外,目前它似乎也更加稳定和知名。 例如,您可以将其用作ApacheBeam的运行时,然后在云上的Google数据流和您自己的部署之间轻松迁移。 所以我现在会使用flink


Best

那么你可以说,推出Jet的主要动机是提供一种比Flink更易于使用的工具,而且其计划的功能集与当前市场重叠?或者您会说Jet是一个“轻量级”解决方案,适用于不需要与现有解决方案相同功能的应用程序?由于Jet即将发布4.0版,我再次讨论了这个问题。我要说的是,Jet正在通过受支持的功能集开辟自己的道路。有许多源/汇连接器与不同的外部系统交互;对流连接和窗口聚合有可靠的支持;当前关注的一个用例是将跨语言ML模型部署到分布式流媒体管道。