Hadoop 问:HPX与'如何公平竞争;apache云计算&x27;(例如vs spark)?

Hadoop 问:HPX与'如何公平竞争;apache云计算&x27;(例如vs spark)?,hadoop,apache-spark,apache-flink,hpx,Hadoop,Apache Spark,Apache Flink,Hpx,我一直认为HPX()是使应用程序更具可伸缩性的一种潜在机制 我认为HPX主要针对(并因此针对)HPC社区,这些社区通常有 具有许多代码的节点之间具有快速互连。 parallelX模型不需要这样做,但由于节点之间传递数据的成本较高,您的性能当然会降低 另一方面,我们有一套Java框架,包括hadoop、spark和flink。这些来自商业社区,解决不同种类的工作负载 P>如果你在它们之间选择(忽略C++ vsjava火焰大战),那里面有什么? 如果纯粹基于性能考虑,它们在管理费用方面如何比较 当

我一直认为HPX()是使应用程序更具可伸缩性的一种潜在机制

我认为HPX主要针对(并因此针对)HPC社区,这些社区通常有 具有许多代码的节点之间具有快速互连。 parallelX模型不需要这样做,但由于节点之间传递数据的成本较高,您的性能当然会降低

另一方面,我们有一套Java框架,包括hadoop、spark和flink。这些来自商业社区,解决不同种类的工作负载

<> P>如果你在它们之间选择(忽略C++ vsjava火焰大战)

,那里面有什么? 如果纯粹基于性能考虑,它们在管理费用方面如何比较

当然,这在很大程度上取决于你试图解决的问题类型。
我想更好地理解这种权衡。

目前,HPX还没有被使用或适应云类型的场景。我们曾考虑对其进行调整,但没有实施任何措施。这是可能的(原则上,正如您所指出的那样)。

这真的不是什么问题……我想这是因为我正在考虑是否使用HPX或Spark开发应用程序。你还会问别的什么地方?我想可能是个好地方。你可以试试,但我敢肯定它不符合标准。奎拉,你疯了吗!我想乔尔会爬进棺材里翻身这就是我的想法:)说真的,尽管StackExchange网站在内容方面非常固执己见,但Spark有用户列表,ste | | ar有irc频道。考虑到有6个问题,包括你用hpx标记的问题,我有点怀疑你能否在这里得到你的答案,即使它不会被否决和删除。我明白了。因此,我想还没有人尝试过对事物进行比较。你的团队想要什么样的调整?它主要是为了优化节点之间的慢速互连,还是涉及到更基本的东西?首先,我们需要创建一个特殊的网络层(例如在WebSocket之上)。一些额外的安全考虑也将适用。我想其他一切都取决于应用程序。我不清楚为什么需要基于WebSocket的层。正常使用unix套接字和TCP有什么问题?是为了避免手动打开防火墙中的端口吗?我看这是有道理的。是的,主要是防火墙问题。安全是另一个问题。