Java Spark多会话与共享全局会话 问题:
创建多个Spark应用程序/会话而不是共享全局会话的动机是什么 解释 您有Spark独立群集管理器 群集:Java Spark多会话与共享全局会话 问题:,java,apache-spark,configuration,architecture,distributed-computing,Java,Apache Spark,Configuration,Architecture,Distributed Computing,创建多个Spark应用程序/会话而不是共享全局会话的动机是什么 解释 您有Spark独立群集管理器 群集: 5台机器 2个核心(执行器)每个=总共10个执行器 每台机器16 GB RAM 工作: 转储数据库,需要所有(10)个执行器,但每个执行器上只有1 GB RAM 处理转储结果,需要5个执行器,每个执行器具有8-16 GB RAM 快速数据检索任务,5个执行器,每个执行器具有1 GB RAM 等 哪种解决方案是最佳实践?如果集群的资源保持不变,为什么我更喜欢第一个解决方案而不是第二个
- 5台机器
- 2个核心(执行器)每个=总共10个执行器
- 每台机器16 GB RAM
- 转储数据库,需要所有(10)个执行器,但每个执行器上只有1 GB RAM
- 处理转储结果,需要5个执行器,每个执行器具有8-16 GB RAM
- 快速数据检索任务,5个执行器,每个执行器具有1 GB RAM
- 等
minShare
)上配置内核数,但不能配置每个执行器的内存