Datastax hadoop节点基础

Datastax hadoop节点基础,hadoop,cassandra,datastax-enterprise,datastax,Hadoop,Cassandra,Datastax Enterprise,Datastax,我正在尝试在datastax企业集群中设置一些hadoop节点和一些cassandra节点。在这一点上,有两件事我并不清楚。我需要多少hadoop节点?是相同数量的cassandra节点吗?数据是否仍然存在于cassandra节点上?第二,教程提到我应该在hadoop节点上禁用Vnode。我仍然可以在集群中的cassandra节点上使用VNode吗?多谢各位 在Datastax Enterprise中,您可以在同时运行Cassandra的节点上运行Hadoop。最常见的部署是创建两个数据中心(节

我正在尝试在datastax企业集群中设置一些hadoop节点和一些cassandra节点。在这一点上,有两件事我并不清楚。我需要多少hadoop节点?是相同数量的cassandra节点吗?数据是否仍然存在于cassandra节点上?第二,教程提到我应该在hadoop节点上禁用Vnode。我仍然可以在集群中的cassandra节点上使用VNode吗?多谢各位

在Datastax Enterprise中,您可以在同时运行Cassandra的节点上运行Hadoop。最常见的部署是创建两个数据中心(节点的逻辑分组)。一个数据中心用于分析,包含同时运行Hadoop和C*的计算机,另一个数据中心仅用于C*并为集群的OLTP功能提供服务器。Analytics节点上的C*进程连接到集群的其余部分(与任何其他C*节点一样),并在写入变异时接收更新,以便最终与数据库的其余部分保持一致。数据同时存在于这些节点和集群中的其他节点上。同样,大多数人最终会使用NetworkTopologyStrategy的复制模式,该模式在他们的C*only DC中指定了多个副本,在他们的Analytics DC中指定了一个副本,但您的用例可能会有所不同。两个数据中心中的节点数不必相等


对于第二个问题,是的,您可以在仅C*数据中心中启用VNode。此外,如果批处理作业的大小非常大,您还可以在analytics Datacenter中运行vnodes,而性能只会受到轻微影响。同样,这完全基于您的用例。如果您想要更多更快、更短的分析作业,则不希望在分析数据中心中启用VNode

在Datastax Enterprise中,您可以在同时运行Cassandra的节点上运行Hadoop。最常见的部署是创建两个数据中心(节点的逻辑分组)。一个数据中心用于分析,包含同时运行Hadoop和C*的计算机,另一个数据中心仅用于C*并为集群的OLTP功能提供服务器。Analytics节点上的C*进程连接到集群的其余部分(与任何其他C*节点一样),并在写入变异时接收更新,以便最终与数据库的其余部分保持一致。数据同时存在于这些节点和集群中的其他节点上。同样,大多数人最终会使用NetworkTopologyStrategy的复制模式,该模式在他们的C*only DC中指定了多个副本,在他们的Analytics DC中指定了一个副本,但您的用例可能会有所不同。两个数据中心中的节点数不必相等

对于第二个问题,是的,您可以在仅C*数据中心中启用VNode。此外,如果批处理作业的大小非常大,您还可以在analytics Datacenter中运行vnodes,而性能只会受到轻微影响。同样,这完全基于您的用例。如果您想要更多更快、更短的分析作业,则不希望在分析数据中心中启用VNode