Hadoop HBase区域服务器与数据节点的数量

Hadoop HBase区域服务器与数据节点的数量,hadoop,hbase,cloudera,Hadoop,Hbase,Cloudera,在与Hadoop HDFS一起配置HBase群集时,每个HDFS数据节点部署一个区域服务器是一个不错的选择,还是区域服务器和数据节点之间的比率应该不同于1:1?您可以使用任何想要的比率,但经验法则是1:1。RS的区域越少越好,RS越多意味着每台服务器的区域越少,如果节点出现故障,需要重新分配的区域越少,这将提高恢复时间(虽然从0.95开始有了很大的进步:)一台区域服务器与每台服务器配置一个数据节点在这种情况下复制因子3是否重要?复制由HDFS而不是HBASe处理。由于hbase将其文件存储在HD

在与Hadoop HDFS一起配置HBase群集时,每个HDFS数据节点部署一个区域服务器是一个不错的选择,还是区域服务器和数据节点之间的比率应该不同于1:1?

您可以使用任何想要的比率,但经验法则是1:1。RS的区域越少越好,RS越多意味着每台服务器的区域越少,如果节点出现故障,需要重新分配的区域越少,这将提高恢复时间(虽然从0.95开始有了很大的进步:)

一台区域服务器与每台服务器配置一个数据节点在这种情况下复制因子3是否重要?复制由HDFS而不是HBASe处理。由于hbase将其文件存储在HDFS上,因此数据将被复制。这是正常的hadoop行为意味着。。。在高负载条件下,如果复制因子为3,则每个数据节点将同时从3个区域服务器获得写入。它会影响选择吗?是的,如果复制因子为3,数据将写入3个数据节点。不确定您询问的是什么“选择”,但不妨看看hbase最常见的写吞吐量问题的“热点”。还可以看看批量装载