其中一个节点上的Cassandra负载较高
我有一个8节点的Cassandra集群(Cassandra 2.0.8)。当我使用nodetool运行status时,我看到了以下内容。我是一个新手,想知道为什么其中一个节点(该节点是我的初始种子节点)的负载比其他节点高 我还注意到,当我尝试使用PIG将数据推入Cassandra表(列族)时,一个节点使用非常高的CPU(95%+),而其他节点则没有(20-30%)其中一个节点上的Cassandra负载较高,cassandra,cassandra-2.0,Cassandra,Cassandra 2.0,我有一个8节点的Cassandra集群(Cassandra 2.0.8)。当我使用nodetool运行status时,我看到了以下内容。我是一个新手,想知道为什么其中一个节点(该节点是我的初始种子节点)的负载比其他节点高 我还注意到,当我尝试使用PIG将数据推入Cassandra表(列族)时,一个节点使用非常高的CPU(95%+),而其他节点则没有(20-30%) 感谢您的帮助。谢谢。您提到您正在通过PIG推送数据。如果是这样,您是否使用Cassandra的Hadoop支持 如果是,很可能是您的
感谢您的帮助。谢谢。您提到您正在通过PIG推送数据。如果是这样,您是否使用Cassandra的Hadoop支持
如果是,很可能是您的拆分导致了这种情况。您的复制因子是什么?包含大部分负载的表的定义是什么?如何管理(或生成)分区键?复制因子1和我的表定义与创建表emp一样简单(empID int,deptID int,first_name varchar,last_name varchar,主键(empID,deptID));我想我使用的是默认分区,我相信是3个分区。我没有公布答案,因为我不确定它是否足够,请更改复制因子,如果它仍然为1,则每个记录只有一个副本,并且将存储在单个节点上
Note: Ownership information does not include topology; for complete information, specify a keyspace
Datacenter: datacenter1
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
-- Address Load Tokens Owns Host ID Rack
UN xxx.xxx.xx.xxx 15.55 MB 256 6.2% ------------------------------------ rack1
UN xxx.xxx.xx.xxx 36.89 MB 256 6.2% ------------------------------------ rack1
UN xxx.xxx.xx.xxx 3.77 GB 256 6.2% ------------------------------------ rack1
UN xxx.xxx.xx.xxx 1.04 GB 256 56.2% ------------------------------------ rack1
UN xxx.xxx.xx.xxx 43.49 MB 256 6.2% ------------------------------------ rack1
UN xxx.xxx.xx.xxx 40.36 MB 256 6.2% ------------------------------------ rack1
UN xxx.xxx.xx.xxx 43.69 MB 256 6.2% ------------------------------------ rack1
UN xxx.xxx.xx.xxx 40.23 MB 256 6.2% ------------------------------------ rack1