File cassandra打开的文件太多
我在两个节点(File cassandra打开的文件太多,file,sockets,cassandra,File,Sockets,Cassandra,我在两个节点(A和B)集群上使用了cassandra 0.6.5 Hector用于客户端 一个节点A在运行一段时间后总是会出现打开的文件过多异常。 我在节点上运行netstat。 它显示了大量的CLOSE\u WAITtcp连接 这是例外的罪魁祸首。 然而,是什么导致如此多的关闭\u等待连接, 是客户端的问题吗 为什么另一个节点B没有此问题 不要使用netstat,试试lsof-n | grep java。这里列出了多少个文件描述符(您可以使用lsof-n | grep java | wc-l获
A
和B
)集群上使用了cassandra 0.6.5
Hector
用于客户端
一个节点A
在运行一段时间后总是会出现打开的文件过多异常。
我在节点上运行netstat
。
它显示了大量的CLOSE\u WAIT
tcp连接
这是例外的罪魁祸首。
然而,是什么导致如此多的关闭\u等待连接,
是客户端的问题吗
为什么另一个节点B
没有此问题 不要使用netstat,试试lsof-n | grep java
。这里列出了多少个文件描述符(您可以使用lsof-n | grep java | wc-l
获得计数)
。您可以通过ulimit或在/etc/security/limits.conf中进行更改。Datastax建议进行以下更改:
echo "* soft nofile 32768" | sudo tee -a /etc/security/limits.conf
echo "* hard nofile 32768" | sudo tee -a /etc/security/limits.conf
echo "root soft nofile 32768" | sudo tee -a /etc/security/limits.conf
echo "root hard nofile 32768" | sudo tee -a /etc/security/limits.conf
debian软件包设置以下值:
# Provided by the cassandra package
cassandra - memlock unlimited
cassandra - nofile 100000
我还强烈建议您升级到Cassandra的最新版本 不要使用netstat,试试lsof-n | grep java
。这里列出了多少个文件描述符(您可以使用lsof-n | grep java | wc-l
获得计数)
。您可以通过ulimit或在/etc/security/limits.conf中进行更改。Datastax建议进行以下更改:
echo "* soft nofile 32768" | sudo tee -a /etc/security/limits.conf
echo "* hard nofile 32768" | sudo tee -a /etc/security/limits.conf
echo "root soft nofile 32768" | sudo tee -a /etc/security/limits.conf
echo "root hard nofile 32768" | sudo tee -a /etc/security/limits.conf
debian软件包设置以下值:
# Provided by the cassandra package
cassandra - memlock unlimited
cassandra - nofile 100000
我还强烈建议您升级到Cassandra的最新版本 我已经将ulimit设置为20000。lsof显示有超过20000个文件描述符。其中有多少是网络连接lsof-n-i | grep java | wc-l
在升级到更高版本时得到了支持-Cassandra现在的版本是1.0.7I,刚刚检查过。我早上重启机器。现在lsof
显示有7029个打开的文件。从netstat
,有6865个CLOSE\u WAIT
TCP连接。如果你坚持使用0.6,至少升级到该系列的最新版本(0.6.13),它将一直增加,直到达到20000的阈值。如果在早期的0.6版本中存在压缩上的fd泄漏,我不会感到惊讶。。。然而,要注意的是,0.6在这一点上已经过时了,而且许多较新的文档不适用于这一点。我已经将ulimit设置为20000。lsof显示有超过20000个文件描述符。其中有多少是网络连接lsof-n-i | grep java | wc-l
在升级到更高版本时得到了支持-Cassandra现在的版本是1.0.7I,刚刚检查过。我早上重启机器。现在lsof
显示有7029个打开的文件。从netstat
,有6865个CLOSE\u WAIT
TCP连接。如果你坚持使用0.6,至少升级到该系列的最新版本(0.6.13),它将一直增加,直到达到20000的阈值。如果在早期的0.6版本中存在压缩上的fd泄漏,我不会感到惊讶。。。然而,要注意的是,0.6在这一点上已经过时,并且许多较新的文档不适用于此。