管理couchbase上的加载和超时

管理couchbase上的加载和超时,couchbase,Couchbase,我有一个couchbase集群,有4台主机(4个CPU,32 GB ram) 该集群由数千个从中获取数据的进程使用。我在集群上有8K个永久连接(来自couchbase ui的数据) couchbase使用的带宽是每台主机50MB/s来发送数据(看起来不是很重) 但我得到客户端超时。大约每秒4次,我不明白为什么 我将somaxconn和tcp_syn_backlog设置为每台主机2048个,但这并没有改变什么 你知道吗 根据评论编辑: 我的客户有这样的日志: Couchbase错误,以非阻塞模式传

我有一个couchbase集群,有4台主机(4个CPU,32 GB ram)

该集群由数千个从中获取数据的进程使用。我在集群上有8K个永久连接(来自couchbase ui的数据)

couchbase使用的带宽是每台主机50MB/s来发送数据(看起来不是很重)

但我得到客户端超时。大约每秒4次,我不明白为什么

我将somaxconn和tcp_syn_backlog设置为每台主机2048个,但这并没有改变什么

你知道吗

根据评论编辑:

我的客户有这样的日志:

Couchbase错误,以非阻塞模式传递(EXC: Key=u'fieldmetadata',RC=0x17[客户端超时 超出操作限制。请检查网络状况或增加 超时],操作错误,结果=1,C Source=(src/multiresult.c,316),跟踪 输出={“fieldmetadata”:{“i”:15890195098182236653, “s”:“kv:未知”,“b”:“MetaDataV3”,“r”: “ltg-aus-couchbase-3:11210”,“t:2500000}>)

我的集群中有3个节点。所有客户端和群集都位于Azure VM上。

Kiva,根据

能否在您的环境中设置LCB_LOGLEVEL=5(即作为环境变量)并重新运行代码。。。这可能有助于揭示更多有关它超时原因的信息。

Kiva,根据


能否在您的环境中设置LCB_LOGLEVEL=5(即作为环境变量)并重新运行代码。。。这可能有助于揭示有关超时原因的更多信息。

您使用的是哪种语言、哪种版本的Couchbase Server和SDK?你能从应用程序发布调试日志吗?FWIW,如果是Java…a)升级SDk,b)检查垃圾收集暂停。这是两种最常见的超时解决方案。不是说没有其他的,只是很容易排除它们。它与python一起使用。Couchbase 5.5服务器和Couchbase==2.5.8对于pythonOkay,我们仍然需要更多的信息来帮助调试…您有来自客户端的日志吗?还要确保在多个线程中尽可能多地使用同一个客户机对象,而不是不断地创建和销毁它。您使用的是哪种python框架?此外,8k连接本身并不表示存在问题,但这是否与您有多少应用程序实例相匹配?超时可以是客户端、网络或服务器……排除这种情况的一种快速方法是捕获数据包并查找超时的请求。到达服务器需要多长时间,响应需要多长时间,等等。如果它到达服务器后很长时间没有返回,我们可以调查服务器性能…如果它到达服务器后很快返回,我们可以调查SDK/应用程序。您使用的是哪种语言、哪种版本的Couchbase服务器和SDK?你能从应用程序发布调试日志吗?FWIW,如果是Java…a)升级SDk,b)检查垃圾收集暂停。这是两种最常见的超时解决方案。不是说没有其他的,只是很容易排除它们。它与python一起使用。Couchbase 5.5服务器和Couchbase==2.5.8对于pythonOkay,我们仍然需要更多的信息来帮助调试…您有来自客户端的日志吗?还要确保在多个线程中尽可能多地使用同一个客户机对象,而不是不断地创建和销毁它。您使用的是哪种python框架?此外,8k连接本身并不表示存在问题,但这是否与您有多少应用程序实例相匹配?超时可以是客户端、网络或服务器……排除这种情况的一种快速方法是捕获数据包并查找超时的请求。到达服务器需要多长时间,响应需要多长时间,等等。如果它到达服务器后很长时间没有返回,我们可以调查服务器性能…如果它到达服务器后很快返回,我们可以调查SDK/应用程序。