Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/arrays/14.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Performance 20万行/秒Clickhouse的最大性能是多少?_Performance_Clickhouse - Fatal编程技术网

Performance 20万行/秒Clickhouse的最大性能是多少?

Performance 20万行/秒Clickhouse的最大性能是多少?,performance,clickhouse,Performance,Clickhouse,我正在测试Clickhouse插入性能,到目前为止,我能够每秒插入超过20万行。对我来说,这很好。然而,我看到系统利用率不是很高,我想知道我是否可以推动更多 CH是一台服务器,具有双xxx 14核@2.4 GHz、56个vCPU和256GB内存。并在1小时10分钟内插入1B行。在那期间我看到 平均载荷:23.68、22.44、20.32 %Cpu:2.93US,0.54SY,0.14Ni,95.3ID,0.96WA,0.05HI,0.09Si,0ST clickhouse服务(%CPU,RES

我正在测试Clickhouse插入性能,到目前为止,我能够每秒插入超过20万行。对我来说,这很好。然而,我看到系统利用率不是很高,我想知道我是否可以推动更多

CH是一台服务器,具有双xxx 14核@2.4 GHz、56个vCPU和256GB内存。并在1小时10分钟内插入1B行。在那期间我看到

  • 平均载荷:23.68、22.44、20.32
  • %Cpu:2.93US,0.54SY,0.14Ni,95.3ID,0.96WA,0.05HI,0.09Si,0ST
  • clickhouse服务(%CPU,RES):134.3%,25.6g
以上数字为每5秒“顶部”的平均值。 我观察到clickhouse服务器“%CPU使用率从未超过200%,似乎存在硬限制

  • CH版本:21.2.2.8
  • 引擎:带默认配置的缓冲区(合并树);无缓冲区,性能降低10%
  • 数据集:json格式,2608 B/行,150列
  • 每个插入:500K行,约为1.2GB
  • 使用来自不同服务器的clickhouse客户端插入20个进程
  • 500K行/插入和20个客户端提供最佳性能(我尝试了不同的数字)
  • Linux 4.18.x(红帽)
问题:

  • 每个CH服务器的最大行数是否为每秒20万行(或CPU使用率为%200)?如果没有,我如何改进
  • 我可以在一台服务器中有多个CH服务器实例吗?它是否实用并提供更好的性能
如果clickhouse服务器端没有特定限制(或者我做错了什么),我将检查是否有其他人可以对应用程序(clickhouse服务器)施加此类限制

提前谢谢

数据集:json格式,2608 B/行,150列 使用来自不同服务器的clickhouse客户端插入20个进程


在这种情况下,
clickhouse-client
解析JSON,在不同的服务器上CPU利用率可能为100%。您需要更多的插入节点来解析JSON。

感谢Denny的输入。这有帮助,但不多。当客户端数量达到一定数量时,clickhouse服务器会通过例外情况:“部件太多”。这表明服务器无法跟上输入。无论如何,我看到clickhouse服务器从未使用超过200%的CPU,就好像存在硬限制一样。如果clickhouse服务器端没有特定的限制(或者我做错了什么),我将检查是否有其他人可以对应用程序施加此类限制。谢谢你,丹尼。关于“500K行/秒”的好总结。我不想牺牲“选择”的性能,所以我将跳过“部件到插入”的实验。在本文中,它说,“速度将从每秒50000到200000行”。文章说,当行的大小变小时,我们每秒可以得到更多的行。如果我将数据集转换为TSV,大小为1K,与文章的数据集大小相同。综合所有这些因素,我的情况下,每秒大约20万行似乎是最大的;可能会有更多不同的调整,但并不显著。对于具有多个CH服务器实例: