Mysql Galera节点无法连接到群集

Mysql Galera节点无法连接到群集,mysql,mariadb,galera,Mysql,Mariadb,Galera,Hello am使用Galera和10.1.12-MariaDB,SST方法是xtrabackup-v2 请不要推荐SST=rsync,这对我不起作用 我有健康的群集8节点,有时一个或几个节点出现故障。 im刚刚服务mysql启动,他们成功连接到集群,一切正常 但有时,当断开连接的节点停机几天时,我无法将它们连接到集群 在尝试了几次imrm-fr/var/lib/mysql/*&rm-fr/var/log/mysql/*之后,他们在syslog中有以下消息: mysqld:[ERROR]Binl

Hello am使用Galera和10.1.12-MariaDB,SST方法是xtrabackup-v2

请不要推荐SST=rsync,这对我不起作用

我有健康的群集8节点,有时一个或几个节点出现故障。 im刚刚
服务mysql
启动,他们成功连接到集群,一切正常

但有时,当断开连接的节点停机几天时,我无法将它们连接到集群

在尝试了几次im
rm-fr/var/lib/mysql/*
&
rm-fr/var/log/mysql/*
之后,他们在syslog中有以下消息:

mysqld:[ERROR]Binlog文件'/var/log/mysql/mariadb bin.003079'未在Binlog索引中找到,需要恢复。正在中止。

我知道如何使用它,当我的节点无法通过上面的消息连接到集群时,我可以恢复集群,所以我这样做:

  • 关闭所有节点,只保留一个节点
  • 关闭最后一个节点并
    rm-fr/var/log/mysql/*
  • 使用已删除的binlog引导最后一个节点
  • 将其他节点连接到群集
    服务mysql start
  • 利润-一切正常
  • 但问题是:

    我不能关闭所有的生产节点,也不能关闭最后一个节点,因为我有8个节点来服务大的站点流量,当所有流量到达时,一个正在运行的节点立即关闭(当然是因为过载)

    问题是:


    请帮帮我。当节点无法连接且出现错误时,如何将节点连接到群集
    mysqld:[错误]Binlog文件'/var/log/mysql/mariadb bin.003079'未在Binlog索引中找到,需要进行恢复。正在中止。

    gcache有多大?控制IST是否可用于重新连接节点的

    expire\u log\u days
    的值是多少?它是否太小以至于在您尝试连接之前binlog丢失?如果你失去了一个,并且需要另一个SST,你仍然有6个来服务“大站点”。听起来您需要将部署增加到10个节点,以便处理站点,即使节点消失

    听起来你好像被SST困住了


    看看slowlog,看看是否有些查询花费了太长的时间,间接地迫使您拥有这么多的机器。修复几个查询比添加额外的机器要“便宜”得多。

    谢谢您的回答!!gcache.keep_pages_size=0 gcache.mem_size=0 gcache.page_size=128M gcache.size=128M expire_log_days=10当我遇到这个问题时,我必须停止所有macine来引导新集群,也许你知道如何用另一种方式来实现它?你等待的时间超过10天吗?如果没有,我希望SST可以工作。
    gcache.size
    是一个磁盘大小;考虑让它变大,这样你就可以持续更长的时间。(我怀疑其他gcache设置。)