MongoDB初始同步反复失败(Azure VM上Ubuntu 16.04上的MongoDB 3.2) 我有一个单成员mongod实例(Server1),它有一个非常大的DB,包含250万个文档(每个文档都非常大)和4个索引 然后,我将另一台机器(Server2)添加到此副本集中。Server2上的Mongod大约需要5个小时才能获取这个大型数据库中的所有文档

MongoDB初始同步反复失败(Azure VM上Ubuntu 16.04上的MongoDB 3.2) 我有一个单成员mongod实例(Server1),它有一个非常大的DB,包含250万个文档(每个文档都非常大)和4个索引 然后,我将另一台机器(Server2)添加到此副本集中。Server2上的Mongod大约需要5个小时才能获取这个大型数据库中的所有文档,mongodb,azure,ubuntu-server,mongodb-replica-set,Mongodb,Azure,Ubuntu Server,Mongodb Replica Set,Server2获取所有文档后,它开始制作二级索引。完成索引大约需要3个小时 在完成构建二级索引之后,它立即尝试连接到主索引,并发现套接字已过期并超时 在收到超时错误后,它(Server2)会简单地删除所有数据库并再次启动初始同步 日志中的代码段如下所示: 尝试同步此副本集非常令人沮丧。它一次又一次地进行初始同步。非常感谢您的帮助 在诊断出问题之前,您可以将此作为一种解决方法: 服务器配置是什么?数据的大小是多少?副本集中有多少成员?服务器配置?默认值非常标准。造成问题的DB本身的大小约为

Server2获取所有文档后,它开始制作二级索引。完成索引大约需要3个小时

  • 在完成构建二级索引之后,它立即尝试连接到主索引,并发现套接字已过期并超时
  • 在收到超时错误后,它(Server2)会简单地删除所有数据库并再次启动初始同步

  • 日志中的代码段如下所示:

  • 尝试同步此副本集非常令人沮丧。它一次又一次地进行初始同步。非常感谢您的帮助

在诊断出问题之前,您可以将此作为一种解决方法:


服务器配置是什么?数据的大小是多少?副本集中有多少成员?服务器配置?默认值非常标准。造成问题的DB本身的大小约为200GB。副本集中有3个成员。一个主服务器和剩下的两个无法从STARTUP2升级到辅助服务器。在同一时间段内,从它所从的服务器上查看日志会很有帮助。
2016-05-25T11:50:36.053+0000 I -        [rsSync]   Index Build: 2211700/2215091 99%
2016-05-25T11:50:39.221+0000 I -        [rsSync]   Index Build: 2212000/2215091 99%
2016-05-25T11:50:43.300+0000 I -        [rsSync]   Index Build: 2212300/2215091 99%
2016-05-25T11:50:46.103+0000 I -        [rsSync]   Index Build: 2212500/2215091 99%
2016-05-25T11:50:49.068+0000 I -        [rsSync]   Index Build: 2212800/2215091 99%
2016-05-25T11:50:52.218+0000 I -        [rsSync]   Index Build: 2213600/2215091 99%
2016-05-25T11:50:55.439+0000 I -        [rsSync]   Index Build: 2214500/2215091 99%
2016-05-25T11:50:58.738+0000 I -        [rsSync]   Index Build: 2214700/2215091 99%
2016-05-25T11:51:13.223+0000 I -        [rsSync]   Index: (2/3) BTree Bottom Up Progress: 536600/2215091 24%
2016-05-25T11:51:23.285+0000 I -        [rsSync]   Index: (2/3) BTree Bottom Up Progress: 1984500/2215091 89%
2016-05-25T11:51:24.317+0000 I INDEX    [rsSync]   done building bottom layer, going to commit
2016-05-25T11:51:24.508+0000 I INDEX    [rsSync] build index done.  scanned 2215091 total records. 10491 secs
2016-05-25T11:51:25.082+0000 I NETWORK  [rsSync] Socket say send() errno:110 Connection timed out xx.xx.xx.xx:27017
2016-05-25T11:51:25.106+0000 E REPL     [rsSync] 9001 socket exception [SEND_ERROR] server [xx.xx.xx.xx:27017] 
2016-05-25T11:51:25.106+0000 E REPL     [rsSync] initial sync attempt failed, 9 attempts remaining
2016-05-25T11:51:30.106+0000 I REPL     [rsSync] initial sync pending
2016-05-25T11:51:30.433+0000 I REPL     [ReplicationExecutor] syncing from: xx.xx.xx.xx:27017
2016-05-25T11:51:30.563+0000 I REPL     [rsSync] initial sync drop all databases
2016-05-25T11:51:30.564+0000 I STORAGE  [rsSync] dropAllDatabasesExceptLocal 42
2016-05-25T11:51:31.925+0000 I JOURNAL  [rsSync] journalCleanup...
2016-05-25T11:51:31.925+0000 I JOURNAL  [rsSync] removeJournalFiles
2016-05-25T11:51:32.331+0000 I JOURNAL  [rsSync] journalCleanup...
2016-05-25T11:51:32.332+0000 I JOURNAL  [rsSync] removeJournalFiles
2016-05-25T11:51:32.489+0000 I JOURNAL  [rsSync] journalCleanup...
2016-05-25T11:51:32.489+0000 I JOURNAL  [rsSync] removeJournalFiles