mongodb 复制集运维遇到的问题-天翼云

mongodb 复制集运维遇到的问题

2023-06-14 09:14:23 阅读次数：98

root couse：对MongoDB复制集的认识不足

机器环境：

192.168.12.6 master状态

192.168.12.4 secondary状态

192.168.12.5 secondary状态

192.168.2.1 dump节点，之前因为磁盘不足，mongodb进程已宕机，这个实例也配置有vote投票权！

过程：

1、DBA在 192.168.12.5 这个 secondary节点上，执行了关闭实例命令

2、集群剩余的2台主机：192.168.12.4(secondary) 、192.168.12.6(master) ，都变成了secondary状态

3、业务反馈大量报错

4、DBA恢复 192.168.12.5 上面的mongodb进程，集群状态恢复

复盘：

下面的日志，是在 192.168.12.6 主节点上面看到的：

2019-04-16T15:47:14.196+0800 I ASIO [NetworkInterfaceASIO-Replication-0] Failed to connect to 192.168.12.5:27017 - HostUnreachable: Connection reset by peer

2019-04-16T15:47:14.196+0800 I ASIO [NetworkInterfaceASIO-Replication-0] Dropping all pooled connections to 192.168.12.5:27017 due to failed operation on a connection

2019-04-16T15:47:14.196+0800 I ASIO [NetworkInterfaceASIO-Replication-0] Failed to close stream: Transport endpoint is not connected

2019-04-16T15:47:14.196+0800 I REPL [ReplicationExecutor] Error in heartbeat request to 192.168.12.5:27017; HostUnreachable: Connection reset by peer

2019-04-16T15:47:14.196+0800 I ASIO [NetworkInterfaceASIO-Replication-0] Connecting to 192.168.12.5:27017

2019-04-16T15:47:14.196+0800 I ASIO [NetworkInterfaceASIO-Replication-0] Failed to connect to 192.168.12.5:27017 - HostUnreachable: Connection refused

2019-04-16T15:47:14.196+0800 I ASIO [NetworkInterfaceASIO-Replication-0] Dropping all pooled connections to 192.168.12.5:27017 due to failed operation on a connection

2019-04-16T15:47:14.196+0800 I REPL [ReplicationExecutor] Error in heartbeat request to 192.168.12.5:27017; HostUnreachable: Connection refused

2019-04-16T15:47:14.197+0800 I REPL [ReplicationExecutor] can't see a majority of the set, relinquishing primary

2019-04-16T15:47:14.197+0800 I REPL [ReplicationExecutor] Stepping down from primary in response to heartbeat

2019-04-16T15:47:14.198+0800 I REPL [replExecDBWorker-0] transition to SECONDARY

2019-04-16T15:47:14.274+0800 I NETWORK [conn476944080] SocketException handling request, closing client connection: 9001 socket exception [SEND_ERROR] server [192.168.3.11:38712]

集群的配置如下：

set01:SECONDARY> rs.conf()

{

"_id" : "set01",

"version" : 130099,

"members" : [

{

"_id" : 6,

"host" : "192.168.2.1:27017",

"arbiterOnly" : false,

"buildIndexes" : true,

"hidden" : true,

"priority" : 0,

"tags" : {

"dc" : "IDC1",

"role" : "dump"

"slaveDelay" : NumberLong(0),

"votes" : 1

{

"_id" : 7,

"host" : "192.168.12.4:27017",

"arbiterOnly" : false,

"buildIndexes" : true,

"hidden" : false,

"priority" : 1,

"tags" : {

"dc" : "IDC1"

"slaveDelay" : NumberLong(0),

"votes" : 1

{

"_id" : 8,

"host" : "192.168.12.5:27017",

"arbiterOnly" : false,

"buildIndexes" : true,

"hidden" : false,

"priority" : 1,

"tags" : {

"dc" : "IDC1"

"slaveDelay" : NumberLong(0),

"votes" : 1

{

"_id" : 9,

"host" : "192.168.12.6:27017",

"arbiterOnly" : false,

"buildIndexes" : true,

"hidden" : false,

"priority" : 1,

"tags" : {

"dc" : "IDC1"

"slaveDelay" : NumberLong(0),

"votes" : 1

}

"settings" : {

"chainingAllowed" : true,

"heartbeatIntervalMillis" : 2000,

"heartbeatTimeoutSecs" : 10,

"electionTimeoutMillis" : 10000,

"getLastErrorModes" : {

"getLastErrorDefaults" : {

"w" : 1,

"wtimeout" : 0

}

根据上面的内容，可以判断出 192.168.2.1宕机后，我们再次关闭一台192.168.12.5后，集群就剩2个投票，少于一半节点，整个集群无法选举出Primary，集群退化为只读状态【表现为rs.status()看到的都是secondary角色】因此，通常建议将复制集成员数量设置为奇数。

解决措施：

将dump节点的投票属性去掉。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

mongodb 复制集 运维 遇到的问题

mongodb 复制集 运维 遇到的问题

相关文章

按天备份mongodb的数据

【mongodb基础-5】A Guide to MongoDB with Java

【mongodb基础-6】mongodb query in java

mongodb集群搭建

mongodb副本集搭建

加密组件Jasypt学习、实战及踩坑记录

Python操作MongoDB入门四：删除数据

MongoDB中间件工具mgm入门介绍（二）

三分钟安装 mongo 环境

python 在Centos6下部署Mongodb数据库

作者介绍

最新文章

MongoDB数据库远程配置详解

前后端分离之上线MongoDB【宝塔+falsk+MongoDB】

Linux MongoDB配置外网访问

如何将 winston log 库记录的日志写入 mongo DB 数据库

Ubuntu系统中mongodb的安装

Linux系统中安装MongoDB详解（Debian系统、Ubuntu系统）

热门文章

Ubuntu系统中mongodb的安装

前后端分离之上线MongoDB【宝塔+falsk+MongoDB】

Linux MongoDB配置外网访问

如何将 winston log 库记录的日志写入 mongo DB 数据库

Linux系统中安装MongoDB详解（Debian系统、Ubuntu系统）

MongoDB数据库远程配置详解

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

MongoDB数据库远程配置详解

Ubuntu系统中mongodb的安装

Linux MongoDB配置外网访问

Linux系统中安装MongoDB详解（Debian系统、Ubuntu系统）

前后端分离之上线MongoDB【宝塔+falsk+MongoDB】

如何将 winston log 库记录的日志写入 mongo DB 数据库

mongodb 复制集运维遇到的问题

mongodb 复制集运维遇到的问题