心跳丢失造成RAC节点驱逐-天翼云

心跳丢失造成RAC节点驱逐

2024-06-13 08:12:14 阅读次数：41

赶上了迁库风，我们的一套再建生产业务库发生了主机重启，什么原因呢

[root@nqzeyddb2 ~]# uptime

15:42:46 up 5 days, 22:29, 4 users, load average: 0.08, 0.09, 0.10

alert日志里面没有明显告警，crs里面是有明显的超时告警的，怀疑是心跳网卡丢失造成脑裂进行的节点驱逐

2021-10-09 00:47:55.743: [ CSSD][580302592]clssnmPollingThread: node nqzeyddb1 (1) at 50% heartbeat fatal, removal in 14.910 seconds

2021-10-09 00:47:55.743: [ CSSD][580302592]clssnmPollingThread: node nqzeyddb1 (1) is impending reconfig, flag 2491406, misstime 15090

2021-10-09 00:47:55.743: [ CSSD][580302592]clssnmPollingThread: local diskTimeout set to 27000 ms, remote disk timeout set to 27000, impending reconfig status(1)

2021-10-09 00:47:55.743: [ CSSD][586610432]clssnmvDHBValidateNcopy: node 1, nqzeyddb1, has a disk HB, but no network HB, DHB has rcfg 528920094, wrtcnt, 880951, LATS 286157624, lastSeqNo 880924, uniqueness 1633579205, timestamp 1633711660/286147104

2021-10-09 00:47:55.863: [ CSSD][589764352]clssnmvDiskPing: Writing with status 0x3, timestamp 1633711675/286157744

2021-10-09 00:47:56.144: [ CSSD][594495232]clssnmvDiskPing: Writing with status 0x3, timestamp 1633711676/286158024

2021-10-09 00:47:56.306: [ CSSD][943818496]clssgmpcBuildNodeList: nodename for node 0 is NULL

2021-10-09 00:48:07.745: [ CSSD][580302592]clssnmPollingThread: node nqzeyddb1 (1) at 90% heartbeat fatal, removal in 2.910 seconds,

2021-10-09 00:48:10.656: [ CSSD][580302592]clssnmMarkNodeForRemoval: node 1, nqzeyddb1 marked for removal

后找网络同事帮忙查看一下交换机有无异常

心跳丢失造成RAC节点驱逐

结果显而易见~

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

心跳丢失造成RAC节点驱逐

心跳丢失造成RAC节点驱逐

相关文章

js Node.removeChild 删除子节点

为什么pnpm比npm、yarn使用更好

Vue3+Vite+TypeScript 搭建Vue3项目笔记

【递归】C++算法:124 二叉树中的最大路径和

使用变量查询

编写ansibleplaybook批量安装二进制

Kubernetes删除node

单节点 Elasticsearch 健康状态为 yellow 问题的解决

node36-node.js得异步api

nvm使用

作者介绍

最新文章

js Node.removeChild 删除子节点

为什么pnpm比npm、yarn使用更好

Vue3+Vite+TypeScript 搭建Vue3项目笔记

使用变量查询

编写ansibleplaybook批量安装二进制

Kubernetes删除node

热门文章

nave node 的虚拟环境管理工具

记一次K8s排错实战

node10-node的自定义模块

node 学习 ——模块导出

【异常-Node】使用nodemon命令执行报错Error: Cannot find module ‘destroy‘

在Linux上安装Node.js

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Kubernetes删除node

Vue3+Vite+TypeScript 搭建Vue3项目笔记

快速删除 node_modules

nave node 的虚拟环境管理工具

vscode编写nodejs

记一次K8s排错实战