问题概述
当您的云主机出现网络延迟和丢包的问题,可能出现以下三种情况。
- 云主机被入侵:云主机如果发生被黑客入侵或者中毒情况,那么可能病毒程序可能会频繁发送数据包造成带宽超出上限,从而导致丢包现象,严重的情况下可能会使远程登录服务无法使用。
- 云主机本地网络故障:系统中可能存在业务进程传输io过大导致网络丢包,比如云主机在大量传输文件等。
- 云主机应用运行异常:应用运行异常会导致网络丢包,如某个应用占用很高的CPU、内存,造成云主机资源不足。
解决方案
云主机被入侵的排查方式:
可以通过 netstat -anpt
命令查看系统是否存在异常连接。
可以通过查询图中Foreign Address字段中的IP地址归属判断云主机是否存异常连接,如果IP地址归属为国外地址或者非业务访问连接地址,那么云主机有可能被攻击或中毒。这种情况下建议在云主机中安装专业杀毒软件或者重装云主机系统,并对云主机做相关基于业务场景的安全加固,确保不会再次发生中毒现象。
本地网络故障的排查方式
以CentOS 7.6为例,执行以下命令,安装iotop工具。
yum install -y iotop
可通过图中DISK READ和DISK WRITE字段以及COMMAND字段判断某个进程的读写情况。若存在IO流量值很大的情况,需要考虑对相应进程进行整改以确保网络稳定性。比如关闭正在传输的进程,或者分批次进行文件传输等。
云主机应用运行异常的排查方式
- 可以通过
top
命令查看对应进程对CPU资源消耗情况。若%CPU字段值很大则需要确认,对应的进程运行是否正常。如果是非正常的业务结果,请考虑排查应用程序的Bug或中毒现象。
- 可以通过
netstat -anpt|wc -l
命令查看系统进程链接数数量。若存在系统进程链接数量很多的情况下,需要查看具体是哪个进程引发的问题,进而判断是否存在业务链接负载高或中毒现象。