K8S环境的Jenkin性能问题处理-天翼云

K8S环境的Jenkin性能问题处理

2023-05-30 08:05:00 阅读次数：382

环境信息

在K8S环境通过helm部署了Jenkins（namespace为helm-jenkins），用于日常Java项目构建：

kubernetes：1.15
jenkins：2.190.2
helm版本：2.16.1

如果您想了解helm部署Jenkins的详情，请参考《Helm部署和体验jenkins》

问题描述

当Jenkins任务密集时，Jenkins页面响应缓慢，偶尔有白屏情况发生（稍后自动恢复），且构建速度明显变缓，此时去后台看一下环境信息：
K8S环境已装了metrics-server，用命令 kubectl top pod --all-namespaces 可以看到Jenkins所占内存仅有410兆，如下图：
Jenkins是Java应用，在处理大量任务的时候，410兆的内存应该是不够的，JVM内存不足会导致频繁的垃圾回收，接下来顺着这个思路去看JVM内存情况；
由上图可知pod名为 my-jenkins-74bcdfc566-lmhnw ，通过 kubectl describe pod my-jenkins-74bcdfc566-lmhnw -n helm-jenkins 查看此pod详情：
由上图红框1可知此pod运行在node3节点，红框2显示对应的docker容器ID为 f9ae211abe99 (前12位)；
去node3机器上执行 docker ps ，果然发现了ID为 f9ae211abe99 的容器，如下图：
执行命令 docker exec f9ae211abe99 jps 查看容器内所有java进程的PID，如下图，可见Jenkins服务在容器内的PID等于6：
知道了容器ID和java进程的PID，就可以查看JVM信息了，执行命令 docker exec f9ae211abe99 jstat -gcutil 6 3s 99 查看GC情况，如下图，除了YGC频繁，还出现了FGC：
再用命令 docker exec f9ae211abe99 jmap -heap 6 查看JVM内存情况，如下图，年轻代太小了，只有100兆：
最后用命令 docker exec f9ae211abe99 ps -ef | grep java 查看该进程的启动命令，如下图，可见启动该java进程时没有指定内存参数：
在观察的过程中，ID为 f9ae211abe99 的容器突然不见了，取而代之的是一个ID为 7f1f94d79e46 新容器，如下图所示：
执行命令 kubectl get event -n helm-jenkins 查看该命名空间的所有事件，如下图红框所示，发现原来是探针不响应迫使K8S重启该pod：
诊断完成，根据前面的信息可以推测：JVM内存太小，YGC频繁，甚至会有FGC出现，系统响应过慢还可能导致K8S探针判断容器不健康，引发docker容器被删除后重新创建；
基于上述结果制定的应对措施：调整JVM参数，减少GC；

调整参数

宿主机节点有16G物理内存，没有其他业务，因此打算划分8G内存给Jenkins；
执行命令 kubectl edit deployment my-jenkins -n helm-jenkins ，编辑jenkins的deployment，找到JAVA_OPTS参数的位置，在下面增加value，如下图红框所示：
就像vi工具编辑文本文件那样操作，保存退出后，pod被重建；
找到docker容器ID后，执行命令 docker exec 591dc47d4d57 jmap -heap 6 查看JVM内存，如下图所示，堆上限已经达到8G，年轻代是3686兆(调整前只有106兆)：
并发执行任务一段时间后，观察GC情况发现并不频繁：
再来看看该进程的启动命令，执行命令 docker exec 591dc47d4d57 ps -ef|grep java ，如下图红框所示，刚才设置的内存参数已经被用在启动命令中了：
运行一段时间，确认任务可正常执行，页面操作也比较流畅，查看K8S事件，再也没有出现pod重启的事件；

关于修改参数的方法

除了kubectl edit命令，还可以将helm的Jenkins配置信息全部下载到本地，修改后再部署Jenkins服务，如果您想了解更多，请参考《Helm部署的服务如何修改配置》
至此，K8S环境下Jenkins性能问题处理已经完成，希望能给您带来一些参考

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

K8S环境的Jenkin性能问题处理

K8S环境的Jenkin性能问题处理

环境信息

问题描述

调整参数

关于修改参数的方法

相关文章

部署jenkins,采用普通用户tomcat来启动tomcat服务

K 个关闭的灯泡。 N 个灯泡排成一行，编号从 1 到 N 。最初，所有灯泡都关闭。每天只打开一个灯泡，直到 N 天后所有灯泡都打开。

课程表 III。 这里有 n 门不同的在线课程，按从 1 到 n 编号。

同一pipeline中checkout多个代码方法：RelativeTargetDirectory用法

持续集成——通过docker命令安装Jenkins

python flask-caching模块缓存详解

云原生|kubernetes|部署MySQL一主多从复制集群（基于GTID的复制）

CKAD 5. Pod Design (20%)练习题

Kubernetes 的Ingress的Rewrite annotations

云原生|kubernetes|本地存储hostpath-provisioner部署以及无token密码方式登陆dashboard的部署

作者介绍

最新文章

K 个关闭的灯泡。 N 个灯泡排成一行，编号从 1 到 N 。最初，所有灯泡都关闭。每天只打开一个灯泡，直到 N 天后所有灯泡都打开。

持续集成——通过docker命令安装Jenkins

CKAD 5. Pod Design (20%)练习题

Kubernetes 的Ingress的Rewrite annotations

kubernetes dev client-go管理pvc

k8s安装Jenkins

热门文章

Kubernetes----Kubernetes中通过指令式命令的方式方式管理对象

k8s安装gitlab，yaml如何写？

K8S 架构实现及工作原理

云原生|kubernetes|kubernetes的etcd集群备份策略

kubernets 【安全】-sysdig

Kubernetes的 pod 重启策略、Pod状态、生命周期

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Kubernetes----Deployment常用操作

k8s安装mongo，yaml如何写？

Jenkins的管理插件

Kubernetes----Kubernetes组件简介及相关概念

k8s安装gitlab，yaml如何写？

【云原生篇】K8S之DaemonSet 详解

课程表 III。这里有 n 门不同的在线课程，按从 1 到 n 编号。