kubernetes中网络报错问题-天翼云

kubernetes中网络报错问题

2023-03-20 08:33:05 阅读次数：217

kubernetes中网络报错问题

系统环境

#系统版本
cat /etc/redhat-release
CentOS Linux release 7.4.1708 (Core)

#kubelet版本
kubelet --version
Kubernetes v1.10.0

#selinux状态
getenforce
Disabled

#系统防火墙状态
systemctl status firewalld
● firewalld.service - firewalld - dynamic firewall daemon
   Loaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)
   Active: inactive (dead)
     Docs: man:firewalld(1)

Pod 异常问题

#dns的Pod 一直处于 Waiting 或 ContainerCreating 状态
kubectl get po -n kube-system
NAME                                    READY     STATUS             RESTARTS   AGE
kube-dns-86f4d74b45-ffwjf        0/3       ContainerCreating   0          6m

#查看Pod详细情况
kubectl  describe pod kube-dns-86f4d74b45-ffwjf  -n kube-system
##我们看到如下信息：
Error syncing pod
Pod sandbox changed, it will be killed and re-created.
##可以发现，该 Pod 的 Sandbox 容器无法正常启动，具体原因需要查看 Kubelet 日志。

#查看Pod的log
journalctl -u kubelet
##看到如下报错内容：
RunPodSandbox from runtime service failed: rpc error: code = 2 desc = NetworkPlugin cni failed to set up pod "kube-dns-86f4d74b45-ffwjf" network: failed to set bridge addr: "cni0" already has an IP address different from 10.244.4.1/24

##说明这里的一个Pod中启动了多个容器，所以，我们使用kubectl logs 命令查看日志很有局限性，关于kubectl logs的使用，请参考kubernetes中的Pod简述与实践和kubernetes中文文档。

处理步骤

#在master节点之外的节点进行操作
kubeadm reset
systemctl stop kubelet
systemctl stop docker
rm -rf /var/lib/cni/
rm -rf /var/lib/kubelet/*
rm -rf /etc/cni/
ifconfig cni0 down
ifconfig flannel.1 down
ifconfig docker0 down
ip link delete cni0
ip link delete flannel.1
##重启kubelet
systemctl restart kubelet
##重启docker
systemctl restart docker

#说明
##如果上面操作之后还是报相同的错误或是如下错误：
"CreatePodSandbox for pod \" kube-dns-86f4d74b45-ffwjf _default(78e796f5-e
b7c-11e7-b903-b827ebd42d30)\" failed: rpc error: code = Unknown desc = N
etworkPlugin cni failed to set up pod \" kube-dns-86f4d74b45-ffwjf _default\"
network: failed to allocate for range 0: no IP addresses available in range set:
10.244.1.1-10.244.1.254"

#执行如下操作步骤：
##在master主机上
kubeadm reset
systemctl stop kubelet
systemctl stop docker
rm -rf /var/lib/cni/
rm -rf /var/lib/kubelet/*
rm -rf /etc/cni/
ifconfig cni0 down
ifconfig flannel.1 down
ifconfig docker0 down
ip link delete cni0
ip link delete flannel.1
##重启kubelet
systemctl restart kubelet
##重启docker
systemctl restart docker

##初始化
kubeadm init --kubernetes-version=v1.10.1 --pod-network-cidr=10.244.0.0/16
--apiserver-advertise-address=10.0.0.39
##说明：
最后给出了将节点加入集群的命令：
kubeadm join 10.0.0.39:6443 --token 4g0p8w.w5p29ukwvitim2ti 
--discovery-token-ca-cert-hash sha256:21d0adbfcb409dca97e65564
1573b2ee51c
77a212f194e20a307cb459e5f77c8
这条命令一定保存好，因为后期没法重现的！！

##建立.kube
rm -rf /root/.kube/
mkdir -p /root/.kube/
cp -i /etc/kubernetes/admin.conf /root/.kube/config
chown root:root /root/.kube/config

#在node（非master）节点上
kubeadm reset
systemctl stop kubelet
systemctl stop docker
rm -rf /var/lib/cni/
rm -rf /var/lib/kubelet/*
rm -rf /etc/cni/
ifconfig cni0 down
ifconfig flannel.1 down
ifconfig docker0 down
ip link delete cni0
ip link delete flannel.1
##重启kubelet
systemctl restart kubelet
##重启docker
systemctl restart docker

## kubeadm join
kubeadm join 10.0.0.39:6443 --token 4g0p8w.w5p29ukwvitim2ti 
--discovery-token-ca-cert-hash sha256:21d0adbfcb409dca97e65564
1573b2ee51c
77a212f194e20a307cb459e5f77c8

总结除了以上错误，其他可能的原因还有：镜像拉取失败，比如：（1）配置了错误的镜像（2）Kubelet 无法访问镜像（国内环境访问 gcr.io 需要特殊处理（3）私有镜像的密钥配置错误（4）镜像太大，拉取超时（可以适当调整 kubelet 的 --image-pull-progress-deadline 和 --runtime-request-timeout 选项） CNI 网络错误，一般需要检查 CNI 网络插件的配置，比如：（1）无法配置 Pod 网络（2）无法分配 IP 地址容器无法启动，需要检查是否打包了正确的镜像或者是否配置了正确的容器参数等。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

kubernetes中网络报错问题

kubernetes中网络报错问题

相关文章

知识图谱的演化：从语义网络到智能决策的关键

初识aurora

Docker网络模型深度解析

课程介绍，基础—环境安装、判断、循环语句等（爬虫及数据可视化）

Linux——网络基础

docker之容器网络篇

Java详解：网络编程（零基础入门）

【附源码】如何用C语言做一个刷弹幕的工具？

【RDMA】深入浅出全面解析RDMA -- 研读

【5G】5G基站君的进化之路 — CU和DU分离---研读

作者介绍

最新文章

docker之容器网络篇

【网关】什么是网关、网桥和交换机（集线器、网桥、交换机、路由器、网关大解析）

K 个关闭的灯泡。 N 个灯泡排成一行，编号从 1 到 N 。最初，所有灯泡都关闭。每天只打开一个灯泡，直到 N 天后所有灯泡都打开。

vlan划分详解

【云原生技术】Docker基础知识-docker0网桥

【Kubernets】kubernets整体技术架构

热门文章

Kubernetes----Kubernetes中通过指令式命令的方式方式管理对象

k8s安装gitlab，yaml如何写？

K8S 架构实现及工作原理

云原生|kubernetes|kubernetes的etcd集群备份策略

ARP渗透与攻防之ARP原理

kubernets 【安全】-sysdig

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Kubernetes----Kubernetes常用插件简介

Kubernetes集群中Pod间文件拷贝

TCP 的介绍

网络总结知识点（网络工程师必备）一

helm 简介

DMZ架构设计