NIUCLOUD是一款SaaS管理后台框架多应用插件+云编译。上千名开发者、服务商正在积极拥抱开发者生态。欢迎开发者们免费入驻。一起助力发展! 广告
[https://github.com/kubernetes/kubernetes/tree/master/cluster/addons](https://github.com/kubernetes/kubernetes/tree/master/cluster/addons) cluster下的addons是稳定的一些软件等,经过验证的。 # 查验失败 除此之外,在 Kubernetes 的部署中,我们经常可以碰到容器镜像没有更新、集群资源不足、校验错误、持久化卷挂载失败等问题,开发人员可以使用一些简单命令进行快速定位,比如, kubectl describe deployment/deployname -n namespace kubectl describe replicaset/rsname -n namespace kubectl get pods -n namespace kubectl describe pod/podname -n namespace kubectl logs\--previous 等命令可以被用来定位常见的大部分失败问题。 也可通过查看这个容器所在服务器日志来看原因 `journalctl -k` ``` Jul 23 07:31:41 cn-hk-crm-k8s-slave06.lwork.com kernel: Tasks state (memory values in pages): Jul 23 07:31:41 cn-hk-crm-k8s-slave06.lwork.com kernel: [ pid ] uid tgid total_vm rss pgtables_bytes swapents oom_score_adj name Jul 23 07:31:41 cn-hk-crm-k8s-slave06.lwork.com kernel: [ 25137] 0 25137 255 1 40960 0 -998 pause Jul 23 07:31:41 cn-hk-crm-k8s-slave06.lwork.com kernel: [ 11086] 4243 11086 1085 202 49152 0 958 sh Jul 23 07:31:41 cn-hk-crm-k8s-slave06.lwork.com kernel: [ 11249] 4243 11249 2754148 781574 7557120 0 958 java Jul 23 07:31:41 cn-hk-crm-k8s-slave06.lwork.com kernel: oom-kill:constraint=CONSTRAINT_MEMCG,nodemask=(null),cpuset=docker-e5e4114c3e82655502266a03f88f7191574d0a6df8a2bad0 Jul 23 07:31:41 cn-hk-crm-k8s-slave06.lwork.com kernel: Memory cgroup out of memory: Killed process 11249 (java) total-vm:11016592kB, anon-rss:3109860kB, file-rss:17048kB, Jul 23 07:31:41 cn-hk-crm-k8s-slave06.lwork.com kernel: oom_reaper: reaped process 11249 (java), now anon-rss:0kB, file-rss:0kB, shmem-rss:0kB ``` **不管是 cgroup 限制杀掉进程还是因为节点机器本身资源不够导致进程死掉,都可以从系统日志中找到记录:** > ubuntu 的系统日志在`/var/log/syslog`,centos 的系统日志在`/var/log/messages`,都可以用`journalctl -k`来查看系统日志 # **查看kublet日志** > 查看kublet日志 `journalctl -u kubelet -f` # **k8s pod erro exit code 1 和 255** * 这种可能是一般错误,具体错误原因只能看容器日志,因为很多程序员写异常退出时习惯用`exit(1)`或`exit(-1)`,-1 会根据转换规则转成 255 # **获取上次终止的容器的状态** 你可以通过`kubectl get pod`加上`-o go-template=...`选项来获取上次终止的容器的状态 ``` kubectl get pod bw-custom-74b9ccc754-2rd49 -n crm-sprod -o go-template='{{range.status.containerStatuses}}{{"Container Name: "}}{{.name}}{{"\r\nLastState: "}}{{.lastState}}{{end}}' Container Name: bw-custom LastState: map[terminated:map[containerID:docker://bc07cfc3ef31cb66afce5311770d1a2ffa2169988bcd7b4a11206645c8d1ec45 exitCode:137 finishedAt:2021-03-18T08:14:08Z reason:OOMKilled startedAt:2021-02-26T13:36:17Z]] ```