ThinkChat🤖让你学习和工作更高效,注册即送10W Token,即刻开启你的AI之旅 广告
[TOC] # scheduler调度步骤 kube-scheduler 给一个 Pod 做调度选择时包含两个步骤: 1. 过滤 2. 打分 过滤阶段会将所有满足 Pod 调度需求的节点选出来。 例如,PodFitsResources 过滤函数会检查候选节点的可用资源能否满足 Pod 的资源请求。 在过滤之后,得出一个节点列表,里面包含了所有可调度节点;通常情况下, 这个节点列表包含不止一个节点。如果这个列表是空的,代表这个 Pod 不可调度。 在打分阶段,调度器会为 Pod 从所有可调度节点中选取一个最合适的节点。 根据当前启用的打分规则,调度器会给每一个可调度节点进行打分。 最后,kube-scheduler 会将 Pod 调度到得分最高的节点上。 如果存在多个得分最高的节点,kube-scheduler 会从中随机选取一个。 # 常见问题 ## 调度不均衡 通常反馈都是内存不均衡。比如集群有三个节点,一台是128G内存,两台是64G内存。预想的是三台使用内存百分比差不多。实际上两台64G内存差不多跑满了,另一台128G内存才跑了50%左右。 为什么会出现这种问题呢? > 我们先了解下调度的其中一个打分。k8s调度认为内存使用情况是 `节点总共调度的request值(kubectl describe node k8s-node01)` 最下面有打印(示例如下) > ![img](https://img.kancloud.cn/95/20/9520e761c38bf3d758c0813e301628e6_841x152.png) **由此可见**:调度的时候不是按照主机实际使用内存情况,而是根据 该节点request总值来评估使用率。 **总结和建议**:pod设置一定要设置 request 值,且设置的时候与实际跑的内存相符。设置request值与实际跑的内存差距太大会出现如上情况。 ## 监控主机内存接近满载不驱逐 k8s是有自己一套主机内存判断机制是否到达驱逐临界定。[官网提供k8s检测脚本](https://kubernetes.io/zh-cn/examples/admin/resource/memory-available.sh) / [【备份】本地下载官方k8s检测脚本](./memory-available.sh) 判断是否超过驱逐临界点。超过该临界点则开始驱逐pod。临界点是 `--eviction-hard` 参数配置。查看配置的情况 `ps -ef | grep [k]ubelet | grep 'eviction-hard=memory.available'` **由此可见**:可能与监控主机内存有出入,需参考上面提供脚本测试是否到达驱逐标准。 >[info] **总结**:通过 `free -h` 不是判断驱逐条件,所有还是使用上面脚本为准哈。 # 参考文章 节点压力驱逐:https://kubernetes.io/zh-cn/docs/concepts/scheduling-eviction/node-pressure-eviction/