登录节点用户资源控制
当使用集群的用户数量较多的时候,存在部分用户没有通过调度系统提交任务而直接在登录节点运行软件,造成对登录节点系统资源的抢占,进而影响到登录节点的稳定性和用户使用体验。SonmiHPC集群系统提供了对登录节点用户对系统资源的使用限制功能,系统管理员可以自行启用该功能。
使用场景示例
在登录节点用户默认可以使用该节点的全部资源,下面的例子使用普通用户对配置有8个CPU核心的登录节点进行压力测试:
可以通过htop查看登录节点的资源使用情况:
可以看到该用户可以无限制的使用该登录节点的CPU资源,这时候往往会影响该登录节点用户的使用体验。
启用资源限制功能
集群管理员可以通过以下方式来启用资源限制功能,编辑 /etc/sonmi/config.yaml,查找以下的配置字段:
cgroup:
enabled: true # 将该字段改为true
check-interval-ms: 1000
user-cpu-percent: 30
user-mem-percent: 30
user-swap-percent: 30
disable-oom-killer: false
exclude-uids: # 需要排除资源控制的用户
- 1240
- 1250
cgroup:
enabled: true # 将该字段改为true
check-interval-ms: 1000
user-cpu-percent: 30
user-mem-percent: 30
user-swap-percent: 30
disable-oom-killer: false
exclude-uids: # 需要排除资源控制的用户
- 1240
- 1250
以下为主要的配置:
enabled:是否启用该功能,设置为true启用,false为关闭;
user-cpu-percent :控制每个用户能占用的CPU最大使用率,默认30%;
user-mem-percent:控制每个用户能占用的虚拟内存最大使用率,默认30%;
然后通过以下的命令重启服务即可:
systemctl restart sonmictld
systemctl restart sonmictld
查看限制效果
管理员启用之后,通过htop可以看到对该用户的资源限制是否已经生效:
可以看到该集群登录节点对该用户的CPU资源使用率控制在30%左右,该功能已经生效。