记录银河麒麟V10 SP2 auditd服务内存泄露问题
问题描述
最近在公司测速环境的华为鲲鹏国产化服务器部署了一套k8s,今天告警发现好多应用都出现无法调度的问题。查看服务与告警有2台节点内存直接99%使用率。因此原因均指向节点内存不足导致。
通过查看节点内存占用排名靠前的进程,发现是auditd
进程占用了。
[root@localhost ~]# top -o %MEM -b -n 1 | head -n 12
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1782 root 16 -4 13.6g 13.5g 1120 S 0.0 80.1 8:19.34 auditd
2568 root 20 0 378080 250064 248740 S 0.0 2.7 5:49.80 systemd-journal
解决方案
根据搜索反馈此问题集中sp2,所以我这边是系统升级到ylin-Server-V10-SP3-2403
后没这个问题。
1. 重启进程
auditd 是银河麒麟的审计工具,重启 auditd 后, 内存立即释放了, 问题解决。
systemctl restart auditd