Seurat模块分层理解学习
2026/1/21 11:48:24
在 CentOS 7 中,OOM Killer(Out-of-Memory Killer)是 Linux 内核在系统内存严重不足时,强制终止某些进程以释放内存的机制。
# 查看最近发生的 OOM 事件sudogrep-i"oom\|out of memory"/var/log/messages# 使用 dmesg 查看内核日志sudodmesg|grep-i"oom\|killed process"# 查看完整的 OOM 信息sudodmesg-T|grep-B5 -A5"Out of memory\|Killed process"# 查看进程退出信号(如果信号是 9,可能是 OOM)cat/var/log/messages|grep"signal 9"/proc/sys/vm/overcommit_memory /proc/sys/vm/overcommit_ratio /proc/sys/vm/panic_on_oom /proc/sys/vm/swappiness# 查看 OOM 相关参数sysctl -a|grepoom# 查看 overcommit 设置cat/proc/sys/vm/overcommit_memory# 0 = 启发式overcommit(默认)# 1 = 总是 overcommit# 2 = 禁止 overcommit# 临时修改echo1>/proc/sys/vm/overcommit_memory sysctl vm.overcommit_memory=1# 永久修改(在 /etc/sysctl.conf 中添加)echo"vm.overcommit_memory = 1">>/etc/sysctl.conf sysctl -p# 查看进程的 OOM 分数(分数越高越容易被杀)cat/proc/<PID>/oom_score# 查看 OOM 调整值(-1000 到 1000)cat/proc/<PID>/oom_score_adjcat/proc/<PID>/oom_adj# 旧版本# 保护重要进程(设置负值,不容易被杀死)echo-100>/proc/<PID>/oom_score_adj# 标记不重要进程(设置正值,优先被杀死)echo100>/proc/<PID>/oom_score_adj# 使用 systemd 服务保护进程[Service]OOMScoreAdjust=-500# 查看内存使用情况free-htop-o %MEM# 按内存排序查看进程psaux --sort=-%mem|head-20# 查看 slab 内存使用slabtop# 使用 atop 监控atop# 使用 htop 交互式查看htop# 使用 earlyoom(用户空间 OOM killer)# 安装:yum install epel-release && yum install earlyoom# 1. 减少交换倾向(减少使用 swap)sysctl vm.swappiness=10# 2. 禁止在 OOM 时 panicsysctl vm.panic_on_oom=0# 3. 调整 overcommit 策略sysctl vm.overcommit_memory=2sysctl vm.overcommit_ratio=80# 4. 调整内存分配策略sysctl vm.admin_reserve_kbytes=8192sysctl vm.user_reserve_kbytes=8192在/etc/sysctl.d/99-oom.conf中添加:
vm.overcommit_memory = 2 vm.overcommit_ratio = 80 vm.swappiness = 10 vm.panic_on_oom = 0 vm.oom_kill_allocating_task = 0应用配置:
sysctl -p /etc/sysctl.d/99-oom.conf#!/bin/bash# check-oom-risk.sh# 检查内存使用率MEM_USED=$(free|awk'/Mem:/ {print $3/$2 * 100.0}')echo"内存使用率:${MEM_USED}%"# 检查交换空间使用SWAP_USED=$(free|awk'/Swap:/ {print $3/$2 * 100.0}')echo"Swap使用率:${SWAP_USED}%"# 检查 OOM 分数最高的进程echo-e"\nOOM 风险最高的进程:"ps-eo pid,comm,%mem --sort=-%mem|head-10# 检查是否有大内存进程echo-e"\n检查大内存进程 (>10%):"ps-eo pid,comm,rss --sort=-rss|awk'$3 > 10000 {print}'通过合理配置 OOM Killer 参数和监控内存使用,可以有效减少因内存不足导致的系统不稳定问题。