给离线服务器重装驱动

张开发
2026/4/3 9:39:07 15 分钟阅读
给离线服务器重装驱动
我这边的背景是服务器在跑代码途中会断联原因是有一张卡识别不出来接下来介绍我的具体做法下载驱动去官网搜索服务器里显卡对应的驱动 https://www.nvidia.cn/drivers/results/下载后的文件后缀为.run 我下载的是最新的因为NVIDIA的显卡驱动是向下兼容的操作步骤1.卸载旧驱动并清理残留在终端依次执行sudo apt-get purge nvidia* sudo apt-get autoremove sudo nvidia-uninstall # 如果提示找不到命令也没关系说明上一步删干净了2.禁用 Linux 自带的 Nouveau 驱动如果不禁用新驱动装不上这里可以先重启服务器因为之前别人可能帮你禁用过了#重启后执行 若没有输出则说明nouveau禁用成功 lsmod | grep nouveau否则编辑配置文件编辑后重启服务器sudo nano /etc/modprobe.d/blacklist-nouveau.conf #在里面写入这两行代码后并保存退出 blacklist nouveau options nouveau modeset03.正式执行.run安装重启后重新 SSH 连上服务器找到你上传文件的目录# 给安装包赋予执行权限 sudo chmod x NVIDIA-Linux-x86_64-xxx.xx.run # 运行安装程序加上 -no-x-check 是为了防止如果有图形界面卡住 sudo ./NVIDIA-Linux-x86_64-xxx.xx.run -no-x-check安装过程中如果弹窗问你是否安装 32-bit compatibility libraries选No问你是否自动更新 X configuration选No。其他的问题都可以拍照问豆包由此安装完毕但我这边出现了新的问题重启后面临的问题内网可参考我遇到的是重启过后出现屏幕显示问题左上角出现一个下划线光标我起初尝试了手动生成xorg.conf但由于服务器是离线的无法装有些包所以导致无法解决该问题但后面修改了提示词得到了解决方案。具体操作如下1.进入命令行在黑屏时按Ctrl Alt F3输入用户名、密码登录2.删掉错误的X配置因为之前我用的是nvidia-xconfig生成的配置文件在4卡的服务器上会出现黑屏问题多卡服务器本来就不应该手动生成 xorg.conf删掉让系统自动识别即可。sudo rm -f /etc/X11/xorg.conf sudo rm -rf /etc/X11/xorg.conf.d3.只改GRUB内核参数sudo nano /etc/default/grub # 进入后找到这一行 GRUB_CMDLINE_LINUX_DEFAULTquiet splash # 将其修改为如下 GRUB_CMDLINE_LINUX_DEFAULTquiet splash nvidia-drm.modeset1 nomodeset # 保存退出CtrlO 回车 CtrlX4.重置显示管理器sudo systemctl restart gdm35.重启sudo reboot问题得以解决希望这篇文章能帮助到一些人

更多文章