把三台服务器系统搞定,颇有一番滋味,把整个经过大概记录下来,以备不时之需。

01

硬件配置

服务器本体展示

2U服务器经典版本,第三代至强处理器,32个内存接口,双电源,联想BMC管理,软RAID

今日配置:

CPU:8352v2*1

内存:512GB

硬盘:960G*2+4TB*1 SAS企业级

显卡:涡轮4090*2

网卡:X710 OCP*3

操作系统:Ubuntu 22.04.3 LTS SERVER

开机

等待自检结束按F1配置RAID,操作如下顺序:

F1.system setup---系统设置---设备I/O端口--- PCH Configuration---PCH SATA Configuration---onboard SATA---RAID

系统安装

02

驱动安装

由于服务器系统不带桌面UI界面,所以下面的安装过程全部采用命令行的方式安装:

查询了一下网上的资料,大致可分为两种,1是安装官网上提供的RUN文件,好处是不受在线服务器下载,运行即可安装,缺点也是难以预料的各种报错,缺少文件等,耗时耗力 2是选择Ubuntu推荐的驱动,优点是可选择性多,兼容性强,几行命令即可搞定,缺点也很明显,一次可能搞不定。

总结一句话:操作简单,但问题多多,需要极强的动手排错能力及英语理解,今天以第二种方式安装。

下面开始:

准备工作:更新系统

sudo apt update
sudo apt upgrade

第一步:删除所有系统自带的Nvidia驱动

sudo apt remove --purge nvidia*sudo apt autoremove

第二步:安装必要的编译工具

sudo apt-get install gcc make g++

第三步:禁用nouveau驱动

sudo vim /usr/lib/modprobe.d/dist-blacklist.conf
***添加以下内容***
blacklist nouveau
options nouveau modeset=0
***按ESC退出编辑模式后输入:wq保存退出***
sudo update-initramfs -u       //刷新生效

sudo reboot                   //重启系统
lsmod | grep nouveau          //确认是否禁用成功,输出为空则成功

重启:

sudo reboot                   //重启系统lsmod | grep nouveau          //确认是否禁用成功,输出为空则成功

以上步骤是最容易出错的地方,务必小心

第四步:安装可用驱动

ubuntu-drivers devices      //检查本机可用驱动sudo apt-get install nvidia-driver-570 server    //安装驱动nvidia-smi      //查看驱动是否正常安装,如果报错,重新从0开始

总结:

1.抱着必定成功的心态去做就行

2.所有的操作都不难,只是需要时间

3.linux注定不能像windows那样成为小白的首选

4.闭源驱动都该XXX

5.需要一点点运气

转:

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐