华为云GPU服务器,带有一张Tesla T4,安装最新驱动后, nvidia-smi 报错提示:

No devices were found

参考华为云上的这篇知识库文章:Why Is the T4 GPU Display Abnormal?

在服务器上执行如下命令:

rmmod nvidia_drm
rmmod nvidia_modeset
rmmod nvidia
modprobe nvidia NVreg_EnableGpuFirmware=0
modprobe nvidia_drm
modprobe nvidia_modeset

执行上面的命令后,T4能正常使用新版驱动。

之后,需要将上述内核模块设置固定下来:

将以下内容加入 /etc/modprobe.d/nvidia.conf

options nvidia NVreg_EnableGpuFirmware=0

重启后生效。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐