安装依赖指南

标准的深度学习三件套包括pytorch, cuda, cudnn。根据经验,一般安装顺序如下:

  1. 为GPU安装驱动和cuda。到官网安装cuda toolkit
  2. 用conda安装cudatoolkit。用conda安装cudaconda install cudatoolkit==11.7,使用清华源(到官网确认安装了符合pytorch要求的cuda版本)
  3. 用pip安装pytorch,使用清华源。
  4. 安装合适版本的cudnn。

如何安装cuda

到官网下载cuda安装包 https://blog.csdn.net/h3c4lenovo/article/details/119003405
安装方式有deb、在线deb和runfile可选,本人用在线deb安装。它会为你同时安装driver和toolkit。

安装后,运行nvidia-smi和ls/usr/local查看nvdiia cuda版本。

nvidia cuda 安装失败,报错"you are running x server … installation failed "

如果报错"you are running x server",说明有程序在使用显卡,要关闭lghtdm。
https://blog.csdn.net/lien0906/article/details/54312166

英文版。高赞回答
https://unix.stackexchange.com/questions/25668/how-to-close-x-server-to-avoid-errors-while-updating-nvidia-driver

sudo service lightdm stop

ubuntu driver/library version mismatch:重装驱动

驱动和library的版本不一致,需要检查版本,并卸载重装驱动!

如何查看驱动版本
https://xujinzh.github.io/2022/05/25/nvidia-driver-library-version-mismatch/

…系统运行中的 NVIDIA 驱动版本(查看方法:cat /proc/driver/nvidia/version)与安装的驱动版本(查看方法:sudo dpkg -l | grep nvidia)不一致

如何卸载驱动
https://itslinuxfoss.com/fix-failed-initialize-nvml-driver-library-version-mismatch-error/

sudo apt purge nvidia*

安装conda cudatoolkit

用conda安装即可:conda install cudatoolkit==11.7,conda可以使用国内清华源。

如何下载pytorch gpu离线版本

参考博客 https://blog.csdn.net/qq_51206550/article/details/127835129

下载pytorch gpu版本太慢,到官方镜像 https://download.pytorch.org/whl/torch/,下载需要的GPU版本,比如torch-1.13.1+cu117-cp39-cp39-win_amd64.whl,其中cu117代表cuda版本为11.7,cp37代表python版本为3.7。

https://blog.csdn.net/qq_41710226/article/details/125548986

如何安装cudnn

在windows安装cudnn详见"2. Installing cuDNN on Windows"一章,简单讲就是下载cudnn的压缩包,放到某个路径,再将bin目录添加到path。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐