(个人学习记录)指定GPU运行和训练 python程序 、深度学习单卡、多卡 训练GPU设置
目录1.查看服务器显卡情况2.命令行指定GPU运行python程序3.python程序中直接指定GPU4.总结运行结果:由图可以看到有两张显卡:0NVIDIA GeForce RTX 2080 Ti和1NVIDIA GeForce RTX 2080 Ti2.命令行指定GPU运行python程序CUDA_VISIBLE_DEVICES指定的是显卡编号,也可以同时添加(不太清楚同时添加是怎么样的效果,
·
目录
1.查看服务器显卡情况
nvidia-smi
运行结果:

由图可以看到有两张显卡:0 NVIDIA GeForce RTX 2080 Ti和1 NVIDIA GeForce RTX 2080 Ti
其他信息说明:
GPU:GPU 编号;
Name:GPU 型号;
Persistence-M:持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态;
Fan:风扇转速,从0到100%之间变动;
Temp:温度,单位是摄氏度;
Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。
Pwr:Usage/Cap:能耗;
Memory Usage:显存使用率;
Bus-Id:涉及GPU总线的东西
Disp.A:Display Active,表示GPU的显示是否初始化;
Volatile GPU-Util:浮动的GPU利用率;
Uncorr. ECC:Error Correcting Code,错误检查与纠正;
Compute M:compute mode,计算模式
2.命令行指定GPU运行python程序
CUDA_VISIBLE_DEVICES=0 python test.py
CUDA_VISIBLE_DEVICES指定的是显卡编号,也可以同时添加(不太清楚同时添加是怎么样的效果,可以自行尝试)
3.python程序中直接指定GPU
在运行的python脚本前面添加:
# 在 train.py 最上方,设定使用的GPU 编号, 当这两行代码注释掉时,训练会自动使用该服务器的所有资源
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0,1"
4.总结
仅供个人学习记录,如果有疑问或者错误,欢迎讨论交流,谢谢!
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)