参考链接:https://blog.csdn.net/qq_32998593/article/details/92849585

总结一下,第一是增加batch size,增加GPU的内存占用率,尽量用完内存,而不要剩一半,空的内存给另外的程序用,两个任务的效率都会非常低。

第二,在数据加载时候,将num_workers线程数设置稍微大一点,推荐是8,16等,且开启pin_memory=True。,直接映射数据到GPU的专用内存,减少数据传输时间。

GPU和CPU的数据瓶颈得到解决。整体性能得到权衡。不要将整个任务放在主进程里面做,这样消耗CPU,且速度和性能极为低下。

 

转载于:https://www.cnblogs.com/walktosee/p/11490278.html

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐