pytorch并行报错:cuda unknown error 以及 daemonic processes are not allowed to have children
两个pytorch的并行报错
·
今天同时运行俩并行,每个并行4个pytorch进程。结果两个小时后报错了:cuda unknown error 有可能是显存爆了,但是不太像,因为最开始才70%。
此外,在使用multiprocess库并行的情况下,每个子进程的dataloader的num_worker只能设为0,否则会报错:daemonic processes are not allowed to have children。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)