遇到报错: [W reducer.cpp:362] Warning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param’s strides changed since DDP was constructed. This is not an error, but may impair performance.

机翻:警告。梯度与桶状视图的梯度不一致。这可能表明grad没有按照梯度布局合同创建,或者参数的步长在DDP构建后发生了变化。 这不是一个错误,但可能影响性能。

在这里插入图片描述

方法1:
Github的issue:Grad strides do not match bucket view strides.#47163
pytorch利用DDP进行加速的报错问题
在transpose或者permute后面加 .contiguous()
但是加了之后还是有警告
在这描述

方法2:
类似于x = x[:, :H, :W, :]这种切片的操作
改成:

x = x[:, :H, :W, :].contiguous()

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐