问题描述

训练的时候突然发现失去连接了,重新连接发现训练已经终止,这个情况下并不需要重新训练,只需要“断点续传”。

解决方案

方法很简单,将train.py的resume项的default设成True即可。
修改train.py文件:

parser.add_argument('--resume', nargs='?', const=True, default=True, help='resume most recent training')

之后运行

python train.py

或者不需要修改文件,直接运行:

python train.py --resume True
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐