机器学习之线性模型的训练过程

线性模型的训练过程1.初始化模型包括初始化模型参数W 和 b，使得对任意X可以通过 y=WX+b得到y的结果。2.准备好数据集，即用于训练的X和Y3.开始训练3.1向前传播计算y_pre=WX+b3.2计算误差(或称损失) 计算Loss=loss(y_pre,y) 其中loss可以是mae、mse(常称为最小二乘法，或均方误差、平方2损...

appron

1035人浏览 · 2019-11-25 20:43:12

appron · 2019-11-25 20:43:12 发布

线性模型的训练过程

1.初始化模型包括初始化模型参数W 和 b，使得对任意X可以通过 y=WX+b得到y的结果。

2.准备好数据集，即用于训练的X和Y

3.开始训练

3.1向前传播计算y_pre=WX+b

3.2计算误差(或称损失) 计算Loss=loss(y_pre,y) 其中 loss可以是mae、mse(常称为最小二乘法，或均方误差、平方2损失)、交叉熵等

3.3计算此时误差关于模型参数W、b的梯度Grad_W和Grad_b

3.4更新W=W-Grad_W*alpha, b=b-Grad_b*alpha （基于梯度下降）

4.训练完成，进行验证

注：其中3.4的更新可以不基于梯度，如对于凸优化问题，直接求最佳参数W,b的拟牛顿法等，其次参数b也可以插入W中，即令W*=(W,b),此时X也需要相应地增加一列值为1的列。

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

cover

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

cover

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

cover

「极限压缩量化未来」Modelers GeekDay上海站圆满落幕

所有评论(0)

查看更多评论

appron

已为社区贡献3条内容