9.1 基于内容的推荐系统-机器学习笔记-斯坦福吴恩达教授

基于内容的推荐系统推荐系统是机器学习最重要的应用之一，你所知道的淘宝、亚马逊、facebook、豆瓣这些网站都把推荐系统作为了核心。在某个电影资讯的网站，有那么一份用户对于电影的打分（1 - 5 分），? 代表用户没有评价过该电影：该网站对于每部电影都给出了两个评价指数，构成了电影的二维特征向量xxx ：x1=电影的浪漫指数x_1=电影的浪漫指数x1=电影的浪漫指数x2=电影的动作指...

Zhao-Jichao

602人浏览 · 2020-03-28 11:53:13

Zhao-Jichao · 2020-03-28 11:53:13 发布

基于内容的推荐系统

推荐系统是机器学习最重要的应用之一，你所知道的淘宝、亚马逊、facebook、豆瓣这些网站都把推荐系统作为了核心。在某个电影资讯的网站，有那么一份用户对于电影的打分（1 - 5 分），? 代表用户没有评价过该电影：
在这里插入图片描述
该网站对于每部电影都给出了两个评价指数，构成了电影的二维特征向量 $x$ ：

$x_1=电影的浪漫指数$ $x_2=电影的动作指数$

在这里插入图片描述
假设用户 $i$ 对于每个指数的偏好程度由向量 $θ^{(i)}$ 所衡量，则我们估计该用户对电影 $j$ 的打分为：

$y^{(i,j)}=(θ^{(i)})^Tx^{(i)}$

这就是基于内容的推荐系统，我们根据商品内容来判断用户可能对某个商品的偏好程度，本例中，商品内容就是电影具有的一些指数。我们也知道了，推荐系统中两个重要的维度：人和物。

另外，我们引入 $r (i, j)$ 表示第 $i$ 个用户是否对第 $j$ 部电影进行了打分：
$打过分0，otherwiser(i,j)=\begin{cases}1，用户\ i\ 对电影\ j\ 打过分\\0，otherwise\end{cases}$

目标优化

为了对用户 $j$ 打分状况作出最精确的预测，我们需要：

$min⁡θ(j)12∑i:r(i,j)=1((θ(j))T−y(i,j))2+λ2∑k=1n(θk(j))2\min_{\theta^{(j)}} \frac12 \sum_{i:r(i,j)=1} ((\theta^{(j)})^T-y^{(i,j)})^2 + \frac \lambda 2 \sum_{k=1}^n(\theta^{(j)}_k)^2$

那么对于所用用户 $1,2,...,n_u$ ，我们就需要：

$min⁡θ(1),θ(2),...,θ(nu)=12∑j=1nu∑i:r(i,j)=1((θ(j))Tx(i)−y(i,j))2+λ2∑j=1nu∑k=1n(θk(j))2\min_{\theta^{(1)},\theta^{(2)},...,\theta^{(n_u)}}= \frac12 \sum_{j=1}^{n_u} \sum_{i:r(i,j)=1} ((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})^2 + \frac \lambda 2 \sum_{j=1}^{n_u} \sum_{k=1}^n(\theta^{(j)}_k)^2$

代价函数 $J(θ(1),θ(2),...,θ(nu))J(\theta^{(1)},\theta^{(2)},...,\theta^{(n_u)})$ 就为：

$J(θ(1),θ(2),...,θ(nu))=12∑j=1nu∑i:r(i,j)=1((θ(j))Tx(i)−y(i,j))2+λ2∑j=1nu∑k=1n(θk(j))2J(\theta^{(1)},\theta^{(2)},...,\theta^{(n_u)}) = \frac12 \sum_{j=1}^{n_u} \sum_{i:r(i,j)=1} ((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})^2 + \frac \lambda 2 \sum_{j=1}^{n_u} \sum_{k=1}^n(\theta^{(j)}_k)^2$

参数更新

我们使用梯度下降法来更新参数：

$更新偏置（插值）：$ $\theta_0^{(j)}:=\theta_0^{(j)} - \alpha \sum_{i:r(i,j)=1} ((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})x_0^{(i)}$

$更新权重：$ $\theta_k^{(j)}:=\theta_k^{(j)} - \alpha (\sum_{i:r(i,j)=1} ((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})x_k^{(i)} + \lambda\theta_k^{(j)}),\quad\quad k\ne0$

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda