11.1 概率无向图模型

11.1.1 模型定义

式子(11.3)推导补充
P(Yv,YO∣YW)=P(Yv∣YW,YO)P(YO∣YW)=P(Yv∣YW)P(YO∣YW) \begin{aligned} P(Y_v,Y_O|Y_W)&=P(Y_v|Y_W,Y_O)P(Y_O|Y_W)\\ &=P(Y_v|Y_W)P(Y_O|Y_W) \end{aligned} P(Yv,YOYW)=P(YvYW,YO)P(YOYW)=P(YvYW)P(YOYW)
两边同时消去P(YO∣YW)P(Y_O|Y_W)P(YOYW),因此得到式子(11.3)

11.2 条件随机场的定义与形式

【例题】11.1

IMG_0366

11.2.4 条件随机场的矩阵形式

这里主要记录一下矩阵的表示形式,另外两种是比较好理解的

对观测序列x的每一个位置i=1,2,⋯ ,n+1i=1,2,\cdots,n+1i=1,2,,n+1,定义一个m阶矩阵(m是标记y的取值个数,yi−1和yiy_{i-1}和y_iyi1yi位置上均有m种取值),举例来说,当m=3时,除了i=1和i=n+1时,每个矩阵Mi(x)∈R3×3M_i(x)\in R^{3\times3}Mi(x)R3×3,如下图所示:

IMG_0367

由上图知道第一个矩阵和最后一个矩阵不是m×mm\times mm×m的,然后参考统计学习书上的例子将其其余部分用0填充变成m×mm\times mm×m并且最后一个矩阵的元素应该为1,因为yn+1y_{n+1}yn+1只有一个状态stop。

【例题】11.2

矩阵M1(x),M2(x),M3(x)中的a,b,cM_1(x),M_2(x),M_3(x)中的a,b,cM1(x),M2(x),M3(x)a,b,c可以理解为上一章隐马尔可夫模型当中的状态转移矩阵中的值,例如a01a_{01}a01理解为前一个状态为0,转移到状态为1的概率为a01a_{01}a01,b,c同样理解,于是就可以理解M1(x),M2(x),M3(x),M4(x)M_1(x),M_2(x),M_3(x),M_4(x)M1(x),M2(x),M3(x),M4(x)为什么那样写了,至于为什么M4(x)中第一列的值为1M_4(x)中第一列的值为1M4(x)1也很好理解,因为最后一个状态只能是stop,所以概率就为1了。

image-20220428230203269

状态序列长度为3,每个状态有2种,所以总共有232^323种路径,解释一下下图的意思

image-20220428231356701

例如a01b11c11a_{01}b_{11}c_{11}a01b11c11,首先start=0,所以开头都是从0开始,a01b11c11a_{01}b_{11}c_{11}a01b11c11表示的是第一个状态为1,第二个状态为1,第三个状态为1的概率。其他的类似解释,8条路径就把所有可能的路径例举完了。8个式子相加就是所有路径的非规范化概率之和,即规范因子Zw(x)Z_w(x)Zw(x)M1(x)M2(x)M3(x)M4(x)M_1(x)M_2(x)M_3(x)M_4(x)M1(x)M2(x)M3(x)M4(x)相乘的非零元素也会等于Zw(x)Z_w(x)Zw(x),可以自己验证下。

11.5条件随机场的预测算法

【例题】11.3

IMG_0369

IMG_0370

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐