纵向联邦学习中的逻辑回归方案介绍

纵向联邦学习中的逻辑回归方案1，传统机器学习里的LR计算：y′=σ（wx）y^\prime=σ（wx）y′=σ（wx）。w为模型；目标：输入x得到输出。如何训练w：w:=w−g,其中g=(y′−y)xw:=w-g,其中g=(y^\prime-y)xw:=w−g,其中g=(y′−y)x如何停止：设置迭代次数和loss收敛阈值。2，纵向联邦里的LR联邦学习里首先对标签{0,1}改动为{1，-1}。然后

林立可

3253人浏览 · 2021-09-29 19:37:48

林立可 · 2021-09-29 19:37:48 发布

纵向联邦学习中的逻辑回归方案

1，传统机器学习里的LR

计算： $y′=σ（wx）y^\prime=σ（wx）$ 。w为模型；目标：输入x得到输出。

如何训练w： $w:=w−g,其中g=(y′−y)xw:=w-g,其中g=(y^\prime-y)x$
如何停止：设置迭代次数和loss收敛阈值。

2，纵向联邦里的LR

联邦学习里首先对标签{0,1}改动为{1，-1}。然后为了支持同态，对损失函数做了改动。

2.1，有第三方：

全局只有一对公私钥。第三方持有私钥，参与方持有公钥。

协作者的角色：负责解密梯度和损失，没啥了。
纵向逻辑回归

hetero_lr_multi_host
实现细节：
纵向LR细节

2.2，无第三方

构建一对公私钥

（该方案认为wx默认是安全的，所以没有加密）

出处：Parallel Distributed Logistic Regression for Vertical Federated Learning without Third-Party Coordinator

构建两对公私钥

两方纵向逻辑回归的模型训练过程

具体细节：

标签持有方A和参与方B各自生成公私钥。

符号定义：u=wx，其中w表示模型参数；x表示特征数据；y表示标签数据；【*】表示同态加密后的数据。

计算公式定义：

双方的损失函数： $Loss=log2−12ywx+18(wx2)Loss=log2-\frac{1}{2}ywx+\frac{1}{8}({wx}^2)$

模型迭代公式： $w:=w−α1m14(wx−2y)xw:=w-\alpha\frac{1}{m}\frac{1}{4}(wx-2y)x$ ，其中梯度 $∇L=14(wx−2y)x=dx=g\nabla L=\frac{1}{4}(wx-2y)x=dx=g$

训练一轮的具体执行过程：

（和上一方案初始时随机化参与方wx相比，该方案初始直接没用数据方的wx）

其实ub=wbxb可以直接明文发送过去，我们认为它是安全的。

A和B交换公钥；

A计算并发送 $u_A]pk_A,[u_A^2]pk_A$ ；B计算并发送 $[14uB−12y]pkB[\frac{1}{4}u_B-\frac{1}{2}y]pk_B$ ；

A计算并发送 $[∇LA+mA]pkB[\nabla L_A+m_A]pk_B$ ；B计算并发送 $[∇LB+mB]pkA[\nabla L_B+m_B]pk_A$ ，以及损失 $L]pk_A$ ；

AB各自解密对方的梯度；然后减去各自的掩码，即可获得更新后的梯度、模型。

（注意，此时梯度已经解密，各方能够拿到自己的明文梯度。此时需要对明文梯度进行安全性分析。）

重复此过程，直到达到最大迭代次数或者模型收敛。

预测的具体执行过程：

1，模型掌握在A,B双方，比如这里假设模型询问者为A：

A将数据分为 $XA,XA′X^A,X^{A\prime}$ ,A计算 $w_ax^A$ ;B计算 $wb[xA′]w_b[x^{A\prime}]$ 并返回；

A解密，并计算 $u=u_a+u_b$ ;输出结果 $11+e−u\frac{1}{1+e^-u}$ 。

2，模型掌握在A,B双方，询问者为第三方C：

C将数据分为两份，并加密发送给A,B双方；

A,B双方分别计算 $w_a[x^a]_c、w_b[x^b]_c$ 并返回给C；

C解密得到 $u=u_a+u_b$ ;输出结果 $11+e−u\frac{1}{1+e^-u}$ 。

3，推导细节

更多推导细节，参见手稿：

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。