位置基与图像基视觉伺服控制:控制律设计差异与适用场景划分

视觉伺服控制是一种利用视觉传感器(如相机)来引导机器人运动的技术,通过实时反馈调整机器人的位姿,使其达到目标状态。主要分为位置基视觉伺服(PBVS)和图像基视觉伺服(IBVS)。下面,我将逐步解释这两种方法的控制律设计差异,并划分其适用场景。内容基于机器人控制理论,确保真实可靠。

1. 位置基视觉伺服控制(PBVS)

在PBVS中,控制律设计基于从图像中估计的3D位置信息(如目标物体的笛卡尔坐标)。核心思想是直接最小化3D空间中的位置误差。

  • 控制律设计

    • 定义误差向量$\mathbf{e}$为目标位置$\mathbf{p}^$与当前估计位置$\mathbf{p}$的差:$\mathbf{e} = \mathbf{p}^ - \mathbf{p}$。
    • 控制律通常采用比例控制形式,生成机器人末端执行器的速度命令$\mathbf{v}$: $$ \mathbf{v} = -\lambda \mathbf{J}^{-1} \mathbf{e} $$ 其中,$\lambda > 0$是控制增益,$\mathbf{J}$是雅可比矩阵,描述机器人关节速度到3D位置变化的映射。
    • 雅可比矩阵$\mathbf{J}$的计算依赖于相机模型和机器人运动学。例如,对于一个6自由度机器人,$\mathbf{J}$是$6 \times 6$矩阵。
  • 关键特点:PBVS需要准确的3D重建和相机标定。如果估计误差大,控制性能会下降。

2. 图像基视觉伺服控制(IBVS)

在IBVS中,控制律设计直接基于图像特征(如特征点的像素坐标),无需3D重建。核心思想是最小化图像平面上的特征误差。

  • 控制律设计

    • 定义误差向量$\mathbf{e}$为目标特征$\mathbf{s}^$(如图像点坐标)与当前特征$\mathbf{s}$的差:$\mathbf{e} = \mathbf{s}^ - \mathbf{s}$。
    • 控制律使用图像雅可比矩阵(也称为交互矩阵)的伪逆: $$ \mathbf{v} = -\lambda \widehat{\mathbf{J}}^{+} \mathbf{e} $$ 其中,$\widehat{\mathbf{J}}$是图像雅可比矩阵的估计值,描述图像特征变化与机器人速度的关系,$\widehat{\mathbf{J}}^{+}$是其伪逆。
    • 图像雅可比矩阵$\widehat{\mathbf{J}}$依赖于特征类型和相机内参。例如,对于一个特征点,$\widehat{\mathbf{J}}$可表示为: $$ \widehat{\mathbf{J}} = \begin{bmatrix} -\frac{f}{z} & 0 & \frac{u}{z} & \frac{uv}{f} & -\left(f + \frac{u^2}{f}\right) & v \ 0 & -\frac{f}{z} & \frac{v}{z} & f + \frac{v^2}{f} & -\frac{uv}{f} & -u \end{bmatrix} $$ 其中,$f$是焦距,$z$是深度,$u,v$是图像坐标。
  • 关键特点:IBVS避免了3D重建,但对特征跟踪鲁棒性要求高。如果特征丢失,控制可能失败。

3. 控制律设计差异

PBVS和IBVS在控制律设计上的主要差异体现在误差定义、雅可比矩阵和计算复杂度上:

  • 误差定义

    • PBVS:误差在3D空间,$\mathbf{e} = \mathbf{p}^* - \mathbf{p}$,涉及位置或姿态。
    • IBVS:误差在2D图像平面,$\mathbf{e} = \mathbf{s}^* - \mathbf{s}$,直接基于像素。
  • 雅可比矩阵

    • PBVS:使用运动学雅可比矩阵$\mathbf{J}$,与机器人模型和3D几何相关,计算较复杂。
    • IBVS:使用图像雅可比矩阵$\widehat{\mathbf{J}}$,与相机模型和特征相关,需在线估计深度$z$,可能引入噪声。
  • 计算与鲁棒性

    • PBVS:需要精确的相机标定和3D估计,对校准误差敏感;但收敛速度快,适合高精度场景。
    • IBVS:无需3D重建,对相机标定误差鲁棒;但雅可比矩阵估计可能不稳定,导致收敛慢或振荡。

数学上,PBVS的雅可比矩阵$\mathbf{J}$是满秩的(假设机器人可操作),而IBVS的$\widehat{\mathbf{J}}$可能秩不足(如特征点少时),需伪逆处理。

4. 适用场景划分

根据控制律特性,PBVS和IBVS适用于不同场景:

  • PBVS适用场景

    • 环境结构化且3D信息易获取时,如工业装配线或手术机器人,其中目标位置已知。
    • 需要高精度位置控制的场景,例如机器人抓取固定物体。
    • 优点:收敛直接,轨迹平滑;缺点:依赖外部传感器(如深度相机),校准失败时性能下降。
  • IBVS适用场景

    • 环境非结构化或相机未校准时,如移动机器人导航或动态目标跟踪。
    • 特征丰富且易跟踪的场景,例如基于自然特征的视觉引导。
    • 优点:鲁棒性强,避免3D重建误差;缺点:特征丢失可能导致失败,且图像噪声影响大。
  • 混合方法:在实际应用中,常结合PBVS和IBVS(如2.5D方法),以平衡精度和鲁棒性。例如,在无人机着陆中,使用IBVS处理图像特征,PBVS处理高度控制。

5. 总结

位置基视觉伺服(PBVS)和图像基视觉伺服(IBVS)在控制律设计上核心差异在于误差空间和雅可比矩阵:PBVS基于3D位置误差,IBVS基于2D图像误差。PBVS适用于精确、结构化环境,但需高精度标定;IBVS适用于动态、非结构化场景,鲁棒性更好。选择时,需权衡计算资源、环境不确定性和控制目标。实践中,建议从仿真测试开始,以验证特定场景下的性能。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐