卡尔曼滤波是如何解决目标跟踪问题的?

电子说

1.3w人已加入

描述

初探卡尔曼滤波的广泛应用

卡尔曼滤波是基于线性系统的基础上,测量方差已知的前提下,在包含一系列噪声的观测数据中进行系统状态的最优估计,得到误差最小的估计值。

众所周知该方法经久不衰几十年,涉及领域包括机器人导航、运动控制、传感器融合、图像处理等。仅在无人驾驶中,我们就多处看到它的身影,比如:

  • 感知模块
  • 融合模块
  • 定位模块
  • 控制模块

以感知中目标跟踪为例,卡尔曼滤波可以用来预测下一时刻行人运动的最优位置,不仅可以滤除检测带来的虚警,还可以弥补偶发的漏检,使目标的运动过程更加平滑。如下图所示:从T0到T7时刻,检测器对行人A的观测结果大部分是良好的,但是在T3时刻出现了虚警B,此时卡尔曼滤波器会根据T3的前后时刻来判断行人B是一个新的对象还是噪声;在T4时刻检测器再次失效,行人A消失了,此时卡尔曼滤波器会根据T3时刻行人A的位置来估计T4时刻A可能运动到某处作为结果。

滤波器

既然线性系统是卡尔曼滤波的前提,那么为何它还能如此广泛应用?

以车辆运动模型为例,虽然在整个运动过程中很难拟合出其运动规律,但是如果把每次运动的时间间隔都缩的很小,那么就可以近似的将车辆的运动看成匀速、匀加速、均减速等。

入门卡尔曼滤波的基本原理

卡尔曼滤波器采用递归的方式来解决线性问题,只需上一个时刻的估计值和当前的测量值来进行状态估计,并使估计均方误差最小。作为初步理解,我们只需要看下面两个方程:

预测方程如下所示:

滤波器

其中A是状态转移矩阵,用来表达如何将上一时刻的状态量通过某种关系转换成当前状态;B是控制输入矩阵,但是在实际应用中这一项通常为0;w表示的过程噪声,是期望为0,方程为Q的高斯白噪声。

观测方程如下所示:

滤波器

很多初学者会对观测方程产生疑问,为什么它可以由状态值和观测误差来表示?观测量不是指传感器直接输出吗?

其实它是对传感器测量的模拟仿真,用真值加上误差来表征传感器的测量值,而H可以看成是状态量到观测量的一种变换关系。我们将状态变换过程和模拟的观测过程合起来就是下面的流程图:

滤波器

因此使用卡尔曼滤波器解决实际问题,就需要满足两大基本假设:

  • 需要满足线性系统
  • 需要符合高斯分布

进阶卡尔曼滤波的公式推演

卡尔曼滤波过程有五大核心公式,手撸版本如下:公式(1)(2)属于预测过程,公式(3)(4)(5)属于状态更新。我们一条条来解释这几个公式:

滤波器

滤波器

上式是先验估计的求解过程:由上一时刻的最优估计值结合控制输入和环境噪声来预测当前的状态估计值。在很多时候该公式会被简化成当前估计值等于上一时刻最优估计+噪声,在目标跟踪任务中BU项是可以被忽略的,A表示的是状态转移矩阵或者说是运动模型,如何准确的构建状态矩阵需要用户结合自身场景来确定。所以像EKF,UKF等并非从算法上对KF做了什么优化,而是搭建更合适的运动模型来模拟实际场景。

滤波器

上式是先验估计的协方差求解过程:由上一时刻的先验估计协方差P和过程噪声Q决定(推导的过程可以对公式(1)的当前估计值求取协方差即可得到)。这里我们会发现先验估计协方差P中是包含过程噪声Q的,所以当P越小会导致卡尔曼增益K就越小(这里需要结合卡尔曼增益K的公式一起看)。

滤波器

上式是更新卡尔曼增益的过程:它其实是一个中间变量,我们在说先验估计协方差P的时候提到,P中是包括过程噪声Q的,那么结合该式可以发现卡尔曼增益K的调节本质上就是调节Q和R两个噪声值。

  • K越小越相信模型的预测估计;
  • K越大越相信传感器中的观测;
  • 所以K的值和传感器精度以及环境误差有关;

滤波器

上式是最优估计的修正过程:这里Z是我们的观测值,X相当于我们的预测值,直接拿观测值和预测值做差,用K来决定是相信观测值Z多一些还是相信预测值X多一些。

滤波器

上式是更新后验估计的协方差过程:主要用于下一次迭代的输入,属于一个中间变量,一旦P0这个初始值确定后,该值会慢慢趋于收敛(通过调Q)。算法调优时可以不用特别关注该项。

深入卡尔曼滤波的参数调优

卡尔曼滤波是一个需要手动调参的算法,在上面的介绍中我们提到最优估计值是先验估计和观测值之间的权衡,而这个权重是通过卡尔曼增益K进行调节的。通过K的推导公式可以发现它的大小取决于超参数Q和R。

回顾一下上一节公式中的Q和R是什么?

在卡尔曼滤波的过程中有两种噪声,过程噪声和观测噪声:

  • 过程噪声:外界环境引入的误差;
  • 观测噪声:传感器自身的误差;

它们均符合正态分布,Q就是过程噪声的方差,Q值越小表示对预测值的信任度越高,但是过小的Q也会引起系统发散;Q值越大表示对测量值的信任度就会变高。

R是观测噪声的方差,R值越小表示系统的初始增益大,收敛快更快,但是在稳态情况下引入过多的噪声容易出现震荡不收敛的现象;R值越大表示对测量值的信任度降低,响应也会随着变慢。

另一个超参数就是P的初始值,它决定了滤波器初始的工作状态,更准确的说就是滤波器初始的收敛速度。调大P0能够迭代出较大的初始增益,相应的使滤波器更快的响应输入信号的变化。

所以卡尔曼滤波调参是在P0,Q,R之间追求系统和滤波之前的收敛平衡。对于初学者而言,通常不太关心P0,只需不为0即可;而Q和R需要一点点尝试,适当的增加/减小参数,反复迭代才能逐步收敛于一个稳定值。

实践卡尔曼滤波的目标跟踪

多目标跟踪有很多方法,可以使用当前帧和之前帧中的信息做当前时刻的目标跟踪;也可以对每一帧的预测使用所有帧中的信息寻找全局最优。

这里我们基于卡尔曼滤波算法将运动模型看似线性匀速运动来估计帧间位移,并结合匈牙利算法进行预测的外接框和检测的外接框做数据匹配,最终选择合适的目标外接框作为最优跟踪BBox。应用于图像空间需要以下几步:

  • IoU作为前后帧间目标关联的衡量标准;
  • 卡尔曼滤波器预测目标的当前位置;
  • 匈牙利算法进行检测框和预测框数据关联;

估计模型

这里我们采用卡尔曼滤波对目标的轨迹进行预测,并且使用置信度较高的跟踪结果进行预测的修正。

数据关联

这里我们采用带权重的匈牙利算法,使用IoU构建的权重作为成本矩阵,当然这里的权重还可以以不同维度的特征做加权。

实验例子

下面是一个基于C++实现的检测+跟踪的例子,直接原生的算法未做任何优化,所以并非工程可用,但也更能暴露算法本身的缺陷,从而加以针对性的优化策略。从视频中我们可以看到基于卡尔曼滤波+数据关联的跟踪算法对独立目标具有稳定的输出,但是当目标较远时或者存在遮挡的情况下,id就会发生漂移。我们可以从以下三个方面来分析:

  • 检测角度:基于检测的跟踪算法,必然检测的稳定性是关键,与其把重心放在跟踪算法的优化上,不如先把目标检测弄稳定,好在当下图像级别的目标检测已经达到了很高的性能,具备了模型小,推理快,精度高的优势。
  • 数据关联:视频中的车辆跟踪失效,很大一部分原因出在当前帧的检测框和基于上一帧的预测框之间外接框匹配算法上,这里仅使用了IoU来匹配两个框的关联性,但是此类形态上的重合度无法解决目标被遮挡后的匹配问题,而且在远距离处外接框较小,当目标个数较多时,很容易造成混乱。至于如何优化数据关联算法,小伙伴们可以考虑特征级别或者多维度级联的方式!
  • 估计模型:这里说的就是卡尔曼滤波算法了,我们用的是均速模型表针车辆的运动模型,虽然极小的时间间隔中,这种模型带来的误差也能接受,但是为了更好的构建运动方程,也可以考虑采用扩展卡尔曼或者无迹卡尔曼来拟合车辆的非线性运行。
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分