论文笔记-Optimized flocking of autonomous drones in confined environments
本文提出了一种应用于真实无人机群的协同导航算法,在现实环境中实现了稳定的集群飞行。该算法通过进化优化实例化了一个可调谐的集群模型,并解决了包括通信时延、动力学限制和障碍物在内的现实挑战。实验表明,在室外环境中共有30架无人机成功实现了自主飞行,并避免了碰撞和震荡问题。该方法结合了速度一致项和排斥力等关键因素,并通过优化参数提高了集群的整体性能和稳定性(ZLUNwu0gXDPFkoeiKI5j1asAr2H6.png)。
文章目录
-
- 个人总结
- 摘要
- Introduction
- Flocking model instantiation through evolutionary optimization
- Scalability in velocity
- Scalability in agent number with collective obstacle avoidance
- Experimental results with outdoor flying robots
- Discussion
- Materials and Methods
-
- A tunable self-propelled flocking model
- Repulsion
- Velocity alignment
- Interaction with walls and obstacles
- Self-propelling term
- Final equation of desired velocity
- Fitness function
个人总结

- Vicsek研究团队发表在《ScienceRobotics》期刊上的一篇文章
- 具体化无人机模型时需要考虑现实系统中存在的多种不确定性因素(通信时延、惯性效应、传感器更新频率不一致、通信距离限制、传感器噪声以及外部环境噪声)
- 研究人员采用类似的人工势场算法结合受力场来进行路径规划设计,在这种框架下包含了引力项以避免碰撞斥力项以实现速度一致性以及障碍物作用项以保证无人机能够规避障碍物
- 研究人员提出了6个评价指标并通过加权求和得到综合评价指标采用协方差矩阵自适应进化策略(CMA-ES)进行参数优化
- 在仿真环境中设定一个正方形区域允许添加静态障碍物为了实现对这些障碍物的有效避让研究人员采用了引入虚拟引导无人机的方法使它们以特定速度向中心移动从而干扰实际目标的行为
摘要
真实硬件环境中的协同算法实现相对罕见。由于这些算法未能充分考虑四旋翼系统的关键特性——包括运动限制、通信效能、延迟与噪声问题以及障碍物的明确表达——解决这些问题需要对模型进行适当的优化。
在此研究中, 我们开发并应用了一种新型无人机集群编队控制算法, 通过精心筛选和优化相关参数, 并结合指定函数进行精确配置, 最后通过进化计算技术对相关参数进行系统优化以实现预期效果。其中, 函数被成功应用于本研究的核心模块中, 并通过实验验证其在实际应用中的可行性与有效性。
在真实工作环境中运行稳定,在存在障碍物的情况下依然保持稳定性,并且在具有复杂环境条件下仍能保证良好的运行效果;实验阶段采用了30架自主飞行的小型无人机进行验证
Introduction
自然界的协同:
- 通过有限时间来构建有序的结构,并且确保各部分之间不会发生冲突。
- 对于外部威胁或阻碍而言能够迅速作出反应。
- 尽管该系统极其复杂性较高,在经过精心设计后实现了高度优化,并且呈现出一种和谐美感。
人工模拟的三个原则:短距离排斥;中等距离速度一致;远距离相互吸引。
在现实中,有以下几点需要克服的:
- 现实效果差异。仿真环境中的稳定模型,在实际应用中可能会导致系统振荡(由于时延、不确定性及动力学限制等重要因素的存在)。
- 适应性问题。基于开放空间设计的算法不适用于有限空间环境或存在障碍物的情况。
- 可扩展性限制。按照特定速度或集群数量设计的模型,在更高速度或更大规模集群环境下会出现性能失衡。
- 高维度挑战。真实环境中运行稳定的模型必然具备大量参数和复杂的非线性特性(这些都需要进行优化,并且要在合理时间内完成)。
在科学文献中存在的swarm有三种:
- 基于室内运动捕捉系统
- 基于GPS的室外
- 基于视觉导航的
我们的模型中
各速度一致项之间的相互作用距离或量级是动态变化的,并受到相对距离和相对速度的影响。最大速度差受相对距离决定,在较近的距离上必须保持较小的速度差,在较远的距离上则可以允许较大的速度差。我们采用的是加减速受限制的制动曲线。
我们的贡献主要体现在基于实例模型的研究中,即具有固定特殊参数的飞行器原型。仅凭模型还不够,还需将其参数具体化。将对其参数进行优化处理视为构建核心环节之一。
基于达尔文进化理论的研究表明, 自然界的系统已实现了其可调节参数的最佳配置。随着人工智能技术发展日益迅速, 未来可能会有更多的参数优化过程被纳入模型构建流程中。
我们采用基于群体的概率搜索方法来优化参数。其中包括遗传算法、进化策略等方法。在其中的协方差矩阵自适应进化策略(CMA-ES)是一种在连续参数空间中表现出色的优化器。
本文的主要贡献有:
- a flocking model that explicitly treats motion constraints by maintaining an improved balance between distance and velocity difference;
- a method to design individual drone controllers by optimizing self-organized group-level behavior in a complex, noisy, real-world system
- simulation of this system for presenting its scalability for wide velocity ranges and group sizes
- the demonstration of the framework with a fleet of 30 quadcopters, performing fully autonomous, synchronized outdoor flughts with collective collision and obstacle avoidance in a confined space.
Flocking model instantiation through evolutionary optimization
该模型采用精心设计的进化矩阵(包括顺序参数与适应函数)。通过应用进化的算法进行参数调整以实现最大的群聚一致性和最高速度的同时最小化碰撞。
首先,在无障碍方形区域内(边长为250米),群飞行速度设定为4、6、8米/秒,并对应的最大飞行速度也为4、6、8米/秒。在此区域内部署了100架无人机,并采用由仿真实验设定确定的参数向量构成适应度函数来构建优化模型;该优化模型中包含约39个决策变量,并通过持续1分钟的时间长度完成仿真实验;经过约15万次适应度评价后(即完成约15万次种群评估),优化算法收敛并找到了较优解;整个优化过程在超级计算机集群上得以高效执行
进化的评价标准有六个,每个量的评分都是0~1:
- reduced collision probability;
- reduced likelihood of collisions with walls
- enhanced velocity correlation
- velocity magnitudes closely approximate flocking speed
- increased cluster size
- reduced number of isolated agents
为了验证系统的稳定性并确保其可靠性,在完成速度优化后对该系统的关键参数进行了100次随机测试。测试结果显示最终得分略低于最高值,并且偶尔会出现碰撞现象。需要注意的是,在评价碰撞现象时所使用的函数必须是连续函数或步长不宜过大的函数;否则优化算法就无法有效确定梯度方向并进行修正操作。因此,在实际应用中我们不会将碰撞现象作为优先处理对象;相反地,在这种情况下偶尔仍会出现碰撞情况。针对该问题可供采用的解决方案主要有两种:其中一种可行的选择是第二种方案;这种方案虽然能够有效避免部分异常情况的发生但由于现实需求中需要在保证系统安全的前提下权衡灵活性与稳定性之间的关系因此在综合考虑后我们选择了第二种方案作为最终实施方案
- running the optimizer with a larger radius of collision or a larger communication delay to optimize to a solution where minimum interagent distances become larger
- increasing interagent distance (repulsion) manually after optimization with the harmless compromise of reducing overall velocity correlation in the enlarged flock.
Scalability in velocity
该系统中速度一致项在加速度受限情况下具有最高的可扩展性特征。通过后续实验实现了速度提升的效果,并达到了显著的性能指标。
| 速度 | 通信距离 | 边长 |
|---|---|---|
| 16 | 160 | 500 |
| 32 | 320 | 1000 |
最后的评分照样很高。
Scalability in agent number with collective obstacle avoidance
基于分布式架构设计的系统,在理论上能够处理的规模不受硬件资源限制。然而,在实际运行过程中会面临性能瓶颈问题。当系统规模扩大时,系统的性能可能会受到显著影响。例如,在特定负载下可能出现大规模机群在短时间内出现拥塞现象时。这与自然界中群体恐慌的现象相类似,在社会学研究中已经形成了一套成熟的分析模型。通过类比分析方法能够帮助我们更好地理解此类复杂系统的动态行为规律。
Experimental results with outdoor flying robots
在实际中飞了30架无人机,对仿真优化的参数做了几处修改:
- 增大会导致排斥力增强以避免物体碰撞。
- 增加会使得速度保持一致从而避免系统可能出现振荡现象。
- 通过减少高频噪声的影响并扩大作用范围来平衡整体效果。
为了评价飞行的质量,我们计算了下面的一些参数值:
the cluster-dependent velocity correlation (\phi^{corr})
the average velocity (\phi^{vel})
the average and minimum of interagent distances (\min r_{ij} and \bar{r}_{ij}^{\min})
该速度量在局部极角坐标系(LAP)中以归一化形式表示。
该量用于描述旋转方向和程度,在单位归一化下具有明确的物理意义。
当φ值为1时表示逆时针方向运动;当φ值为-1时则表示顺时针方向运动。
\phi^{LAP}=\dfrac{v_yr_x-v_xr_y}{v^{flock}\sqrt{r_x^2+r_y^2}}
仿真和真实的实验证明了:
- 运动过程中的显著振动与冲撞现象并不存在。
- 运动表现得既平稳又富有动感,在转弯动作、撞击墙面以及快速射向直角角落时尤其流畅;而当遇到障碍物时,则会自动分队。
Discussion
当前存在的主要问题是缺乏对系统稳定性的严格评估。为此,我们采用了包含评价函数以及限定参数范围的方法进行处理。
Materials and Methods
A tunable self-propelled flocking model
模型请看下面两篇论文
- 自主飞行机器人集群运动控制算法
- 户外集群运动与飞行编队管理
Repulsion
线性的类似于弹簧的排斥力。
Velocity alignment
速度一致
Interaction with walls and obstacles
在障碍物边缘虚拟出欺骗无人机,他们以一定的速度朝向中心。
Self-propelling term
额外的项,速度方向平行于它自己的速度方向,速度的大小等于v^{flock}
Final equation of desired velocity
环境参数是固定的,需要优化的是飞机参数、算法参数等。
