下书网

故事栏目

外国小说文学理论侦探推理惊悚悬疑传记回忆杂文随笔诗歌戏曲小故事
下书网 > 小故事

基于地图重构的蜂窝连接无人机在线路径规划方法*

时间:2023-04-12 11:58:56

基于地图重构的蜂窝连接无人机在线路径规划方法*一文创作于:2023-04-12 11:58:56,全文字数:17887。

基于地图重构的蜂窝连接无人机在线路径规划方法*

区域无线电地图进行重构恢复。假设无人机首先在目标空域随机采样N个数据点,记为xi(i=1,2,3…,N)。将稀疏采样后得到的无线电地图表示为y0,称为等待重构的退化的图像。随后,无人机基于y0重构无线电地图。将无线电地图重构表示为误差最小化优化问题,表示为:

新课程标准明确指出,读是小学语文教学的重要任务,有感情地朗读课文能够使学生受到情感的熏陶,这也是语文学习的重中之重。课堂教学是开展教学工作的主要场所,教师应结合诵读内容,采取丰富的教学形式,指导学生进行有感情诵读,不断提升学生的诵读能力。

其中e(·) 为与重构有关的数据项,y表示重构的无线电地图。R(y) 是一个正则化项,用以表示自然图像上的一般先验。地图重构的目标是找到问题(9)的最优解y*。在本文中,用神经网络隐含的先验信息代替正则化函数,用神经网络fθ(·) 映射代替待重构的地图y,即:

优化变量θ*可以通过参数随机初始化的随机梯度下降来求得。其中,z是一个固定的包含32 个特征图的三维张量,其空间大小与y相同;网络的输入是随机初始化的z;θ是网络参数,通过训练得到最优值。得到最优参数θ后,输入z得到最优的y,然后得到重构的无线电地图。

为了求得最优的无人机飞行路径,无人机在满足良好的UAV-GBS 连接质量的约束前提下,最小化任务执行过程中的飞行能耗,于是优化问题可以表示为:

由于优化问题的非凸性和较大的搜索空间,传统的优化方法很难得到最优解。为了求解该问题,在下一节中提出了一种基于地图重构的深度强化学习路径规划方法。

3 基于地图重构的深度强化学习路径规划方法

在本节中,首先提出了基于深度图像先验(DIP,Deep Image Prior)的地图重构算法。随后基于重构地图利用D3QN 算法进行路径规划。无人机通过尝试不同的动作(action),从反馈(reward)中学习,然后加强动作,直到动作产生最佳的反馈。本文所提出的基于地图重构的深度强化学习路径规划方法流程如图2 所示。

图2 DIPRMR-D3QN路径规划方法流程图

3.1 基于深度图像先验的地图重构算法

卷积神经网络在图像重构方面具有较好的性能,它通过从大量的训练样本中进行学习来逼近原图像。然而,生成器网络在未经学习的情况下也能包含大量的低级图像信息,即生成器网络具有先验特性,不需要训练集和未损坏的原始图像并训练,只需要通过一张待重构的退化图像作为输入,便可以对其进行恢复。在此基础上,本文提出了一种基于深度图像先验的无线电地图重构(DIPRMR,Deep Image Prior based Radio Map Reconstruction)算法。待重构的无线电地图定义为R∈Cm×n,即:

在DIPRMR 算法中,低分辨的输入图像为无人机采样得到的稀疏无线电地图。将采样倍率(需重构的地图的长和宽上像素点数量减少的倍数)定义为s,于是采样得到的地图表示为y0∈R(m/s)×(n/s)。将重构倍率(重构后的地图像素点数量与重构前的比值)定义为u,则重构得到的地图y表示为y∈Ru(m/s)×u(n/s)。因此,重构任务中的数据项为:

其中d(·) :y∈ Ru×(m/s)×u×(n/s)→y0∈R(m/s)×(n/s)将 图像大小 调整为(m/s) ×(n/s)。最后,通过迭代求解找到重构后与低分辨图像y0相似的高分辨图像y,即:

算法具体步骤如算法1 所示。

算法1 基于深度图像先验的地图重构算法(DIPRMR)

3.2 基于D3QN的无人机路径规划方法

在本文所考虑场景中,无人机的路径规划问题可以表示为一个马尔可夫决策过程(MDP,Markov Decision Process)。用一个四元组变量表示MDP:状态S,动作A,状态转移概率P和反馈R。其中,状态空间包含了无人机在给定飞行区域内的所有可能的位置;动作空间A包含无人机的飞行方向;状态转移概率P根据当前状态和后续飞行方向确定;反馈函数R定义为,其中μ是无人机在停机时产生的惩罚,设置为一个较大的常数。算法具体步骤如算法2 所示。

算法2 基于D3QN 的无人机在线路径规划方法(DIPRMR-D3QN)

不同于传统方法,算法2 中无人机不需要直接与环境交互,而是在无人机执行任务前就重建一个与实际环境高度吻合的无线电地图。在强化学习中,智能体直接从无线电地图中提取数据,获得经验中断概率,从而获得反馈值,利用训练数据调整无人机的飞行路径。

由于该问题中的状态空间和动作空间是连续的,本文在保持状态空间连续的同时,将动作空间A离散为四个飞行方向,即。动作空间的离散化使得动作值函数的状态输入是连续的,动作输出是离散的。本文采用Dueling Double DQN(D3QN)网络架构。在每一集的每一步中,将无人机的状态,即无人机的当前位置设置为神经网络的输入,输出为无人机的飞行方向。最终基于训练得到的神经网络,无人机能够根据无线电地图,在任意位置选择出最佳飞行方向,从而完成路径规划。

4 仿真结果与分析

在本节中,对所提出的算法进行仿真实验。考虑一个2 km×2 km 包含高层建筑的区域。假设在该区域内部署了2 个GBS,其天线高度设为25 m。为了计算无人机从每个基站接收到的信号强度,首先根据建筑遮挡情况判断无人机与每个BS 之间是否存在LoS 链路,然后计算UAV-GBS 的路径损耗。为了准确模拟给定环境下的UAV-GBS 信道,基于国际电信联盟(ITU)提出的统计模型来生成建筑物的位置和高度。假设建筑物覆盖的土地面积占总土地面积的比例αbd=0.3;单位面积建筑的平均数βbd=300;建筑高度分布的参量γbd=50 m,且建筑高度不超过90 m。将与基站的连通性权重设置为一个较大的值,以保证无人机与地面良好的通信连接。最后,假设该区域的每个维度上有201 个数据点,即m=n=201。因此数据点总数为201×201。

图3 比较了采样倍率分别为s=2,4,8,16 时基于DIPRMR 重构得到的地图(分别用DIP2、DIP4、DIP8 和DIP16 表示)和s=4 时基于球面变异函数模型的Kriging 算法重构得到的地图(用SPH4 表示)的峰值信噪比(PSNR,Peak Signal to Noise Ratio)。结果表明PSNR 随着采样倍率的增加而降低。采样倍率相同时,DIPRMR 算法重构的无线电地图的PSNR 明显高于Kriging 算法。因此,与Kriging 算法相比,本文所提方法能够达到更好的地图重构效果,且采样点越多,重构效果越好。

图3 不同采样倍率下重构地图的峰值信噪比

图4 比较了不同采样倍率下,基于不同重构方法得到的地图飞行的平均中断概率与实际平均中断概率的归一化均方误差(NMSE)。结果表明NMSE 随着采样倍率的增加而增加。并且,

提醒您:因为《基于地图重构的蜂窝连接无人机在线路径规划方法*》一文较长还有下一页,点击下面数字可以进行阅读!

《基于地图重构的蜂窝连接无人机在线路径规划方法*》在线阅读地址:基于地图重构的蜂窝连接无人机在线路径规划方法*

热门书籍

热门书评

推荐小故事