公共安全标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210722984.9 (22)申请日 2022.06.24 (71)申请人 北京理工大 学 地址 100081 北京市海淀区中关村南大街5 号 (72)发明人 王建中 张晟 边少博 徐浩楠 (74)专利代理 机构 北京理工大 学专利中心 11120 专利代理师 李爱英 (51)Int.Cl. G06T 7/246(2017.01) G06T 7/73(2017.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于深度元强化学习的无人武器平台视觉 主动跟踪瞄准方法 (57)摘要 本发明公开了一种基于深度元强化学习的 无人武器平台视觉主动跟踪瞄准方法, 基于UE4 仿真引擎搭建虚拟仿真环境, 生成一系 列无人武 器平台视觉主动跟踪瞄准任务组成训练集和测 试集; 利用深度强化学习近端策略优化算法构建 深度元强化学习模型; 设计跟踪瞄准任务的奖励 函数, 在训练集中训练深度元强化学习模型直到 模型收敛; 在测试集中测试收敛的模型; 将模型 部署在无人 武器平台上, 验证模 型在现实环境中 的性能, 实现快速适应新任务, 提高无人武器平 台视觉主动跟踪瞄准系统的泛化能力和跟踪瞄 准精度。 权利要求书2页 说明书4页 附图3页 CN 115187631 A 2022.10.14 CN 115187631 A 1.基于深度 元强化学习的无人武器平台视觉主动跟踪瞄准方法, 其特征在于该方法的 步骤包括: 步骤S1, 基于UE4仿真引擎搭建虚拟仿真环境, 生成一系列无人武器平台视觉主动跟踪 瞄准任务组成训练集和 测试集; 步骤S2, 利用深度强化学习P PO算法和LSTM网络构建深度元强化学习模型; 步骤S3, 设计跟踪瞄准任务的奖励函数, 在训练集中训练深度元强化学习模型直到模 型收敛; 步骤S4, 在测试集中测试按照步骤S3训练至收敛的模型; 步骤S5, 将步骤S4测试后的模型部署在无人武器平台上, 实现无人武器平台视觉主动 跟踪瞄准。 2.根据权利要求1所述的基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方 法, 其特征在于: 所述的步骤S1中, 基于UE4仿真引擎搭建虚拟仿真环境时随机改变环境参数、 随机改变 无人武器平台参数以及随机改变目标参数。 3.根据权利要求2所述的基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方 法, 其特征在于: 所述的环境 参数包括 光照、 地形、 障碍物、 颜色和纹 理; 所述的无 人武器平台参数包括摩擦系数、 质量、 质心位置、 惯性矩阵和形状尺寸; 所述的目标参数为目标种类、 初始位置、 初始速度、 颜色和纹 理。 4.根据权利要求1 ‑3任一所述的基于深度 元强化学习的无人武器平台视觉主动跟踪瞄 准方法, 其特 征在于: 所述的步骤S1中, 测试集中的任务 不包括在训练集中, 目标包括 地面目标和空中目标。 5.根据权利要求1所述的基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方 法, 其特征在于: 所述的步骤S2中, 深度强化学习PPO算法包括评价网络和策略网络, 评价网络和策略网 络都是由LSTM网络组成。 6.根据权利要求5所述的基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方 法, 其特征在于: 深度强化学习PPO算法的详细步骤为: 以当前时刻堆叠的视频序列、 前一时刻的动作和 当前时刻的奖励值作为输入, 经过卷积神经网络和全连接网络提取特征, 将所提取 的特征 输入到策略网络和评价网络中, 策略网络输出无人武器平台的动作, 评价网络输出状态动 作价值。 7.根据权利要求1所述的基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方 法, 其特征在于: 所述的步骤S3中, 深度元强化学习模型是通过最大化最终奖励来实现跟踪瞄准任务, 设计跟踪瞄准任务的奖励函数, 在训练集中训练深度元强化学习模型直到模型收敛。 8.根据权利要求7所述的基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方 法, 其特征在于: 跟踪瞄准任务的奖励函数分为无 人平台奖励ragent和武器云台奖励rweapon两部分:权 利 要 求 书 1/2 页 2 CN 115187631 A 2r=ragent+ μrweapon,(if wagent_yaw<wprecision: μ=1else: μ=0) 其中, Δx和Δy表示无人武器平台与目标之间在世界坐标系下的x轴和y轴的偏移量; wagent_yaw为无人平台中心线对准目标所需的偏航角; wprecision为无人平台的运动控制分辨 率; wweapon_yaw和wweapon_pitch为武器云台上武器中心线瞄准目标中心点所需的偏航角和俯仰 角。 9.根据权利要求1所述的基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方 法, 其特征在于: 所述的步骤S4中, 在测试集中测试训练至收敛的模型的方法为: 将武器云台上的武器替换为相机进行测试, 当模型在测试集的所有任务中满足以下指 标则判定模型能够稳定精确地跟踪目标; dtarget‑dsafe≤Δd taim≥Δt 其中, dtarget表示无人武器平台和目标之间的距离; dsafe表示无人武器平台和目标之间 需要保持的安全距离; Δd表示允许的距离误差; Δxtarget和Δytarget表示武器 云台上相机的 图像的中心点到目标中心点在像素坐标系 下x轴和y轴偏移量; Δσ 表示允许的瞄准精度误 差, taim表示连续满足前两条指标时的跟踪瞄准时长; Δt 表示最小跟踪瞄准时长 。 10.根据权利要求1所述的基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方 法, 其特征在于: 将步骤S4测试后的模型部署在军用无人武器平台上进行应用, 并执行跟踪任务、 侦查 任务和瞄准攻击任务, 输入当前时刻相 机采集的视频序列、 当前时刻的奖励和前一时刻的 动作, 输出无人武器平台的动作指 令, 自主跟踪、 瞄准和攻击目标或是将步骤S4测试后的模 型部署在采集虹膜或人脸信息系统上。权 利 要 求 书 2/2 页 3 CN 115187631 A 3
专利 基于深度元强化学习的无人武器平台视觉主动跟踪瞄准方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 09:51:25
上传分享
举报
下载
原文档
(494.7 KB)
分享
友情链接
T-CES 184—2022 中低压配电网快速插拔电缆连接器配置技术导则.pdf
DB32-T 4144-2021 公共信用信息平台运行维护管理规范 江苏省.pdf
AQ 1037-2007 煤矿用无极绳绞车安全检验规范.pdf
ISO 13997 2023 Protective clothing — Mechanical properties — Determination of resistance.pdf
青藤云安全 威胁狩猎实践指南.pdf
GB-T 42961-2023 植被生态质量的气候变化影响评价方法.pdf
GB-T 30810-2014 水泥胶砂中可浸出重金属的测定方法.pdf
YD-T 1728-2008 电信网和互联网安全防护管理指南.pdf
DB15-T 835-2015 磷石膏改良碱化土壤技术规程 内蒙古自治区.pdf
GB-T 39155-2020 金属和合金的腐蚀 海港设施的阴极保护.pdf
GB-T 38636-2020 信息安全技术 传输层密码协议(TLCP).pdf
GB-T 20257.3-2017 国家基本比例尺地图图式 第3部分:125 000 150 000 1100 000地形图图式.pdf
GB-T 38667-2020 信息技术 大数据 数据分类指南.pdf
GB-T 19596-2017 电动汽车术语.pdf
GB-T 20985.1-2017 信息技术 安全技术 信息安全事件管理 第1部分:事件管理原理.pdf
GB-T 2007.2-1987 散装矿产品取样、制样通则 手工制样方法.pdf
DB31-T 1449-2023 燃料电池电动汽车运行安全和维护技术要求 上海市.pdf
网络安全事件应急演练之实施过程.docx
GB-T 29157-2012 浮法玻璃生产生命周期评价技术规范 产品种类规则.pdf
DB31-T 1339-2021 医院多学科诊疗管理规范 上海市.pdf
1
/
3
10
评价文档
赞助2元 点击下载(494.7 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。