公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111626217.X (22)申请日 2021.12.28 (71)申请人 国网浙江省电力有限公司电力科 学 研究院 地址 310014 浙江省杭州市下城区朝晖八 区华电弄 1号 (72)发明人 韩睿 姜雄伟 张弛 梅冰笑  刘黎 王文浩 史文彬 戴哲仁  温典 姜凯华 申剑 钱少锋  梁苏宁  (74)专利代理 机构 浙江翔隆专利事务所(普通 合伙) 33206 代理人 许守金 张建青 (51)Int.Cl. G06V 10/764(2022.01)G06V 10/774(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于深度残差网络的变电站安全帽识 别方法及系统 (57)摘要 本发明公开了一种基于深度残差网络的变 电站安全帽识别方法及系统, 属于变电站技术领 域。 本发明通过构建具有4个残差块的深度残差 网络对变电站安全帽进行识别, 有效提高了检测 识别准确率, 同时使 得训练深度网络变得更加容 易, 有效避免出现传统卷积网络随着深度增加存 在的梯度爆炸和梯度消失等问题。 进而, 本发明 构建的深度残差网络采用Dropout层, 以一定概 率使随机的神经元不工作, 能够 有效防止过拟合 现象。 同时, 本发明在训练时通过Softmax函数和 交叉熵函数相结合的方式来计算损失函数值, 提 高了训练效率, 减缓了训练得到的深度残差网络 训练模型的性能退化, 从而可以提取到更全面、 更准确的特 征, 方案详尽, 切实可 行。 权利要求书6页 说明书15页 附图5页 CN 114241247 A 2022.03.25 CN 114241247 A 1.一种基于深度残差网络的变电站安全帽识别方法, 其特 征在于, 包括以下步骤: 步骤1: 在变电站场景下获取N张安全帽图像, 将N张安全帽图像及安全帽图像对应的安 全帽检测标签图像构成训练集, 步骤2: 构建深度残差网络; 所述深度残差网络具有输入层、 隐藏层、 输出层; 所述隐藏层至少包括一个改进卷积层、 一个最大池化层、 四个残差块、 一个Dropout层、 一个全连接层; 输出层至少包括 一个Softmax回归分类 器; 步骤3: 将步骤1中的训练集输入到步骤2中的深度残差网络中, 对训练集中的安全帽图 像进行训练, 其训练方法如下: 第一步, 在Softmax回归分类器的输出端输出安全帽图像的概率分布及对应的安全帽 检测标签图像的概 率分布; 第二步, 根据第一步中的安全帽图像的概率分布与安全帽检测标签图像的概率分布, 并通过Softmax函数和交叉熵函数, 计算两个概 率分布之间的损失函数值; 步骤4: 重复执行步骤3共M次, 训练得到深度残差网络训练模型, 并得到N ×M个损失函 数值; 然后从所有损失函数值中找出值 最小的损失函数值; 接着将值最小的损失函数值对应的权值矢量和偏置项对应作为深度残差网络训练模 型的最优权值矢量和最优偏置项; 其中, M>1; 步骤5: 任意选取一张宽度为K且高度为G的安全帽图像作为测试图像; 然后将测试图像 输入到深度残差网络训练模型中进行预测, 预测得到测试图像的分类结果, 并将预测的分 类结果与安全帽图像实际情况进行对比, 验证深度残差网络训练模型 预测结果是否准确; 如果深度残差网络训练模型测试 结果准确, 则进行步骤6; 否则返回到步骤4; 步骤6: 将待预测的安全帽 图像输入到步骤5中的深度残差网络训练模型中进行预测, 预测得到待预测的安全帽图像的分类结果; 所述分类结果 为工人规范佩戴安全帽或工人 未规范佩戴安全帽。 2.如权利要求1所述的一种基于深度残差网络的变电站安全帽识别方法, 其特征在于, 所述步骤1, 训练集中包括有N1张工人规范佩戴安全帽的安全帽图像和N2张工人未规范 佩戴安全帽的安全帽图像, 对应作为 正类图像和负类图像; 然后将训练集中的第n张安全帽图像及其对应的安全帽检测标签图像对应记为Dn及 Fn true; 其中, 安全帽图像和安全帽检测标签图像为RGB图像, N≥200, N1+N2=N, N1和N2至少为N 的三分之一, 1≤n≤N, n的初始值为1, Dn、 Fn true的宽度为K且高度为G, 且K和G均能够被2整 除。 3.如权利要求1所述的一种基于深度残差网络的变电站安全帽识别方法, 其特征在于, 所述步骤2, 对于 输入层, 其输入端接收一张RGB图像, 其输出端输出RGB图像给隐藏层;权 利 要 求 书 1/6 页 2 CN 114241247 A 2其中, 要求RGB图像的宽度为K且高度为G; 对于隐藏层, 改进卷积层的输入端接收输入层的输出端输出的RGB图像, 改进卷积层的 输出端输出64幅宽度为 且高度为 的特征图, 将改进卷积层的输出端 输出的所有特征图 构成的集 合记为A1; 最大池化层的输入端接收A1中的所有特征图, 最大池化层的输出端输出64幅宽度为 且高度为 的特征图, 将最大池化层的输出端输出的所有特 征图构成的集 合记为A2; 第1个残差块的输入端接收A2中的所有特征图, 第1个残差块的输出端输出64幅宽度为 且高度为 的特征图, 将第1个残差块的输出端输出的所有特 征图构成的集 合记为A3; 第2个残差块的输入端接收A3中的所有特征图, 第2个残差块的输出端输出64幅宽度为 且高度为 的特征图, 将第2个残差块的输出端输出的所有特 征图构成的集 合记为A4; 第3个残差块的输入端接收A4中的所有特征图, 第3个残差块的输出端输出64幅宽度为 且高度为 的特征图, 将第3个残差块的输出端输出的所有特 征图构成的集 合记为A5; 第4个残差块的输入端接收A5中的所有特征图, 第4个残差块的输出端输出64幅宽度为 且高度为 的特征图, 将第4个残差块的输出端输出的所有特 征图构成的集 合记为A6; Dropout层的输入端接收A6中的所有特征图, Dropout层的输出端输出64幅宽度为 且 高度为 的特征图, 将Dropout层的输出端输出的所有特 征图构成的集 合记为A7; 全连接层的输入端接收A7中的所有特 征图, 全连接层的输出端输出一维向量; 其中, 最大池化层的步长为2, 全连接层的输入维度为64, 全连接层的输出维度为1024; 对于输出层, Softmax回归分类器的输入端接收全连接层的输出端输出的一维向量, Softmax回归分类 器的输出端输出概 率分布。 4.如权利要求3所述的一种基于深度残差网络的变电站安全帽识别方法, 其特征在于, 所述改进卷积层包括依次连接的第一卷积层、 第二卷积层、 第三卷积层; 第一卷积层的输入端作为改进卷积层的输入端, 第 一卷积层的输入端接收输入层的输 出端输出的RGB图像, 第一卷积层的输出端输出64幅宽度为K且高度为G的特 征图; 第二卷积层的输入端接收第 一卷积层的输出端输出的所有特征图, 第 二卷积层的输出 端输出128幅宽度为K且高度为G的特 征图; 第三卷积层的输入端接收第 二卷积层的输出端输出的所有特征图, 第 三卷积层的输出 端输出64幅宽度为 且高度为 的特征图, 第三卷积层的输出端作为改进卷积层的输出权 利 要 求 书 2/6 页 3 CN 114241247 A 3

.PDF文档 专利 一种基于深度残差网络的变电站安全帽识别方法及系统

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度残差网络的变电站安全帽识别方法及系统 第 1 页 专利 一种基于深度残差网络的变电站安全帽识别方法及系统 第 2 页 专利 一种基于深度残差网络的变电站安全帽识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 00:18:29上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。