公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111513183.3 (22)申请日 2021.12.12 (71)申请人 南京理工大 学 地址 210094 江苏省南京市孝陵卫20 0号 (72)发明人 权迎雪 刘伟伟 朱伟佳 陈浩  (74)专利代理 机构 南京理工大 学专利中心 32203 代理人 陈鹏 (51)Int.Cl. H04L 9/40(2022.01) H04L 67/02(2022.01) H04L 41/16(2022.01) G06N 3/04(2006.01) (54)发明名称 基于多特征融合学习的HTTP/2页面访问流 量识别方法 (57)摘要 本发明公开了一种基于多特征融合学习的 HTTP/2页面访问流量识别方法, 该方法首先对目 标HTTP/2站点在典型用户交互过程中产生的主 页访问流量以及资源响应流量进行采集; 对流量 数据进行预处理后得到完整的TCP流; 一方面使 用自编码网络捕获主页访问流量的内容分布规 则特征, 另一方面使用递归神经网络识别资源响 应流量的主体 资源类别; 进一步将内容分布规则 特征和主体资源类别特征进行融合拼接, 输入到 卷积神经网络模型中, 得到站点页面识别结果。 本发明利用多条数据流作为指纹提取的基本单 位, 通过深度学习方法对不同类型数据流进行特 征提取, 并融合多特征对目标站点进行充分表 征, 从而提高HT TP/2页面访问流 量的识别精度。 权利要求书2页 说明书3页 附图3页 CN 114205151 A 2022.03.18 CN 114205151 A 1.一种基于多特征融合学习的HTTP/2页面访问流量识别方法, 其特征在于, 包括如下 步骤: 步骤1, 采集目标HTTP/2站点在典型用户交互过程中产生的主页访问流量以及资源响 应流量; 步骤2, 对流 量数据进行 预处理操作后得到 完整的TCP流; 步骤3, 使用自编码网络捕获主页访问流 量的内容分布规则特 征; 步骤4, 使用递归神经网络识别资源响应流 量传输的主体资源类别; 步骤5, 将内容分布特征向量和主体资源特征向量进行融合拼接, 输入卷积神经网络得 到HTTP/2页面 流量结果。 2.根据权利要求1所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其特 征在于, 所述步骤1包括: 使用自动化脚本工具启动浏览器, 在目标站点模拟典型用户交互 以产生流量样本; 使用数据包捕获工具将目标站 点产生的主页访问流量以及资源响应流量 进行离线存 储。 3.根据权利要求2所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其特 征在于, 所述流量样 本包括: 利用两种浏览器在随机时间点对目标HTTP /2站点进 行访问, 且 站点个数不少于10个。 4.根据权利要求1所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其特 征在于, 所述步骤2包括: 过滤流量样 本, 丢弃捕获过程中产生的噪音 数据; 以四元组为单位 对流量数据进行整合以得到完整的TCP流; 所述四元组包括源IP, 源端口, 目的IP, 目的端 口。 5.根据权利要求1所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其特 征在于, 所述步骤3包括: 针对目标站点产生的主页访问流量, 提取数据包有向长度序列以 及数据包间隔时间序列; 将序列信息输入自编码网络, 以捕获主页访问流量的内容分布特 征向量。 6.根据权利要求1所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其特 征在于, 所述步骤4包括: 针对目标站点产生的资源响应流量, 提取数据包有向长度序列以 及数据包间隔时间序列; 将序列信息输入递归神经网络, 以识别 资源响应流量传输的主体 资源类型。 7.根据权利要求6所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其特 征在于, 所述主体资源类型包括视频、 音频、 文本、 图片。 8.根据权利 要求5或6所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其 特征在于, 所述提取数据包有向长度序列以及数据包间隔时间序列包括: 将所述数据包信 息序列进行截断或以数字0填充, 得到固定长度的数据包有向长度序列和数据包间隔时间 序列。 9.根据权利 要求5或6所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其 特征在于, 所述数据包有向长度序列含传输方向包括: 使用正负值分别标识上行数据包和 下行数据包的长度方向。 10.根据权利要求1所述的基于多特征融合学习的HTTP/2页面访问流量识别方法, 其特 征在于, 所述步骤5包括: 针对同一HTTP /2站点提取的内容分布特征向量和主体 资源特征向权 利 要 求 书 1/2 页 2 CN 114205151 A 2量进行融合 拼接, 将拼接后的向量输入卷积神经网络得到 HTTP/2页面 流量识别结果。权 利 要 求 书 2/2 页 3 CN 114205151 A 3

.PDF文档 专利 基于多特征融合学习的HTTP 2页面访问流量识别方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多特征融合学习的HTTP 2页面访问流量识别方法 第 1 页 专利 基于多特征融合学习的HTTP 2页面访问流量识别方法 第 2 页 专利 基于多特征融合学习的HTTP 2页面访问流量识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:39:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。