(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210536700.7
(22)申请日 2022.05.17
(71)申请人 重庆长安汽车股份有限公司
地址 400023 重庆市江北区建新 东路260号
(72)发明人 施暄宣 张国杰 刘巍 李昌
(74)专利代理 机构 重庆华科专利事务所 5 0123
专利代理师 谭小琴
(51)Int.Cl.
G01M 17/007(2006.01)
G06F 16/215(2019.01)
G06F 16/2455(2019.01)
G06N 20/00(2019.01)
G06Q 10/00(2012.01)
G07C 5/08(2006.01)
G07C 5/00(2006.01)B60L 58/12(2019.01)
(54)发明名称
汽车故障数据的自适应聚合处理方法及系
统
(57)摘要
本发明公开了一种汽车故障数据的自适应
聚合处理方法及系统, 包括: S1: 提取汽车故障历
史数据; S2: 对提取的数据进行清洗和归一化;
S3: 针对每个车辆的具体数据, 根据车辆启停时
间段对其进行划分, 对每个时间段的数据进行自
适应聚合; S4: 根据故障发生时间或维修时间, 将
聚合处理后的特征数据划分为故障前和故障后
两个状态, 并进行标签化处理; S5: 筛选标签化处
理后的数据进行特征组合, 与标签化处理后未组
合的数据共同组成数据特征集合; S6: 在训练阶
段利用控制变量法压缩特征大小, 剔除影响因子
较小的特征, 提取影响因子较大的特征, 不断更
新机器学习模型。 本发明降低了数据量, 解决了
以时间间隔划分数据时跨天数据被割裂的情况。
权利要求书2页 说明书5页 附图1页
CN 114935457 A
2022.08.23
CN 114935457 A
1.一种汽车故障数据的自适应聚合处 理方法, 其特 征在于, 包括以下步骤:
S1: 确定需要用到的车辆传感器信号; 根据售后维修记录卡显示的故障类型、 故障发生
时间和维修时间, 从云端服 务器提取汽车故障历史数据;
S2: 对提取的汽车故障历史数据进行 数据清洗处 理和归一 化处理;
S3: 针对每个车辆的具体数据, 根据车辆启停时间段对其进行划分, 对每个时间段的数
据进行自适应聚合;
S4: 根据维修记录卡的故障发生时间或维修时间, 将聚合处理后的特征数据划分为故
障前和故障后两个 状态, 并进行 标签化处 理;
S5: 筛选标签化处理后的数据进行特征组合, 与标签化处理后未组合的数据共 同组成
数据特征集合, 用于机器学习算法的输入;
S6: 在训练 阶段利用控制变量法压缩特征大小, 剔除影响因子较小的特征, 提取影响因
子较大的特 征, 不断更新机器学习模型, 输出 更好的故障诊断结果。
2.根据权利要求1所述的汽车故障数据的自适应聚合处理方法 , 其特征在于: 所述S1
包括:
S1.1: 根据铅酸蓄电池故障原因、 铅酸蓄电池故障机理, 并结合云端服务器可提取的信
号集合, 确定需要提取的车辆传感器信号 集;
S1.2: 根据蓄电池故障原因和售后维修记录卡定位发生蓄电池故障的车辆车架号;
S1.3: 依据车架号和确定的车辆传感器信号集, 从云端服务器提取车辆相应的蓄电池
故障发生时间或维修时间前后的车辆传感器特 征信号历史数据和对应的时间数据。
3.根据权利要求1或2所述的汽车故障数据的自适应聚合处理方法 , 其特征在于: 所述
S2包括:
S2.1: 检查数据是否存在重复项, 若重复项存在, 则除保留第一条重复数据外, 其他数
据组删除;
S2.2: 检查数据是否存在空缺值, 若空缺值存在且数据条数小于第一预设条数, 则 采用
第一预设规则进行填充, 若空缺值存在且数据条数大于等于第一预设条数, 则删除该时间
段内的所有数据;
S2.3: 检查数据是否存在异常值, 若异常值存在且数据条数小于第二预设条数, 则删除
该时间点的所有数据, 若异常值存在且数据条数大于等于第二预设条数, 则将该信号和该
信号的历史数据列为重点关注数据;
S2.4: 为每个信号确定一个阈值, 检查数据是否超出阈值, 若数据超过阈值且条数小于
第三预设条数, 则删除该时间点的所有数据, 若数据超出阈值且数据条数大于等于第三预
设条数, 则将该信号和该信号的历史数据列为重点关注数据;
S2.5: 筛选出需要归一 化处理的数据项, 并对其进行归一 化处理。
4.根据权利要求3所述的汽车故障数据的自适应聚合处理方法 , 其特征在于: 所述S3
包括:
S3.1: 选取某一车辆, 对其不同采集时间的数据进行合并处理, 并设置一定的时间长度
作为汽车 是否停用的时间阈值, 根据时间阈值将数据划分为m个汽车启停时间段;
S3.2: 对汽车每次启停时间段内的数据进行聚合处理, 将一次启停时间段内的数据聚
合成一条新数据。权 利 要 求 书 1/2 页
2
CN 114935457 A
25.根据权利要求4所述的汽车故障数据的自适应聚合处理方法 , 其特征在于: 所述
S3.1中: 设置前后两条时间数据的时间差为Hi时, i=1,2, …,n, 其中n表示以时间间隔n分钟
为时间间隔, 将前后数据划分为两次行驶数据, 并将数据划分为m个启停时间段。
6.根据权利要求4或5所述的汽车故障数据的自适应聚合处理方法 , 其特征在于: 所述
S3.2中, 假设合并后的第一条数据为车辆的第一条启动数据began j, j=1,2,3, …m, 以时间
维度对数据正序排列, 将该行驶阶段的最后一条数据为结束数据end j, j=1,2,3, …,m, 其
中m表示该辆车的数据中有m个汽车启停时间段, 将began j和end j之间的所有数据聚合,
生成一条新数据, 将多条新数据生成一个数据集, 聚合后的新数据项包括该段时间内每个
原数据项的平均值、 最大值、 最小值、 峰度和偏度。
7.根据权利要求6所述的汽车故障数据的自适应聚合处理方法 , 其特征在于: 所述S4
具体为:
以维修记录卡的蓄电池故障发生 时间或维修 时间为时间点, 将蓄电池故障发生之前15
天的数据划分为 故障状态, 将其每条特征项 数据标注为 1; 将维修之后30天的数据划分为 非
故障状态, 将其每条 特征项数据标注为0 。
8.根据权利要求7所述的汽车故障数据的自适应聚合处理方法 , 其特征在于: 所述S5
中:
筛选出可进行特征组合的数据项, 通过将单独特征进行相乘或笛卡尔求积组合, 形成
特征组合数据项, 将特 征组合数据项数据与标签化后的特 征项数据共同组成数据集;
其中, 特征组合的数据项是蓄电池传感器电压信号、 蓄电池传感器温度信号与SOC采用
笛卡尔求积法进行组合, 形成SOC_3特 征组合项。
9.根据权利要求7或8所述的汽车故障数据的自适应聚合处理方法 , 其特征在于: 所述
S6中, 训练阶段采用控制变量法, 每次抑制一个特征的贡献度, 对SOC_3特征组合项和空调
挡位特征数据项进行判断, 根据训练结果来计算该特征 的影响因子, 不断更新机器学习模
型。
10.一种汽车故障数据的自适应聚合处理系统 , 包括存储器和控制器, 所述存储器内
存储有计算机可读程序, 该计算机可读程序被控制器调用时能执行如权利要求 1至9任一所
述的汽车故障数据的自适应聚合处 理方法的步骤。权 利 要 求 书 2/2 页
3
CN 114935457 A
3
专利 汽车故障数据的自适应聚合处理方法及系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:15:51上传分享