
2025年7月,Trans课题组最新研究成果《Scalable and generalizable deep learning for battery state of health estimation in on-road electric vehicles》发表于能源与燃料领域中科院一区期刊《Journal of Energy Chemistry》(影响因子14.9)。本工作通过三大核心技术突破推动人工智能算法从实验室走向真实场景:
- 场景跨越:基于实车大数据的建模-训练框架,突破实验室电芯数据局限;
- 算法革新:研发通过特征体系的精简提升了计算效率,为大规模应用提供支撑;
- 泛化验证:在乘用车/商用车以及磷酸铁锂/三元电池等全维度场景中,估计均方根误差<0.5%,具备行业领先的工程适用性。
此项研究推动动力电池健康管理进入可落地的智能化时代。
论文第一作者为TRANS课题组2024级博士生景浩,第一通讯作者为欧士琪教授,第二通信作者为加利福利亚大学戴维斯分校赵竟园博士、合作作者包括工业和信息化部电子第五研究所胡坚耀博士、TRANS课题组科研助理吕志隆等。该研究得到了国家重点研发计划项目资助以及广东省科技厅项目的支持。此外,该工作顺利发表也得益于广汽集团的指导和支持。
✨ 论文摘要
电池健康状态(SOH)的精准诊断对于电动汽车(EV)的及时维护、电池更换及安全运行至关重要。然而,针对道路电动车辆,不同驾驶工况、车型及电池材料所引发的退化模式差异,使得基于实车运行数据实现高精度SOH估算面临诸多挑战。因此,亟需开发一套面向道路电动车辆的高效特征系统,并构建具备优秀泛化能力的SOH估算框架,以适应多样化的电动车型和电池材料。
为应对上述难题,本研究提出了一种基于实车运行数据驱动的SOH估算方法,融合多维特征体系与混合深度神经网络架构。研究共处理了1283万条覆盖不同车型与电池材料的道路车辆运行数据,构建了由浅层(表征参数)、中层(驾驶行为)和深层(电化学信息)所组成的三维特征体系。针对长时间序列建模和传统Transformer模型在多变量输入场景下的局限性,本研究提出了一种融合时间卷积网络(Temporal Convolutional Network, TCN)与iTransformer的混合架构,并引入差分注意力机制以有效抑制注意力噪声。实验结果显示,所提方法在两个独立测试集上均实现了优异性能,平均决定系数(R²)、平均绝对百分比误差(MAPE)、平均绝对误差(MAE)及均方根误差(RMSE)分别达到98.88%、0.35%、0.31%和0.40%,RMSE相比最佳基准模型降低了81.4%。在数据稀缺条件实验中,当训练集规模从80%缩减至30%时,模型依然具有鲁棒性,RMSE仍低于0.16%。基于SHAP的特征贡献度分析验证了三维特征体系的必要性,其中驾驶行为特征对模型性能的贡献最为显著。进一步结合SHAP分析结果进行特征优化后,训练时间缩短了17.3%。本研究主要贡献是构建了一套面向智能云端电池管理系统的鲁棒SOH估算框架,能够支持电动车辆电池的主动运维,并为电动汽车电池在复杂实际工况下的安全运行提供重要保障。
✨ 研究流程框架

✨ 主要方法
(1)数据处理方法
本研究的数据清洗过程分为六个步骤:去除重复值,匹配环境温度,异常值检测,片段划分,片段筛选以及缺失值填补。

图 数据预处理流程图
(2)特征工程
本研究运用处理好的电动车辆充电片段,提出了浅层、中层和深层三维度特征体系,其中浅层特征为电池表征参数,包含:累计行驶里程,累计充放电容量,平均电流,平均充电功率,环境温度以及电池温度与25℃的绝对偏离值。中层特征为驾驶习惯特征,统计了累计快充次数和深度充放电次数。深层特征为电池相关电化学参数,包含欧姆内阻,极化电阻和极化电容。深层特征的提取基于电池等效电路模型,并通过引入遗忘因子的递归最小二乘法进行参数辨识。

图 基于等效电路的参数识别以获取电池相关电化学参数

图 SOH标签与各特征之间的皮尔斯相关性分析结果
(3)模型框架
本研究针对道路车辆SOH估计中存在的长时间跨度、多特征以及数据噪声等问题,提出了一种TCN-Specialized iTransformer混合深度学习模型。该模型主要由时间卷积网络和iTransformer模块组成。首先,TCN模块能够高效捕捉长时依赖关系,具有优异的计算效率和并行处理能力,适用于处理长时间跨度的电池数据。其次,iTransformer模块能有效解决多特征输入问题,通过转置嵌入模块将同一变量的时间序列映射为高维特征表示,克服了传统Transformer在多变量时间序列处理中可能出现的信息丢失和计算瓶颈。为应对传统注意力机制中的噪声问题,本研究引入了多头差分注意力机制,通过计算注意力图谱之间的差异,减少注意力噪声干扰,从而提升模型鲁棒性。最后,映射层模块对提取的特征进行整合,并输出最终的SOH预测结果。

图 模型框架图
✨ 主要结果
(1)模型泛化能力
为验证所提模型的泛化能力,随机选取20%–30%的车辆作为测试集,用于评估模型的估计准确性。本研究将所提出的方法与三种主流模型(Transformer、CNN 和 LSTM)进行对比分析。具体而言,设计了两组实验:第一组测试集包含两辆乘用车(#3 和 #5),第二组在此基础上增加一辆商用车(#10),以覆盖不同类型的车辆和电池材料。结果显示,本研究方法在两组测试集上的最大估计误差均小于2%,且在其余四项指标上整体优于其它三种模型。相较之下,其它方法在不同指标维度上表现不一,基线模型中,LSTM在平均决定系数(R²)、平均误差(ME)和均方根误差(RMSE)方面相对较优。与最优基线模型LSTM相比,本研究提出的方法在各项关键指标上实现了显著提升:平均绝对误差(MAE)下降83.8%,平均绝对百分比误差(MAPE)下降83.7%,RMSE降低81.4%,ME减少47.6%,而R²提升达30.6%。

图 不同测试集与算法下的SOH估算结果对比。(a):以车辆#3和#5作为测试集,其余车辆用于训练,不同算法下的SOH估算结果。(b):以车辆#3、#5和#10作为测试集,其余车辆用于训练,不同算法下的SOH估算结果。(c):来自图(a)中各算法的SOH估算误差指标对比。(d):来自图(b)中各算法的SOH估算误差指标对比。
(2)数据稀缺条件下的模型鲁棒性分析
为评估所提出框架在大规模实际电动车(EV)车队部署场景下的数据利用效率与实用性,本文进一步分析了模型在数据稀缺条件下的性能表现。在实际应用中,尤其是基于云平台管理的大规模车队环境中,为每辆新接入车辆收集大量历史数据往往是不实际的。因此,SOH估算模型必须具备在有限训练数据条件下依然实现可靠拟合的能力,以降低数据采集成本、缩短训练时间并减少计算资源消耗。本研究随机选取车辆#1、#5和#8作为分析对象。针对每辆车,设置两种训练数据比例:80%和30%,其余数据作为测试集用于性能评估。结果如下图所示,无论在高数据量(80%)还是低数据量(30%)的训练条件下,所提出方法均在所有测试样本中表现出优异性能,整体优于Transformer、CNN和LSTM等基准模型。即便在仅使用30%训练数据的情况下,该方法在不同车型和电池化学体系下依然能够保持稳定的拟合精度,且最大RMSE不超过0.16%。相比之下,尽管部分基准模型在某些单一测试样本中偶尔能够达到较低误差,其整体性能在不同车辆下波动较大,鲁棒性与泛化能力不足。因此,所提方法在数据稀缺情境下展现出卓越的拟合稳定性和泛化能力,具备良好的实用性与可扩展性,能够满足道路电动车智能健康管理系统的应用需求。

图 数据稀缺条件下不同算法的对比分析。(a–c):在80%训练数据与20%测试数据配置下,针对车辆#1、#5与#8的模型对比结果。图右侧展示了各算法对应的估算误差的小提琴图分布情况。(d–f):在30%训练数据与70%测试数据配置下,针对车辆#1、#5与#8的模型对比结果,图右侧展示了各算法对应的估算误差的小提琴图分布情况。
(3)基于SHAP的模型可解释性分析
本研究基于SHAP方法对三维特征体系的重要性进行了全局可解释性分析。如下图所示,在全部11个输入特征中,前七个特征的累计贡献率已达99%,第一维特征的贡献为20.6%,第二维特征为43.5%,第三维特征为35.9%。维度层面的贡献分析表明,尽管第二维仅包含两个特征,但其对模型的整体贡献却超过其余两个维度。结合前述分析,第二维特征主要源自驾驶行为特征,这说明在实车SOH估算中,驾驶者的行为差异对SOH退化具有显著影响。因此,基于用户行为视角进行特征提取,对于构建面向在途应用的SOH估算模型具有重要意义。此外,尽管第三维特征仅包含三个指标,其总体贡献仍高达35.9%。综上所述,各维度特征均对模型估算结果具有显著作用,进一步验证了本文提出的三维特征体系在SOH估算建模中的重要性。

图 基于SHAP的特征全局贡献分析结果。(a) 特征贡献的平均SHAP值分析及热力图显示。(b) 不同维度特征的总贡献占比。
✨ 讨论与未来工作
在实际道路车辆应用中,健康状态估算面临驾驶行为差异、环境变化及电池材料多样性等挑战。与实验室数据相比,道路运行数据常受噪声干扰,退化信号提取困难。为此,本研究提出基于混合网络的SOH估算框架,能够处理不完整时间序列并从非理想充放电数据中提取有效退化特征。所构建的三维健康特征体系融合表征参数特性、驾驶行为特征和电化学信息,增强了模型对退化异质性的感知能力。该框架支持云端部署,车辆原始数据经周期性上传与预处理后,转化为标准化特征并用于中心化模型训练,实现全车队SOH统一估算与实时监控。基于该框架的SOH估算不仅提升了模型在复杂实际场景下的适应性,还在电池全生命周期管理中展现出广泛应用潜力。具体而言,在退役阶段,SOH估值支持性能临界点识别与处置决策;在梯次利用阶段优化电芯重组,降低失效风险;在回收阶段提升材料回收效率并降低成本。此外,该方法还可应用于二手车辆残值评估,其中电池健康状况是决定市场价值的核心指标。展望未来,需进一步引入在线适应与持续学习机制,以应对场景转移和运行条件变化,确保SOH估算在电池服役、再利用及退役全过程中的可靠性,推动电池系统向智能化全生命周期管理发展。
在未来的工作中,研究团队已与广州汽车集团股份有限公司已展开初步讨论,探索模型在实际应用中的推广与验证。研究团队将进一步将研发算法应用全国范围更大规模的道路车辆,并通过云端部署进一步验证其在大规模场景下的泛化能力。
✨ 原文和数据链接(或点击阅读全文查看)
https://www.sciencedirect.com/science/article/pii/S2095495625005728
CITATION:
Hao Jing, Jianyao Hu, Shiqi Shawn Ou, Zhilong Lv, Renzhi Lyu, Jingyuan Zhao,
Scalable and generalizable deep learning for battery state of health estimation in on-road electric vehicles, Journal of Energy Chemistry, 2025, ISSN 2095-4956, https://doi.org/10.1016/j.jechem.2025.07.020.
感谢您的关注,敬请期待更多团队动态!
初稿:景浩
排版:陈永健
终审:欧士琪
