「EP44 · 论文成果撷英」——挖掘无标签数据价值：自监督学习破解电动汽车电池剩余寿命预测的高成本标注难题

2026年5月，TRANS课题组最新研究成果《Self-supervised learning for electric vehicle battery remaining useful life prediction using real-world unlabeled data》发表于能源领域JCR一区期刊《Energy》（影响因子9.4）。本研究针对真实道路运行条件下电动汽车电池剩余使用寿命预测困难、高质量寿命标签获取成本高且周期长等挑战，充分利用车辆运行过程中产生的大量无标签数据，构建面向电池退化表征学习的自监督学习预测框架，实现了预测精度与数据标注成本的有效平衡。本研究的主要贡献总结如下：

面向真实道路运行数据的自监督学习电池寿命预测框架：提出了融合变分自编码器、长短期记忆网络和对比学习的自监督学习建模方法。该框架能够从大规模无标签数据中学习与电池退化相关的潜在表征，再通过少量有标签车辆数据微调实现剩余寿命预测，从而降低模型对完整寿命标签的依赖。
显著提升跨车队预测的泛化性能：所提模型在三个不同的真实电动汽车运行数据集上进行了验证，数据覆盖乘用车、出租车和城市公交等多种车型，以及不同电池材料体系、容量规格和运行地域。结果表明，在两个目标数据集中仅使用30%车辆标签进行微调时，模型平均RMSE分别为43和50个循环，与直接训练的基线模型相比，平均误差分别降低约42.7%和45.1%，有效缓解不同车辆平台、使用模式和电池配置之间的域偏移问题。
电池退化表征的可解释性分析：通过SHAP分析和潜在空间可视化，模型能够将复杂充电过程中的多维运行信息映射为有序的退化状态轨迹，并通过潜在变量刻画电池寿命衰退过程。
模型预测精度与数据标注成本的协同优化：全面评估了数据标注比例、模型预测精度和经济成本之间的权衡关系。结果表明，在仅使用30%车辆标签的条件下，模型仍能保持接近全监督模型的预测性能，同时将数据标注成本降低约70%，突破了传统监督学习模型对大规模寿命标签的依赖。

论文第一作者为TRANS课题组实习生吕志隆，通讯作者为欧士琪教授，合作作者包括TRANS课题组博士生景浩、加利福尼亚大学河滨分校吴国垣教授、湖北文理学院石大排教授。该研究得到了国家重点研发计划项目资助以及广东省人才引进团队项目的支持。

✨ 论文摘要

准确且具有成本效益的剩余使用寿命（RUL）预测对于电动汽车电池系统的可靠健康管理至关重要。然而，现有大多数数据驱动的RUL预测方法依赖全监督学习和大规模标签标注，在异质运行工况下成本高且难以规模化应用。为此，本研究提出了一种对比学习增强的变分自编码器与长短期记忆网络（VAE-LSTM）框架，在自监督学习范式下利用大规模无标签充电数据。该框架通过联合重构目标与对比学习目标进行预训练，以学习具有单调退化特征的表征，随后利用少量有标签车辆数据进行RUL回归微调。本研究在三个真实电动汽车运行数据集上对所提出方法进行评估，其中包括一个由乘用车、出租车和城市公交车组成的异质车队数据集，以及两个具有不同规模和运行特征的出租车车队数据集。所提出框架取得了27个循环的均方根误差（RMSE），优于监督学习和半监督学习基线模型。标签效率和跨车队迁移实验进一步量化了该框架对域偏移和真实场景数据不规则采样的鲁棒性。在仅使用30%车辆标签的条件下，预训练模型迁移到两个目标车队后分别实现43和50个循环的RMSE。面向部署的成本分析表明，该框架的RMSE与全监督模型的误差控制在5%以内，同时将RUL标签的标注成本降低约70%。模型预训练过程中学习到的潜在因子与具有物理意义的电压和能量吞吐特征相关，从而提升了模型的可解释性。总体而言，所提出的VAE-LSTM框架为真实场景下电动汽车电池RUL预测提供了一种准确、可解释且具备经济可扩展性的技术路径。

✨ 研究框架

图面向电动汽车整车电池剩余使用寿命预测的自监督对比学习框架。

✨ 研究方法

（1）研究数据

本研究基于三个不同真实电动汽车运行数据集验证模型性能，数据均来源于车辆实际道路运行过程，总计340辆电动汽车，涵盖乘用车、出租车和城市公交等多种车型，以及不同电池材料体系、容量规格、运行地域和服役周期。多源异质数据充分反映了真实场景下车辆使用行为、充电习惯和电池退化过程的复杂差异，为验证模型的预测精度、跨车队泛化能力和适用性提供了重要支撑。

图真实道路下电动汽车运行数据集特征与预测任务概述。

（2）模型架构设计

本研究构建了融合VAE-LSTM与对比学习的自监督电池RUL预测框架。模型首先利用LSTM编码器从车辆充电过程中的电压、电流、温度等多维时序特征中提取潜在退化表征，并通过VAE结构对电池老化过程中的不确定性进行建模。在自监督预训练阶段，模型同时引入序列重构和对比学习，使潜在空间能够保留充电行为特征，并进一步形成具有退化趋势的表征结构。在下游RUL预测任务阶段，预训练得到的退化表征被输入至LSTM时序聚合模块和多层感知机回归头，通过少量有标签车辆数据进行微调，实现对电池剩余使用寿命的高精度预测。

图 VAE-LSTM模型框架。

✨ 研究结果

（1）自监督学习RUL预测结果分析

基于数据集#1的20辆车异质车队数据验证表明，所提出的自监督VAE-LSTM框架在电池RUL预测中表现出更高的预测精度与稳定性。模型预测结果与参考RUL整体高度一致，平均RMSE为27个循环，显著优于监督学习和半监督学习方法，并在中长期寿命区间仍能保持较好的拟合效果。此外，全生命周期预测轨迹进一步表明，模型能够有效跟踪电池寿命衰退过程，并对真实运行中出现的非线性退化波动保持较好的预测鲁棒性，验证了其在复杂车队工况下的RUL预测性能。

图所提框架在数据集#1上的RUL预测的性能。

（2）所提模型的RUL预测可解释性分析

本研究对自监督编码器学习到的潜在退化表征进行了可解释性分析。不同潜在变量对RUL预测的贡献并不均衡，其中Z1、Z2和Z3等少数关键维度起主要作用，表明模型能够从复杂的数据中自动提取对寿命预测最敏感的退化信息，而对预测贡献较小的冗余特征则被有效抑制。同时，t-SNE可视化显示，电池样本在潜在空间中形成了连续、有序的退化演化轨迹，验证了所提模型并非简单拟合输入数据波形或噪声，而是通过学习电池当前状态在退化轨迹中的相对位置来推断剩余使用寿命，从而提升了RUL预测结果的可解释性与可信度。

图潜在变量的特征重要性与演化轨迹。

（3）所提框架的泛化性分析

本研究进一步验证了所提自监督框架在不同车队和不同数据源之间的泛化能力。模型在源数据集上完成预训练后，仅使用目标数据集中30%车辆的标签数据进行微调，即可实现准确的RUL预测，平均RMSE分别为43和50个循环，相比采用直接训练的基线方法分别降低了约42.7%和45.1%的误差。

图所提框架在源数据集与目标数据集上的泛化性能。

（4）数据标注成本分析

本研究综合考虑测试设备、温控环境、人工操作和工程管理等成本，评估了不同车辆标签比例下的模型预测性能与数据标注的经济成本。所提框架仅使用30%车辆标签微调模型，仍能达到全监督模型95%的预测性能，同时将经济成本降低约70%。该结果表明，模型能够在少量可靠标签的引导下充分利用大规模无标签运行数据，在预测精度和数据标注成本之间取得更优平衡，为真实车队电池健康管理、预测性维护和退役评估提供了更具经济可行性的技术路径。

图数据标注与模型性能的成本效益分析。

✨ 结论与未来工作

本研究针对电动汽车运行数据丰富但标签稀缺这一限制，提出了一种数据高效的自监督学习范式，通过利用大规模无标签运行数据构建与退化相关的表征，从而提升真实运行条件下RUL预测的准确性和鲁棒性。基于三个真实电动汽车数据集的综合评估结果表明，所提出框架具有良好的准确性、鲁棒性和可扩展性。在异质源车队（数据集#1）上，模型取得了27个循环的RMSE，优于监督学习和半监督学习基线方法。跨车队迁移实验进一步表明，预训练模型仅使用目标车队中30%车辆的标签数据进行微调，仍能保持稳定的泛化性能，表明模型学习到的退化表征能够在车辆使用行为、充电模式和电池配置差异之间实现迁移。特别地，该框架将RUL标注成本降低约70%的同时，仍保留了约95%的全监督模型预测精度，体现出面向大规模车队应用的良好精度与成本权衡。此外，考虑不确定性的轨迹分析和事后解释结果一致表明，模型学习到的潜在表征和时序聚合机制能够捕捉真实运行中的退化相关动态，从而支持更加透明、可靠的寿命预测决策。

未来研究将进一步扩展该框架在更广泛电池化学体系和电池包配置中的适用性，包括高镍电池和钠离子电池等新兴体系，以进一步验证其跨化学体系迁移能力。同时，后续工作也将聚焦于提升计算效率，以支持嵌入式电池管理系统硬件上的实时推理，并结合用户行为建模和维护决策支持，推动下一代电动汽车车队实现更加主动和个性化的电池健康管理。

原文链接：

https://doi.org/10.1016/j.energy.2026.141302

CITATION :

Lv, Z., Ou, S., Jing, H., Wu, G., & Shi, D. (2026). Self-supervised learning for electric vehicle battery remaining useful life prediction using real-world unlabeled data. Energy, 141302.

感谢您的关注，敬请期待更多团队动态！

初稿：吕志隆

排版：高伟敏

终审：欧士琪