科研专题|AAAA’26 Oral:面向电池健康预测与不确定性量化的物理信息神经网络

引言

第40届AAAI会议(AAAI Conference on Artificial Intelligence)于2026年1月20日至1月27日在新加坡EXPO举办。作为人工智能领域最具影响力的国际顶级学术会议之一,AAAI长期致力于推动人工智能基础理论与应用研究的发展,并促进全球学术界与工业界的交流合作。

在本次会议中,南洋理工CAP组有一篇文章被接收为Oral文章,题目为:Physics-Informed Multi-Task Learning for Battery State of Health Prediction with Uncertainty Quantification,作者为:Tianwen Zhu¹,Guangyu Wu¹,Zhiwei Cao¹,Ruihang Wang¹,Jimin Jia¹,Yong Luo²,Yonggang Wen¹*

¹ 新加坡南洋理工大学计算机与数据科学学院

² 中国武汉大学计算机学院

电池健康状态预测:从“高精度估计”向“高可信诊断”的范式演进

在电动汽车、储能系统及航空航天等高可靠性需求场景中,电池健康状态(SOH)预测并非独立的算法模块,而是关乎安全保障、寿命维护与运维成本的核心技术。精准识别容量衰减,是实现主动健康管理与风险隔离的前提。随着技术演进,电池智能诊断已由早期的机理建模转向数据驱动,并进一步向物理感知学习与可信人工智能迈进。

当前行业的关键挑战并非单纯追求更低的预测误差,而在于模型是否具备分布偏移下的自知之明。在实际应用中,相比于单纯的误差,模型在超分布场景下表现出的“过度自信”更具安全隐患。这是 SOH 预测算法从实验室环境走向工程化部署必须克服的瓶颈。

1. 现有研究的局限

现有的 SOH 预测方案主要分为两条路径:

  • 物理模型:依赖等效电路或电化学机理,具备较强的可解释性,但由于电池内部电化学反应极其复杂,难以构建完美的显式控制方程。

  • 学习模型:利用神经网络直接提取退化模式,拟合能力强,但在工况切换、环境漂移或小样本场景下,泛化性能往往受限。

在Learning-based方法中,确定性模型擅长点估计,却无法衡量预测结果的可靠性;概率模型虽试图量化不确定性,但通常依赖较强的先验假设或参数化分布。在噪声高、异质性强的电池退化场景中,现有方法普遍缺乏对异常样本与分布漂移的风险感知能力。

2. 核心范式

本研究的核心突破在于:不再将不确定性度量视为预测任务的附属模块,而是将 SOH 估计与可信度度量构建为统一的多任务学习框架。模型在优化预测精度的同时,同步构建对预测结果可靠性的感知能力。

A diagram of a network AI-generated content may be incorrect.

图1: MTL 框架概览。该框架包含四个主要组成部分:(1)带有多头注意力机制的共享编码器,用于特征提取;(2)基于 PINN 的 SOH 预测任务;(3)基于 DAGMM 的不确定性代理指标任务;(4)融合两个任务的多任务学习模块。蓝色和橙色箭头表示信息流,虚线箭头表示训练过程中的梯度流。

该框架采用共享编码器提取充电阶段(CC/CV)的统计特征,通过多头自注意力机制建模特征间的深层依赖。共享表示随后输入两个分支:

  1. 回归分支:负责 SOH 的精准估计。

  2. 不确定性分支:负责评估当前预测的可信度。

这种感知驱动的训练模式,使得模型不再仅仅输出单一数值,而是进化为具备风险感知能力的可信估算器。

3. 技术路径

物理感知预测(Physics-informed Prediction)

A diagram of a physics network AI-generated content may be incorrect.

图2: 任务 1 模块结构。预测网络将电池特征映射为 SOH 值,物理引导网络则用于施加物理一致性约束。

模型引入了弱约束物理信息神经网络(Soft-constrained PINN)。通过自动微分技术从特征表示中提取时间与特征梯度,将物理一致性(如容量单调递减规律)作为惩罚项融入损失函数。这使得模型在具备数据拟合能力的同时,严格遵循电池退化的物理逻辑,有效抑制了不合理的数值回升。

分布感知建模(Distribution-aware Modeling)

A diagram of a network AI-generated content may be incorrect.

图3: 任务 2 模块结构。该模块使用深度自编码器进行特征压缩与重建,并基于联合表示生成能量分数。

不确定性分支采用了深度自编码高斯混合模型。通过深度自编码器提取联合嵌入表示,并利用高斯混合模型进行密度估计,最终输出能量分数。

  • 风险雷达效应:当输入样本符合训练分布时,能量得分较低;当出现分布偏移或异常退化模式时,得分显著上升。

  • 理论支撑:该机制在满足Lipschitz连续性的前提下,能够对分布偏移提供单调上升的风险反馈,具备坚实的理论基础。

4. 实验验证

A graph showing the number of energy levels AI-generated content may be incorrect.

图4: 噪声注入对预测误差和不确定性代理指标的影响。

  • 预测精度:在 6 个 XJTU 标准数据集上,模型在固定协议、变倍率、随机充放电等工况下均达到最优性能。例如,在 R3 数据集上 MAPE 仅为 0.50%,预测精度高达 99.50%

  • 迁移性能:在 15 组跨数据集迁移测试中,模型表现出显著优于传统 LSTM 和 PINN 的稳定性,证明了其学到的退化表示具备极强的协议通用性。

  • 在线预警:通过噪声注入实验证实,随着输入干扰增强,预测误差增加的同时,能量得分同步提升。这意味着模型具备在线预警能力,能为系统提供关键的决策窗口。

  • 工程可行性:模型在大约 45 个周期内即可收敛,虽然推理延迟略增至 0.246 ms,但吞吐量完全满足嵌入式 BMS 的实时监测需求。

5. 结论与工业价值

本研究将电池健康预测从单一的回归任务提升至可信计算的新阶段。它不仅为电动汽车与储能电站提供了高精度的健康状态评估,更为关键的是,它通过能量建模赋予了 AI 系统感知“风险边界”的能力。

这种“预测 + 判断”一体化的思路,为下一代电池管理系统走向可信智能奠定了基础,具有极强的学术启发意义与工程落地价值。