科研专题｜AAAA’26 Oral：面向电池健康预测与不确定性量化的物理信息神经网络

引言

第40届AAAI会议（AAAI Conference on Artificial Intelligence）于2026年1月20日至1月27日在新加坡EXPO举办。作为人工智能领域最具影响力的国际顶级学术会议之一，AAAI长期致力于推动人工智能基础理论与应用研究的发展，并促进全球学术界与工业界的交流合作。

在本次会议中，南洋理工CAP组有一篇文章被接收为Oral文章，题目为：Physics-Informed Multi-Task Learning for Battery State of Health Prediction with Uncertainty Quantification，作者为：Tianwen Zhu¹，Guangyu Wu¹，Zhiwei Cao¹，Ruihang Wang¹，Jimin Jia¹，Yong Luo²，Yonggang Wen¹*

¹ 新加坡南洋理工大学计算机与数据科学学院

² 中国武汉大学计算机学院

电池健康状态预测：从“高精度估计”向“高可信诊断”的范式演进

在电动汽车、储能系统及航空航天等高可靠性需求场景中，电池健康状态（SOH）预测并非独立的算法模块，而是关乎安全保障、寿命维护与运维成本的核心技术。精准识别容量衰减，是实现主动健康管理与风险隔离的前提。随着技术演进，电池智能诊断已由早期的机理建模转向数据驱动，并进一步向物理感知学习与可信人工智能迈进。

当前行业的关键挑战并非单纯追求更低的预测误差，而在于模型是否具备分布偏移下的自知之明。在实际应用中，相比于单纯的误差，模型在超分布场景下表现出的“过度自信”更具安全隐患。这是 SOH 预测算法从实验室环境走向工程化部署必须克服的瓶颈。

1. 现有研究的局限

现有的 SOH 预测方案主要分为两条路径：

物理模型：依赖等效电路或电化学机理，具备较强的可解释性，但由于电池内部电化学反应极其复杂，难以构建完美的显式控制方程。
学习模型：利用神经网络直接提取退化模式，拟合能力强，但在工况切换、环境漂移或小样本场景下，泛化性能往往受限。

在Learning-based方法中，确定性模型擅长点估计，却无法衡量预测结果的可靠性；概率模型虽试图量化不确定性，但通常依赖较强的先验假设或参数化分布。在噪声高、异质性强的电池退化场景中，现有方法普遍缺乏对异常样本与分布漂移的风险感知能力。

2. 核心范式

本研究的核心突破在于：不再将不确定性度量视为预测任务的附属模块，而是将 SOH 估计与可信度度量构建为统一的多任务学习框架。模型在优化预测精度的同时，同步构建对预测结果可靠性的感知能力。

图1: MTL 框架概览。该框架包含四个主要组成部分：（1）带有多头注意力机制的共享编码器，用于特征提取；（2）基于 PINN 的 SOH 预测任务；（3）基于 DAGMM 的不确定性代理指标任务；（4）融合两个任务的多任务学习模块。蓝色和橙色箭头表示信息流，虚线箭头表示训练过程中的梯度流。

该框架采用共享编码器提取充电阶段（CC/CV）的统计特征，通过多头自注意力机制建模特征间的深层依赖。共享表示随后输入两个分支：

回归分支：负责 SOH 的精准估计。
不确定性分支：负责评估当前预测的可信度。

这种感知驱动的训练模式，使得模型不再仅仅输出单一数值，而是进化为具备风险感知能力的可信估算器。

3. 技术路径

物理感知预测（Physics-informed Prediction）

图2: 任务 1 模块结构。预测网络将电池特征映射为 SOH 值，物理引导网络则用于施加物理一致性约束。

模型引入了弱约束物理信息神经网络（Soft-constrained PINN）。通过自动微分技术从特征表示中提取时间与特征梯度，将物理一致性（如容量单调递减规律）作为惩罚项融入损失函数。这使得模型在具备数据拟合能力的同时，严格遵循电池退化的物理逻辑，有效抑制了不合理的数值回升。

分布感知建模（Distribution-aware Modeling）

图3: 任务 2 模块结构。该模块使用深度自编码器进行特征压缩与重建，并基于联合表示生成能量分数。

不确定性分支采用了深度自编码高斯混合模型。通过深度自编码器提取联合嵌入表示，并利用高斯混合模型进行密度估计，最终输出能量分数。

风险雷达效应：当输入样本符合训练分布时，能量得分较低；当出现分布偏移或异常退化模式时，得分显著上升。
理论支撑：该机制在满足Lipschitz连续性的前提下，能够对分布偏移提供单调上升的风险反馈，具备坚实的理论基础。

4. 实验验证

图4: 噪声注入对预测误差和不确定性代理指标的影响。

预测精度：在 6 个 XJTU 标准数据集上，模型在固定协议、变倍率、随机充放电等工况下均达到最优性能。例如，在 R3 数据集上 MAPE 仅为 0.50%，预测精度高达 99.50%。
迁移性能：在 15 组跨数据集迁移测试中，模型表现出显著优于传统 LSTM 和 PINN 的稳定性，证明了其学到的退化表示具备极强的协议通用性。
在线预警：通过噪声注入实验证实，随着输入干扰增强，预测误差增加的同时，能量得分同步提升。这意味着模型具备在线预警能力，能为系统提供关键的决策窗口。
工程可行性：模型在大约 45 个周期内即可收敛，虽然推理延迟略增至 0.246 ms，但吞吐量完全满足嵌入式 BMS 的实时监测需求。

5. 结论与工业价值

本研究将电池健康预测从单一的回归任务提升至可信计算的新阶段。它不仅为电动汽车与储能电站提供了高精度的健康状态评估，更为关键的是，它通过能量建模赋予了 AI 系统感知“风险边界”的能力。

这种“预测 + 判断”一体化的思路，为下一代电池管理系统走向可信智能奠定了基础，具有极强的学术启发意义与工程落地价值。