来源:集智俱乐部
传统神经科学依赖机制假设构建模型,而人工智能正在引入一种新的研究对象——代理脑(surrogate brain):一种可从数据中学习、可预测、可操纵的个体化全脑动力学系统。与经典生物物理模型不同,代理脑并不试图完整复刻真实神经机制,而是通过解决逆问题,学习最小但足以重现脑动力学的有效计算结构。
其关键突破在于:代理脑首次使大脑从“被解释的系统”转变为“可进行虚拟干预与反事实实验的对象”。借助正向建模、逆问题求解与正则化的统一框架,代理脑正在成为连接数据、机制与干预的中介层,为理论神经科学与神经工程提供一种新的共同语言。
▷Zhang, Yinuo, et al. "Artificial intelligence as a surrogate brain: Bridging neural dynamical models and data." National Science Review (2025): nwaf457.
预测大脑活动:
从机理驱动到数据驱动的范式转移
理解并预测大脑活动是神经科学的核心目标之一。传统研究主要依赖神经动力学的机制模型,这类正向建模通常受限于固定的方程形式和群体平均参数,难以充分捕捉个体大脑中丰富的非线性和情境依赖动力学。随着机器学习方法的发展以及大规模神经数据的出现,数据驱动的脑动力学建模展现出巨大潜力。循环神经网络和 Transformer 等模型在正向脑建模中取得了领先性能,并推动了以 AI 模型作为“代理脑”的研究范式。
构建代理脑涉及两个相互关联的过程:正向建模,即刻画潜在大脑状态在动力学算子作用下的演化及其到可观测信号的映射;以及逆问题求解,即从数据中学习这些动力学规则,涉及训练策略、目标函数与参数优化的设计。根据在模型结构中整合先验知识程度的不同,代理脑在本综述中被细分为:白盒、黑盒与灰盒模型,下面将展开介绍这三类模型。
▷图 1. 神经动力系统中的AI代理脑的理论架构。代理脑是通过两个相互关联的过程构建的:正演建模和反求解问题。正向模型描述了潜在的大脑状态如何根据动力学算子F演化,并通过观察映射h产生可被观察到的信号。这里,ut表示外部输入,𝝃t捕获内在动态噪声,𝜼𝑡建模测量不确定性。反问题求解需要从数据中学习到F和h,这包括选择训练策略(例如,下一个令牌预测)、定义目标和优化参数。该框架适配白盒、灰盒和黑盒的F和h公式,使代理脑能够灵活地将机制先验与数据驱动的适应相结合。这些步骤产生了一个个性化的、预测的脑动力学模型,支持机制洞察、虚拟实验和模型引导的神经刺激。
多尺度的白盒模型:
从单神经元到全脑网络
白盒模型的精髓在于其能够整合从神经生物学和物理学中推导出的机制原理,为模拟跨层级的神经动力学提供结构化且可解释的方法。在单神经元层面,经典的霍奇金-赫胥黎模型详细地刻画了进出神经元的离子流,尽管提供了深入的机制,但并不适用大规模神经元群体的模拟。因此,在进行神经网络的大规模模拟时,研究者常采用简化后的泄露积分-发放(Leaky-integrate fire, LIF)模型来平衡简洁性与计算效率。
当到神经群体层面时,白盒模型通过平均场近似(mean-field approximation)将单神经元动力学扩展到宏观变量(如平均膜电位)。神经质量模型(NMMs)作为其中的杰出代表,利用低维且具有生物学解释性的方程描述群体动态,能够模拟如EEG节律、视觉注意力等现象。进一步地,脑网络模型(BNMs)通过整合神经质量模型作为节点动力学,模拟整个大脑网络的相互作用。这些网络模型通常采用邻接矩阵来编码从实测数据中推导出的结构连接。这种从微观到宏观的整合,为理解分布式神经回路如何协调支持复杂认知功能开启了一扇窗。
黑盒模型:
数据驱动的灵活性与表现力
当潜在的生物物理机制难以用显式微分方程表达时,黑盒模型提供了另一种选择。作为通用近似器,人工神经网络理论上可以捕捉任何数据模式,尤其适用于建模大脑活动中特有的非线性和高维过程。过去十年中,RNNs、神经微分方程(Neural ODEs)以及Transformer等模型在模拟动力学系统方面取得了显著成就。
黑盒模型的成功很大程度上取决于模型架构与特定神经信号特征的匹配。例如,针对具有高时间波动特性的EEG信号,可能需要WaveNet等能够捕捉细粒度频率模式的架构;而针对fMRI数据,简单的多层感知器(MLP)就能表现出不错的预测精度。此外,从直接在观察空间建模转向在潜空间(latent spaces)建模,是理解神经动力学的另一个补充视角。认知状态往往存在于比原始数据更低维的子空间中,通过变分自编码器(VAE)等方法学习低维嵌入,可以更有效地揭示复杂动态背后的潜在轨迹。
灰盒模型:
先验知识与数据学习的融合
灰盒模型代表了一种混合建模范式,将神经科学或物理学的先验理论知识与数据驱动学习的灵活性相结合。神经科学先验可以作为引导学习的归纳偏置(inductive biases),塑造模型架构或作为优化过程中的正则化项。
一个典型的例子是受到树突计算(dendritic processing)启发的模型,如dend-PLRNN,它将树突机制整合进循环动力学中,在降低模型维度的同时增强了非线性重建能力。此外,大脑的一些基本组织原则也被纳入模型设计,例如强制神经元遵循戴尔原则(Dale’s principle)——即神经元要么是纯兴奋性的,要么是纯抑制性的,这被证明能稳定动力学并结构化皮层回路的时间表示。物理原理同样为灰盒模型提供了支撑。物理信息神经网络(PINNs)将物理定律直接嵌入损失函数中,使得学习过程受到公认物理动力学的约束,显著提升了参数推断的准确性和长期预测的稳定性。
▷图 2.三种类型的神经动力学模型:白盒、黑盒、灰盒模型。
求解逆问题:适应性挑战
解决从观测数据推断未知系统的逆问题,主要有两种主流框架:基于贝叶斯定理的概率框架和基于泛函分析的确定性框架。概率框架将待解参数视为随机变量,核心在于获取参数的后验分布。这种方法的优势在于能将领域专家的知识融入先验分布,并量化解的不确定性,自然地契合白盒模型。然而,对于参数缺乏明确机制含义的黑盒模型,贝叶斯推理往往难以锚定有意义的生物学解释。
确定性框架则将参数视为确定实体,通过最小化目标函数来获取参数解,该目标函数由量化模型预测与观察值偏差的数据保真项和引入先验约束的正则化项(regularization term)组成。虽然这种框架缺乏对解不确定性的量化,但由于其无需从分布中采样,计算效率极高,且能很好地适应黑盒和灰盒模型。近年来,两者融合的趋势愈发明显。例如,利用变分推理捕捉潜在变量的不确定性,同时利用确定性神经网络的拟合能力来表征复杂的动力学规则。
由于大脑由无数相互作用的组件组成,其逆问题本质上是一个高维且非线性的优化问题。目标函数极易陷入局部最小值,这意味着不同的初始值可能导致完全不同的解,而这些解都能很好地拟合观测数据。这种解的多义性会导致神经机制解释的歧义,使得基于模型的生理推论变得不可靠。为了确保解的可信度,必须引入“适定性(well-posedness)”作为建模的前提。
在代理脑的逆问题中,通常考虑三个关键标准。首先是存在性(Existence):对于给定观测数据,至少存在一组生物学合理的潜变量能使模型预测匹配观测值。其次是唯一性(Uniqueness):对于特定的系统和数据,应获得唯一的代理脑模型。最后是稳定性(Stability):当观测数据受到自然生理波动干扰时,模型的解仅应发生微小变化。虽然在黑盒模型中,过度参数化的网络可能导致多组等效解,使得唯一性要求不再适用,但我们仍期望其潜空间表示能够保持稳定,这表明模型找到了表征神经动力学的合适嵌入空间。
▷图 3. 求解逆问题。(a)建模;(b)用正则化来学习。将目标属性的先验作为正则化加入到损失函数中,优化器解决了学习问题。(c)非唯一性的案例。优化算法中的不同初始条件生成类似模型表现的不同解。(d)不稳定性的案例。通过奇异值分解和扰动测试的稳定性分析。
正则化:缓解病态问题的核心策略
鉴于神经动力学的强非线性、多尺度耦合属性以及观测数据固有的噪声,上述适定性条件往往难以满足,导致逆问题表现为“病态(ill-posed)”。正则化理论(Regularization theory)是解决此类问题的关键,其核心思想是通过添加正则化项来引入先验约束,预设参数解或模型行为的特征。这能够窄化解空间,使解符合生理特征并在噪声扰动下保持稳定。
正则化主要通过两种方式发挥作用。一种是数学先验正则化,如稀疏性约束(Sparsity Constraints)促使模型保留关键连接,或能量约束(Energy Constraints)限制参数幅度以防止过拟合。另一种是基于神经科学知识的先验正则化,将解剖结构、生理机制等编码进正则化项。例如,整合从DTI推导出的结构先验,确保潜表征与大脑的物理结构对齐。虽然这些策略只是缓解病态问题而非彻底消除,但工程实践证明,当正则化策略与问题特征深度结合时,能显著提高逆问题的解的可信度。
双重视角下的评估:
数学精确与生物一致
训练完成后,评估模型是否捕捉到了神经系统的核心动力学,以及是否提供了可解释的表征,是至关重要的一步,通常有数学和神经科学两个互补的视角。数学视角侧重于数据相似性的评估。常用的有点对点误差(如均方误差 MSE),以及分析数据分布全局属性的概率方法(如KL散度或Wasserstein距离)。此外,由于大脑被认为运行在“混沌边缘”,衡量系统对初始条件敏感性的最大李雅普诺夫指数,以及反映吸引子几何复杂性的分形维度,是验证模型是否复制了大脑关键动力学特征的重要指标。
神经科学视角则关注功能的一致性。评估框架会考虑时空激活模式的相似度、光谱相似度以及功能连接的相似性。在实际应用中,代理脑还需要通过任务特定的指标进行验证。例如,在癫痫定位中,通过比较模型预测的癫痫灶与临床切除区域的重合度来评估准确性。这种数学忠实度与神经科学实用性的双重评估,为完善代理脑模型提供了坚实基础。
▷图 4. 从数学和神经科学的视角进行模型评估。(a-c)数学视角。通过随机Jansen-Rit模型生成合成数据。上下两行对应于来自同一底层系统的两个代理大脑,在三个表征空间中进行评估:(a)状态空间轨迹(均方根误差,RMSE);(b)概率分布(平均Kullback-Leibler散度);(c)相空间动力学(相对相关维数)。代理脑1实现了较低的RMSE,而代理脑2在概率和拓扑度量方面表现更好。(d-h)神经科学观点。指标包括(d)时空相似性,(e)谱相似性,(f) FC相似性,(g)行为解码准确性,(h)预测病变结果的临床疗效。d和e侧重于替代大脑复制生物信号特征的能力,g和h评估其支持下游任务的能力。黄色表示真实的大脑数据;黑色表示代理脑的输出。
应用前景:
模拟平台与精准干预
代理脑作为一个能够产生类脑动力学和生理行为的神经动力学系统,为基础研究和临床转化提供了广阔机遇。代理脑可以作为强大的模拟平台,进行传统湿实验中受限于成本、伦理或技术难度的“假如(what if)”反事实测试。一个典型的应用是“虚拟癫痫患者(Virtual Epileptic Patient)”,这是一个个性化的全脑模拟平台,能够预测手术干预结果并优化方案,其表现潜力已显示出超越传统基于经验规划的趋势。
在神经刺激领域,代理脑正成为闭环神经刺激(closed-loop neurostimulation)的重要指南,协助解决“在哪里刺激、何时刺激、如何刺激”这三个核心问题。基于个体的功能脑网络,代理脑可以帮助识别最可能对刺激产生反应的区域。同时,模型可以实时监测特定的频率模式或低维表征,作为触发神经刺激的生物标志物,确保干预的及时性和有效性。
▷图 5. 代理脑的应用。(a)脑系统分析。代理允许直接检查基本系统属性,包括相位勘探、神经流形几何和网络动力学剖面。(b)代理作为仿真平台。作为一个硅测试平台,它支持神经动力学预测、虚拟手术(例如,定位癫痫灶以帮助临床计划)和反事实实验,如干扰连接权重或兴奋抑制比,以探测它们的功能角色。(c)替代引导神经刺激。对于非侵入性刺激(如TMS,tES)和侵入性刺激(如DBS,SEEG),代理脑有助于确定刺激的位置,何时靶向以及如何优化刺激参数。
未来展望:挑战与伦理
尽管前景光明,代理脑的发展仍面临多重挑战。首先是多尺度神经数据的整合,如何将微观的脉冲序列与宏观的fMRI信号在保持机制忠实度的前提下对齐,仍是一个未决的问题。其次是模型结构中表达能力与可解释性的平衡:过度表达的模型可能导致生物学上的黑盒化,而过度约束的模型可能无法捕捉大脑的复杂性。
此外,从通用模型向个体化模型的演进是实现精准医学的关键。最后,伦理考量不容忽视。由于代理脑依赖敏感的神经和临床数据,必须建立严格的数据安全框架和治理结构,并警惕训练数据中可能存在的偏见,以确保模型应用的公平性和透明度。随着跨学科协作的深入,代理脑模型将不仅加深我们对大脑动力学的理解,还将通过精准医疗变革神经系统疾病的诊疗。
阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”
https://wx.zsxq.com/group/454854145828
未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。