怒江傈僳族自治州网站建设_网站建设公司_Angular_seo优化
2025/12/17 14:06:43 网站建设 项目流程

目录

文献核心先览

01. 摘要

02. 引言

03. 结果

04. 结论


近日,在ACS Synthetic Biology期刊发表的论文Deep learning-based prediction of enzyme optimal pH and design of point mutations to improve acid resistance,通过构建名为 Seq2pHopt-2.0 的深度学习模型,解决了仅基于蛋白质序列预测酶最适 pH 精度低且缺乏可解释性的难题。该研究的创新点在于结合了大规模预训练蛋白质语言模型(ESM-2)、多尺度卷积神经网络和自注意力机制,不仅显著提高了预测准确性,还利用注意力权重揭示了关键残基信息,并成功指导了酶的耐酸性改造。

文献核心先览

1. 模型构建:开发了 Seq2pHopt-2.0 模型,利用 ESM-2 生成嵌入,结合多尺度 CNN 和自注意力机制,实现了从序列到酶最适 pH 的高精度预测。

2. 可解释性:模型具有良好的可解释性,能有效识别酶活性位点、结合位点以及对 pH 敏感的可电离残基。

3. 工程应用:基于模型预测,成功指导了Pyrococcus horikoshii二乙酰壳二糖脱乙酰酶的分子改造,H44C使其在酸性条件下的活性提高了约 7%。

01. 摘要

准确预测酶的最适 pH 对于定量描述 pH 如何影响酶催化活性至关重要。本研究开发的 Seq2pHopt-2.0 模型在性能上优于现有的酶最适 pH 预测工具,并且通过提供信息丰富的残基注意力权重表现出良好的可解释性。该模型在酸性和碱性酶的精确分类上展示了其作为酶挖掘工具的潜力,可用于识别具有特定 pH 偏好的候选酶。此外,在 Seq2pHopt-2.0 指导下设计的单点突变成功将Pyrococcus horikoshii二乙酰壳二糖脱乙酰酶在低 pH(pH=4.5/5.5)下的活性提高了约 7%,表明 Seq2pHopt-2.0 是一个有效针对 pH 依赖性酶活性的计算机辅助酶设计工具。

02. 引言

酶在食品发酵、废物转化和生物制造等工业过程中发挥着关键作用,而 pH 是影响酶构象和催化活性的重要因素。每种酶都有其达到最大催化速率的最适 pH,因此,开发精确的预测器对于酶的挖掘和工程改造至关重要。然而,由于实验测定成本高昂,数据库中存在大量未知最适 pH 的酶。虽然已有几种基于序列的机器学习模型,但大多仅能进行酸碱分类,或者是预测精度较低的回归模型(如 MeTarEnz)。

近年来,蛋白质语言模型的使用提升了预测精度,例如 EpHod 和 Seq2pHopt-1.0 分别利用 ESM-1 和 ESM-2 取得了进展。尽管后续出现的 OphPred 利用 XGBoost 进一步提升了精度,但这些模型普遍缺乏对蛋白质残基层面的可解释性,且尚未应用于实际的酶工程改造中。针对这些空白,本研究旨在构建一个兼具高精度和良好可解释性的深度学习模型 Seq2pHopt-2.0。

该研究不仅构建了模型,还通过案例研究展示了其在酶 pH 偏好性挖掘中的应用。利用该模型指导了Pyrococcus horikoshii二乙酰壳二糖脱乙酰酶的定向进化,验证了其作为计算工具在酶工程领域的实用价值。

03. 结果

1. 模型性能卓越

经过超参数优化,确定了 4 个注意力头和 4 个残差密集块的最佳配置。Seq2pHopt-2.0 在独立测试集上取得了 RMSE=0.833 和 R2=0.479 的优异成绩(图 2B)。在同等测试条件下,该模型优于前代模型 Seq2pHopt-1.0 (R2=0.369) 和 OphPred (R2=0.457)(图 2C)。特别是在极端 pH 范围(pH < 6 或 pH > 8)的预测上,Seq2pHopt-2.0 表现出比 OphPred 更低的均方根误差,说明其对极端酸碱环境酶的预测更为稳健(图 2D)。

2. pH 偏好性识别与生物体关联

模型能够有效区分酸性和碱性酶,以 pH 7.0 为界,分类准确率达到 91.8%(图 3B, 3C)。此外,研究还将预测范围扩展到微生物层面,发现模型能通过预测酶的最适 pH 分布来显著区分嗜碱微生物和嗜酸微生物(图 3D)。然而,在区分嗜酸微生物和嗜中性微生物时,预测值的分布差异并不显著,这提示微生物生长 pH 与其体内酶的最适 pH 之间的关系可能比预期的更为复杂(图 3F)。

3. 注意力机制揭示关键序列信息

通过分析残基注意力权重,研究发现中性和嗜碱酶在酸性/碱性残基上的注意力权重显著高于嗜酸酶,揭示了可电离残基的重要性(图 4A, 4B)。此外,活性位点和结合位点上的注意力权重显著高于其他普通残基(图 4C)。以甘露聚糖内切酶为例,其活性位点几乎都位于注意力权重的峰值附近(图 4D)。这证明 Seq2pHopt-2.0 并非“黑箱”,而是确实捕捉到了与酶催化功能密切相关的序列特征。

4. 指导酶耐酸性改造

在对 PhDac 的改造中,模型识别出野生型序列中的 44 位残基具有最高的注意力权重峰值,提示其为潜在的关键突变位点(图 5B)。基于模型预测筛选出的 5 个突变体中,H44C 和 H44D 成功实现了预期的耐酸性提升。与野生型(M20)相比,突变体 H44C 在 pH 4.5 和 5.5 下的酶活均提高了约 7%(图 5D)。这一结果不仅验证了预测的准确性,也展示了该模型在计算机辅助酶设计中的实际应用能力。

04. 结论

Seq2pHopt-2.0 是一个可解释的深度学习预测器,在酶最适 pH 预测方面展现了优于现有工具的精度。通过成功指导二乙酰壳二糖脱乙酰酶的耐酸性改造,该研究证明了 Seq2pHopt-2.0 在酶工程设计中的实用性。该工具将有望加速具有目标特性的酶的发现过程,并推动基于计算机设计的酶工程发展。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询