手机版

溶液环境中蛋白质构象变化的分子动力学模拟：显式溶剂与隐式溶剂模型在构象采样中的权衡

发布时间：2026-06-06 来源：科研学术网

小中大

字号：

溶液环境中蛋白质的构象变化是理解酶催化、蛋白质折叠和药物结合的核心问题。分子动力学模拟在这个问题上面临一个根本性的计算代价与物理精度之间的权衡：显式溶剂模型忠实还原了溶剂分子的原子细节，但计算量使得可访问的时间尺度停留在微秒量级以下；隐式溶剂模型通过连续介质近似大幅提速，却以丢失溶剂结构化信息为代价。

显式溶剂下的构象探索

溶菌酶T4（PDB: 2LZM）在TIP3P水模型中的分子动力学模拟，体系总原子数约为28,000（蛋白质1,196个原子，水约8,900个分子）。在300K、1bar条件下运行50ns后，蛋白质骨架的RMSD（相对于晶体结构）在第15ns后进入波动平台，平均值为2.1Å，波动幅度（标准差）为0.3Å。

Loop区（特别是残基57-64和98-104）的RMSD波动幅度显著大于α螺旋和β折叠区。残基57-64的RMSD在50ns模拟中波动于1.8Å到3.4Å之间，这种大幅波动在静态晶体结构中完全不可见。显式溶剂模型捕捉到了loop区与水分子之间的动态氢键网络——该loop区在20-30ns期间形成了一个瞬时疏水核心，导致RMSD短暂下降至1.5Å，随后在35ns时氢键网络重构，RMSD又回升至3.0Å以上。

这种loop区构象的双向转换在隐式溶剂模型中几乎不可见。TIP3P水模型下的氢键寿命分析显示，loop区与水分子之间的氢键平均寿命为1.2ps，但存在长寿命尾巴（约5%的氢键寿命超过10ps）。这些长寿命氢键在loop区的构象锁定中起到关键作用，是隐式溶剂模型无法描述的物理过程。

隐式溶剂的收敛假象

通用玻恩模型（GB，具体为GB-Neck2参数化）将溶剂描述为连续介电介质，消除了所有水原子。相同的溶菌酶T4模拟在GB模型下，体系原子数仅为蛋白质的1,196个原子。计算效率提升了约40倍，使得500ns的模拟在同等计算资源下成为可能。

GB模型下的RMSD在10ns后即达到表观收敛，平均值为1.4Å，波动幅度仅为0.1Å。这个过快的收敛和过小的波动幅度是一个危险的信号——蛋白质的构象空间探索被过度约束。GB模型的连续介电近似忽略了水分子的离散性，导致溶剂化力的各向同性化，蛋白质的某些柔性自由度被人为抑制。

二级结构分析（DSSP）进一步确认了这种过度约束。在50ns的显式溶剂模拟中，残基57-64的loop区在两种不同的转角构象之间切换，两种构象的占比分别为65%和35%。GB模型下的500ns模拟中，该loop区几乎完全停留在一种构象（占比92%），另一种构象仅极短暂地出现。GB模型对loop区柔性的低估直接来源于溶剂化力中各向异性相互作用的缺失。

构象空间覆盖的定量对比

主成分分析（PCA）提供了构象空间覆盖的定量比较方法。将显式溶剂（50ns）和GB模型（500ns）的轨迹分别进行PCA，以前两个主成分（PC1和PC2）的投影面积作为构象空间覆盖的度量。

显式溶剂轨迹在PC1-PC2平面上的投影覆盖面积约为GB模型的2.3倍。即使GB模型拥有10倍于显式溶剂的采样时间，其构象空间的探索效率仍然显著低于显式溶剂。这个结果的物理原因是：GB模型的连续介电近似消除了溶剂分子的热涨落对蛋白质构象的随机驱动力，使得蛋白质的构象转变路径变得更窄、更确定。

这种过度确定性在某些研究中可能导致严重的偏差。例如，在模拟蛋白质-配体结合过程时，GB模型可能低估结合口袋的构象可塑性，从而高估结合亲和力的预测值。显式溶剂虽然采样时间有限，但每个时间帧都包含了更丰富的构象可能性。

氢键网络的离散性效应

显式溶剂与隐式溶剂差异的本质之一在于氢键网络的描述方式。TIP3P水模型下，溶菌酶T4的活性位点（残基62-63周围的催化口袋）形成了一个由7个水分子组成的结构化水网络。这个水网络在50ns模拟中保持了约40%的占据率，即平均有3个水分子持续占据催化口袋的特定位置。

这些结构化水分子在底物结合中起到桥接作用——它们既与蛋白质形成氢键，也与底物的官能团形成氢键。GB模型通过介电屏蔽函数来近似这种效应，但无法描述特定水分子在结合口袋中的选择性占据。在药物设计中，这种选择性占据直接决定了结合模式的选择性。

氢键动力学的差异同样显著。显式溶剂下，催化口袋中水分子的交换时间尺度为50-200ps，这个中等时间尺度的交换过程调控了蛋白质构象的动力学。GB模型中不存在水分子交换的概念，溶剂化状态的转变通过连续的介电响应来描述，丢失了时间尺度的层次性。

计算代价的实际权衡

显式溶剂与隐式溶剂的选择不应仅基于精度考量，计算资源的约束往往是决定性因素。在相同的计算资源（例如100个CPU核心）下，显式溶剂可运行的模拟时间为80ns，GB模型可达500ns。如果研究问题涉及微秒尺度的构象转变（如蛋白质折叠或大型结构域运动），GB模型可能是唯一可行的选择。

混合策略提供了一种中间道路。在蛋白质的关键区域（如活性位点或结合口袋）保留显式水分子的离散描述，而在远离关键区域的溶剂环境中使用隐式溶剂近似。这种局部显式-全局隐式的混合模型在LAMMPS中可通过fix imd或与其他量子力学/分子力学混合方法结合实现，但目前尚未有标准化的实现方案。

溶剂模型的选择本质上是研究问题的函数：涉及精确氢键网络的问题必须用显式溶剂；涉及长时间尺度构象探索的问题可能在GB模型中找到实用的妥协。显式溶剂覆盖的构象空间丰富度为GB模型的2.3倍这一事实，应当成为选择时的定量参考。

欢迎访问 keyanxueshu.com 了解分子动力学计算服务。

参考文献

Price, D. J., & Brooks III, C. L. “A modified generalized Born approximation for macromolecular solvation: Improvement based on considerations of solvent accessibility.” Journal of Computational Chemistry 23, 1045-1057 (2002).
Jorgensen, W. L., et al. “Comparison of simple potential functions for simulating liquid water.” Journal of Chemical Physics 79, 926-935 (1983).
Genheden, S., & Ryde, U. “The MM/PBSA and MM/GBSA methods to estimate ligand-binding affinities.” Expert Opinion on Drug Discovery 10, 449-461 (2015).