一个GPCR-拮抗剂体系的结合自由能计算项目,初始FEP设置在20个等间距λ窗口上跑了每窗口2 ns,BAR给出的ΔG值是-8.3 ± 2.1 kcal/mol——不确定度太宽,无法在药物化学意义上区分两个结构相似的候选化合物。排查过程中,两个问题逐渐浮出水面:结合口袋内水分子的重新平衡时间被低估,以及λ=0.2至0.3区间(电荷消除段)的phase-space overlap跌到了8%。

FEP的核心思路是用λ耦合参数把配体的相互作用逐步”关掉”——但把电荷和范德华两项同时消去不是一个好策略。范德华软核势引入的粒子间距离修正项(soft-core α≈0.5 nm²)本质上是给排斥壁做平滑处理,这个过程本身就给∂H/∂λ引入了额外的数值噪声。如果同时关掉电荷,两项噪声叠加,在λ靠近0.2的电荷敏感段会出现∂H/∂λ的异常尖峰。
分步解耦方案把这个过程拆成两段:第一阶段coul-lambda从0到1、vdw-lambda保持为0,只消除库仑相互作用;第二阶段coul-lambda保持1、vdw-lambda从0到1,只消除范德华相互作用。拆开之后,两段的∂H/∂λ分布都变得平滑可控。λ窗口加密的重点也随之清晰——电荷段的0至0.4区间和范德华段的0.6至1.0区间各追加到0.025的步长,总窗口数从20扩到34。BAR重估后的ΔG收敛到了-9.1 ± 0.6 kcal/mol——不确定度压缩到了化学可决的范围。
结合口袋水分子的迟滞效应是这个项目中最隐蔽的收敛杀手。配体的库仑和范德华相互作用被逐步消除后,配体占据的空间被周围水分子重新填满,这个过程的时间尺度在10至100 ns量级。若每个λ窗口仅设定1-2 ns采样,水分子在不同λ窗口之间来不及建立新的平衡构型分布,FEP能量估计便携带不可逆的路径迟滞偏差。应对策略分两步:第一,每个λ窗口跑足5 ns以上(这个项目实际用了8 ns/窗口);第二,在分析阶段追踪口袋内水分子占据数随λ的变化轨迹——该项目从λ=0.3开始占据数从2突变到6,若能保持连续变化而非阶梯跳跃,即说明水分子重排已达可逆稳态。
BAR估计量相比较于TI的梯形积分有本质优势:它利用正向和反向相邻窗口的能量差分布全部信息,在固定采样量下统计不确定度比TI低约30%。GROMACS的gmx bar工具可直接输出ΔG与统计误差。收敛性判据方面,要求单个λ窗口的phase-space overlap不低于10%——低于该阈值的窗口需要在中间追加λ点。该项目中λ=0.25追加到0.225之后,overlap从8%恢复到22%,BAR误差从1.1 kcal/mol下降到0.5 kcal/mol。
项目最终做了一条独立验证:对另一个已知结合能的共晶结构做相同的FEP-BAR流程对照,偏差在0.4 kcal/mol以内。两套体系的交叉验证为整套方法论的可靠性建立起了置信边界。
GROMACS计算自由能:膜蛋白-配体FEP结合能中电荷-范德华解耦与BAR收敛
分子动力学模拟计算:GROMACS蛋白质-配体复合物稳定性验证全流程
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
LAMMPS计算RDF:从轨迹到结构信息的完整分析链条
LAMMPS计算吸附能:力场选择策略与DFT交叉验证方法
LAMMPS计算自由能:固液界面TI-US双路径的λ策略与收敛判据
蛋白定点突变预测在热稳定性改造中的计算策略:从RosettaΔΔG到AlphaFold2多突变扫描
分子动力学模拟RMSD:从轨迹对齐到分段分析的蛋白构象稳定性判断方法
LAMMPS计算径向分布函数:参数设置与物理含义的深度剖析
LAMMPS粗粒化建模:从全原子映射到CG力场参数拟合的实战路径
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
分子动力学理论计算:统计力学根基与各态历经假设的实践检验
电解液分子动力学模拟:离子电导率预测与溶剂化结构分析
分子动力学的计算:系综选择、时间步长与恒温器对比
扩散分子动力学模拟:从MSD斜率到扩散系数的统计陷阱与规避方法
生物分子动力学模拟:蛋白质在显式溶剂中的构象采样与力场选择
分子动力学模拟如何做:从初始结构到可发表轨迹的十步工作流
VASP计算吉布斯自由能:金属表面吸附自由能中ZPE、振动熵与平动熵的校正链
分子动力模拟解析蛋白质在水-有机溶剂界面的结构失稳全过程