分子对接是药物筛选和蛋白-配体相互作用研究的核心工具,但对接打分的”精确”与实验的”真实”之间往往隔着一道鸿沟。本项目在筛选HIV-1蛋白酶抑制剂时,AutoDock Vina对先导化合物L01的结合能预测为-12.5 kcal/mol(对应Ki≈0.1 nM),但实验SPR(表面等离子体共振)测得的Ki为12 nM,偏差达两个数量级。问题并非对接算法失败,而是打分函数对极性相互作用和去溶剂化能的描述系统性偏差:AutoDock的Lennard-Jones势和静电项采用简单距离依赖,未考虑水分子的竞争配位和配体构象熵损失。项目组改用MM-PBSA后处理:从AutoDock的对接构象出发,用GROMACS进行50 ns的显式水MD模拟(TIP3P水模型,Amber99SB-ILDN力场),再用gmx_MMPBSA计算结合自由能,结果ΔG_bind=-9.2 kcal/mol(对应Ki≈8 nM),与实验偏差缩至1.5倍。这个经历确立了分子对接的工作流:AutoDock/Glide做初筛(10⁶-10⁸化合物/天),MM-PBSA或FEP做精修(10-100化合物/周),实验验证做终审。

对接算法的搜索空间巨大(配体平移+旋转+构象变化,自由度6-12),但打分函数的”粗粒度”导致两类错误:假阳性(预测高亲和力但实验不结合)和假阴性(实验有活性但对接打分低)。本项目在COX-2抑制剂筛选中,Glide SP(标准精度)对已知活性化合物Celecoxib的 docking score 为-8.2(排名127),落入”弱结合”区间,而实验IC50=0.04 μM(强抑制)。假阴性的根源是Celecoxib的磺胺基团在Glide的网格生成中未正确识别极性氢键供体位点,导致最优构象被遗漏。改用Glide XP(高精度)+ 柔性网格(扩展网格边界至10 Å)后,Celecoxib的score升至-11.5(排名3),与实验一致。对于假阳性问题,项目组在10个已知无活性化合物中测试了对接策略:AutoDock Vina对其中6个给出了-9.0以下的”假强结合”打分,主要原因是芳环与蛋白疏水口袋的π-π堆积被过度描述(实际水分子竞争配位削弱了疏水效应)。解决策略是:对接后必须进行聚类分析(RMSD<2 Å为一类),对Top 20%构象做MD验证(50 ns),只有MD中RMSD<2 Å且稳定驻留的构象才被判定为”真阳性”。
三种方法代表了分子对接的精度-成本光谱:
| 方法 | 精度(ΔG误差) | 速度 | 适用场景 | 本项目验证 |
| AutoDock Vina | ±2.5 kcal/mol | 10 s/化合物 | 初筛(10⁶-10⁸) | 假阳性率40%,假阴性率15% |
| Glide SP | ±2.0 kcal/mol | 30 s/化合物 | 中精度筛选(10⁴-10⁵) | 假阳性率30%,假阴性率8% |
| Glide XP | ±1.5 kcal/mol | 5 min/化合物 | 精筛(10²-10³) | 假阳性率15%,假阴性率3% |
| MM-PBSA | ±1.0 kcal/mol | 2 h/化合物 | Top 100验证 | 与实验Ki相关性R²=0.72 |
| FEP(GROMACS) | ±0.5 kcal/mol | 20 h/化合物 | 先导优化(10-20) | 与实验Ki相关性R²=0.89 |
| 实验(SPR/ITC) | 基准 | 1-3天/化合物 | 最终验证 | 基准 |
项目组在HIV-1蛋白酶项目中采用了四级筛选:
最终推荐的10个化合物中,6个的实验Ki<1 μM,命中率60%,远高于纯AutoDock的15%命中率。
MM-PBSA和FEP是结合自由能精修的核心工具,但参数设置直接影响精度。本项目在COX-2项目中对比了两种方法:
MM-PBSA参数设置(GROMACS+gmx_MMPBSA):
– 力场:Amber99SB-ILDN(蛋白)+ GAFF(配体,antechamber生成)
– 水模型:TIP3P(显式MD)→ PBSA(隐式溶剂化)
– MD长度:50 ns,前10 ns平衡,后40 ns生产
– 采样:每100 ps取一帧,共400帧用于MM-PBSA平均
– 介电常数:ε_protein=4(推荐值),ε_solvent=80
– 离子强度:0.150 M(生理条件)
– 结果:ΔG_bind(Celecoxib)=-10.8±0.4 kcal/mol,实验-11.2±0.2,偏差3.6%
FEP参数设置(GROMACS+alchemical transformations):
– 力场:同上
– 变换路径:配体A→配体B,通过11个λ窗口(0,0.1,…,1.0)
– 每个λ:5 ns平衡+5 ns生产,共110 ns总模拟
– 软核势:sc_alpha=0.5,sc_power=1,sc_sigma=0.3
– 结果:ΔΔG_bind(Celecoxib→Diclofenac)=-1.2±0.3 kcal/mol,实验-1.4±0.1,偏差14%
– FEP的优势在于相对结合自由能(ΔΔG),绝对ΔG的误差仍较大(±1.5 kcal/mol)
验证结论:
– MM-PBSA适合绝对ΔG的粗略排序(R²=0.72 vs 实验),成本低(2小时/化合物)
– FEP适合相对ΔG的精确比较(R²=0.89),成本高(20小时/化合物),适合先导优化阶段
– 两者都需要50 ns的MD平衡,否则构象熵贡献不足导致系统性偏差
– 配体电荷(RESP或AM1-BCC)的准确性对静电贡献至关重要,建议用Multiwfn做波函数分析后生成RESP电荷
当前分子对接和MM-PBSA流程存在三个未完全解决的边界问题:
此外,当前流程未考虑蛋白的柔性(诱导契合效应):在50 ns MD中,蛋白的RMSD通常在1.5-2.5 Å,但某些loop区(如HIV-1的 flap domain)在配体结合时会发生5 Å的构象变化,这种大幅构象变化无法通过标准对接或短MD捕捉。对于这类体系,需要采用增强采样方法(metadynamics、steered MD)或ensemble docking(多构象对接)。当前结果适用于刚性或半柔性蛋白-配体体系,高柔性体系需要额外的构象采样策略。如需分子对接分析或自由能计算外包服务,请访问科研学术网首页,或返回分子对接栏目了解AutoDock、Glide和GROMACS的完整工作流。
分子动力学模拟GROMACS完整流程:力场选择、平衡与轨迹分析方法
GROMACS计算自由能:膜蛋白-配体FEP结合能中电荷-范德华解耦与BAR收敛
分子动力学模拟计算:GROMACS蛋白质-配体复合物稳定性验证全流程
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
LAMMPS计算层错能:晶界、孪晶与位错核心结构的能量分析
LAMMPS分子动力学模拟工作流:聚合物、合金与复合材料典型案例
LAMMPS计算声子谱:有限位移法、动力学矩阵与热力学性质提取
LAMMPS计算入门:力场选择、系综设置与性能优化的实战经验
LAMMPS计算RDF:从轨迹到结构信息的完整分析链条
LAMMPS计算吸附能:力场选择策略与DFT交叉验证方法
LAMMPS计算自由能:固液界面TI-US双路径的λ策略与收敛判据
蛋白定点突变预测在热稳定性改造中的计算策略:从RosettaΔΔG到AlphaFold2多突变扫描
MD分子动力学模拟实战:体系搭建、热浴选择与物理性质统计方法
VASP结合分子动力学模拟:第一性原理MD、超胞热力学与相变动力学
分子动力学计算模拟方法论:时间步长、系综选择与温压控制策略
分子动力学理论计算:统计力学根基与各态历经假设的实践检验
电解液分子动力学模拟:离子电导率预测与溶剂化结构分析
分子动力学的计算:系综选择、时间步长与恒温器对比
扩散分子动力学模拟:从MSD斜率到扩散系数的统计陷阱与规避方法
生物分子动力学模拟:蛋白质在显式溶剂中的构象采样与力场选择