分子动力学模拟对接——这个名字本身就在说两件事:先用对接做快速虚拟筛选,再用MD做构象精修和稳定性评判。单独做对接的高分分子中,至少三成在MD里会出现脱离结合口袋、构象漂移或相互作用重构的情况。这不是对接算法的问题,而是刚性受体+半柔性配体的粗粒度模型天生对蛋白动态不敏感。

对接的边界:评分函数的系统性盲区
AutoDock Vina的打分函数是6个经验项的加权线性组合,包括空间位阻、疏水作用、氢键、旋转自由度惩罚等。这个函数的训练集主要来自PDBbind数据库中的实验结合亲和力——据Wang等人统计,Pearson相关系数在0.5-0.6之间(视测试集而定)。换句话说,Vina score能区分强结合(nM级)和弱结合(mM级),但在同一量级内(比如10 nM vs 50 nM)的区分力远不够。
团队在一个CDK2激酶抑制剂的筛选项目中做过回顾性分析:3000个分子的对接初筛前100里,用实验IC50做验证,只有65个的实际活性在μM以下——35个是假阳性。翻看这35个分子的对接构象,大多数在口袋深处有一个氢键匹配很好、整体打分也不低,但在MD里10 ns后就从口袋漂走了。
MD精修的四步验证链条
分子动力学模拟对接的实操链条分四步。第一步,取对接pose的前3个簇中心作为MD初始构象——单取最低分构象可能落在势能面的局部极小值上,而3个不同簇的代表构象覆盖率更高。第二步,跑20 ns的显式溶剂MD(TIP3P水盒子,距溶质表面至少12 Å,NaCl补到生理盐浓度0.15 M),观察配体重原子相对于初始对接构象的RMSD。
CDK2项目中,top 20分子里有6个分子的RMSD在5 ns内飙升到4 Å以上——配体从对接构象剧烈漂移。第三步,对RMSD稳定在2 Å以内的分子计算MM/PBSA结合自由能,取MD最后10 ns的平均值。MM/PBSA包含了溶剂化自由能的隐式近似和构象熵的估计,精度高于Vina score。第四步,交叉比对MM/PBSA排名和对接排名:两者趋势一致的是高可信度候选,趋势分歧的是需要额外验证的灰色区。
四步走下来,初始top 20缩小到top 8,再去掉2个MM/PBSA排名和对接排名倒挂的分子,最终锁定6个——后续实验验证中6个全部IC50在μM以下,无一假阳性。
MD中的结合构象重排
MD精修最有价值的地方不是重新打分,而是揭示对接遗漏的结合模式。CDK2项目中有一个含金刚烷基团的配体,对接pose显示金刚烷嵌入一个疏水浅槽。但在MD 8 ns左右,该配体的金刚烷基团旋转了约40°,更深地楔入槽内,同时与之相连的苯环做了补偿性旋转——结合模式改变了但整体RMSD并没有飙升。这个构象重排在对接阶段不可能被采样到,因为刚性受体的设定让侧链没有任何自由度来容纳这个旋转。
MM/PBSA分析进一步揭示,这个构象重排让范德华相互作用增强了约3.5 kcal/mol——换算成Vina score语言,就是近1个pKd单位的提升。对接打完分之后,MD补充了蛋白柔性和溶剂效应两个维度,这才是分子动力学模拟对接真正不可替代的价值。
对接筛选和MD精修的互补逻辑,在药物设计流程中已经成了标准操作。关于不同靶点体系下的具体参数设置和陷阱规避,站内蛋白-配体模拟系列有更详细的讨论。
更多内容请访问 https://www.keyanxueshu.com/
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
量子化学模拟计算:方法选择与计算精度的平衡逻辑
分子动力学模拟RMSD:从轨迹对齐到分段分析的蛋白构象稳定性判断方法
LAMMPS计算径向分布函数:参数设置与物理含义的深度剖析
LAMMPS粗粒化建模:从全原子映射到CG力场参数拟合的实战路径
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
纳米流体在受限空间中的输运行为模拟——从体相到纳米通道,水的扩散系数怎么变了
VASP可以计算分子能量吗:气相分子DFT的周期边界修正与Gaussian交叉验证
分子动力学模拟对接:MD精修配体构象与对接打分互补的筛选策略
全原子分子动力学模拟原理:力场选择、时间步长与系综耦合的物理账本
分子结构预测:从DFT全局优化到ML辅助搜索的实战复盘
VASP分子动力学模拟:一个高温下MgO熔体结构的AIMD分析
siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程
污染扩散模拟计算:一个化工园区大气扩散项目的完整复盘
VASP计算中的磁性材料模拟:从自旋极化到磁相变