分子对接结合能角度预测比单纯的结合能打分更难——打分只需要给出一个数字,角度预测需要确定配体在结合口袋中的空间取向。同一个配体在同一口袋里,可能存在多个结合构象(不同的旋转角度、翻转方向、质心位置),它们的打分差异可能只有0.5-1.0 kcal/mol,在评分函数的误差范围内几乎无法区分。

AutoDock Vina默认输出20个构象,但根据exhaustiveness参数和搜索空间的大小,实际搜索到的构象可能有数百甚至数千个。直接看20个输出的构象容易遗漏——Vina的输出是经过去重和排序的,两个构象之间的RMSD如果小于某个阈值(默认0.5 Å)就只保留打分更低的那个。
团队在做一个蛋白激酶与抑制剂结合角度的预测项目时,把Vina的输出数量增加到50个(out_num=50),然后在50个构象上做了层次聚类(RMSD阈值1.5 Å)。聚类结果显示,50个构象实际上可以归为3个主要的结合模式簇:一类是嘌呤模拟环插入腺苷口袋的”经典”取向(占60%),另一类是配体翻转180°的”反向”取向(占25%),第三类是配体平移约2 Å的”偏移”取向(占15%)。
三种取向的Vina打分差异只有0.8 kcal/mol——Vina几乎无法区分哪一个更优。但结合口袋的几何约束是明确的:嘌呤模拟环必须在铰链区的两个关键氢键位点之间才能形成稳定的氢键网络。用这个几何约束筛选之后,只有”经典”取向满足条件——两个氢键的距离在2.8-3.2 Å之间,方向角在150-180°之间。
构象聚类加几何约束可以排除明显不合理的取向,但对剩余几个合理取向之间的精细区分,需要更高精度的打分方法。MM-GBSA(分子力学-广义玻恩表面积)是常用的重排序工具——它对每个构象做隐式溶剂下的能量分解,考虑了蛋白-配体复合物的构象能、去溶剂化能和熵贡献。
团队对三种合理取向做了MM-GBSA计算。”经典”取向的ΔG_bind = -42.3 kcal/mol,”偏移”取向为-38.7 kcal/mol,”反向”取向为-35.1 kcal/mol。差距拉开了4-7 kcal/mol,排序结果很明确。
MM-GBSA的计算成本比对接高得多——每个构象需要对蛋白-配体复合物跑几十皮秒的MD采样来取构象平均。但这个投入是值得的:Vina打分在0.8 kcal/mol范围内无法区分的构象,MM-GBSA可以拉开到4-7 kcal/mol的差距。
即使MM-GBSA给出了明确的排序,最终确认结合取向的最可靠方法还是显式溶剂MD模拟。把对接得到的构象放入显式水盒子,跑50-100 ns的MD轨迹,观察配体是否在口袋中保持稳定。
在这个项目中,团队对排名前二的构象分别跑了100 ns MD。”经典”取向的配体在整个轨迹中RMSD稳定在1.5-2.0 Å(相对初始构型的波动),两个关键氢键的保持率>95%。而”偏移”取向的配体在约30 ns后发生了一次明显的构象调整——嘌呤环从口袋中部分滑出,导致一个氢键断裂,RMSD跳升到3.5 Å以上。
这个结果印证了MM-GBSA的排序,同时也展示了MD验证的额外价值:它不仅能确认结合取向的稳定性,还能揭示结合过程中的动态行为(构象漂移、水分子介入等)。
计算层面的验证做得再充分,最终还是要回到实验。在这个项目中,合作方用X-ray晶体学解析了复合物的结构,实测的结合取向与团队预测的”经典”取向RMSD偏差只有0.8 Å——这个精度在分子对接领域算是相当高的。
分子对接结合能角度预测是分子动力学工作流中连接计算与实验的桥梁环节。它不能替代晶体结构实验,但可以在实验之前把候选构象的范围缩小到1-2个,大幅降低实验筛选的工作量。更多对接和MD验证的案例,可参阅科研学术网首页。
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
量子化学模拟计算:方法选择与计算精度的平衡逻辑
小分子动力学模拟:溶剂效应与构象采样的计算策略
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
纳米流体在受限空间中的输运行为模拟——从体相到纳米通道,水的扩散系数怎么变了
核酸结构的分子动力学模拟:从双螺旋到配体结合的动态路径
石墨烯力学性能的分子动力学模拟:周期性边界与自由边界对断裂行为的系统性影响
溶液环境中蛋白质构象变化的分子动力学模拟:显式溶剂与隐式溶剂模型在构象采样中的权衡
siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程
污染扩散模拟计算:一个化工园区大气扩散项目的完整复盘
VASP计算中的磁性材料模拟:从自旋极化到磁相变
VASP计算在电池材料研究中的深度应用
表面科学模拟从清理表面到反应机理
VASP计算磁各向异性:自旋轨道耦合、磁矩取向和k点的三角关系——SOC开关不是越早开越好
多肽的分子动力学模拟:在溶剂、离子和膜环境中跑一条多肽链,水盒子里的每一颗钠离子都在改变构象分布
金属原子间键能计算:从结合能到解离能的路径选择