分子动力学模拟对接——把MD模拟和对接结合起来——解决的是传统刚性对接的一个根本缺陷:蛋白在配体结合过程中会调整构象,这个”诱导契合”效应在静态对接中被完全忽略。
两年前做过一个BTK激酶抑制剂的项目,一开始用标准对接跑了一轮虚拟筛选,筛出来的候选里有几个分子虽然在打分上表现不错,但在MD模拟中跑了20 ns以后配体从结合口袋”滑”了出来——不是因为打分错了,而是因为对接用的是刚性受体,没有捕捉到结合口袋的构象动力学。

受体的构象动力学:为什么跑MD之前和之后不一样
对接中使用的受体构象通常是PDB晶体结构或者是同源建模出来的静态模型。但真实的蛋白在溶液中是动态的,结合口袋的侧链和loop区在纳秒尺度上经历显著的构象涨落。对于某些激酶来说,ATP结合口袋的DFG-motif构象翻转(DFG-in到DFG-out)是调控活性的关键运动,这个运动的能垒和时间尺度使得它在静态对接中完全不可见。
在BTK项目里的处理方式是:先对apo态受体跑200 ns的MD模拟做构象采样,用RMSD聚类选出5-10个代表性构象,每个代表性构象分别做对接,最后取多个构象的对接结果做共识评分。相比只用一个晶体结构,这种方法捕捉到了DFG-motif在in和out之间的中间态,最终筛选出的抑制剂不仅对接打分高,在MD模拟中也保持了稳定的结合构象。
代价也很直接:200 ns的蛋白MD模拟,加上多构象对接的计算量,整个流程比传统对接慢了一个数量级。如果不是在初筛之后做精筛,而是全程用多构象对接,跑到天荒地老也跑不完。
MM/PBSA结合自由能:比对接打分更准,但也有自己的盲区
对接之后更进一步的验证方法是MM/PBSA(分子力学-泊松-玻尔兹曼表面积)或MM/GBSA结合自由能计算。这两类方法从MD轨迹中抽取一系列快照,对每个快照做结合自由能分解:ΔG_bind = ΔE_MM + ΔG_solv – TΔS。
其中ΔE_MM是分子力学能量(键能+角能+二面角+范德华+静电),ΔG_solv是溶剂化自由能(极性和非极性部分),TΔS是熵变。实际操作中TΔS通常用简正模分析估算,计算量大且精度受限——很多文献干脆忽略熵贡献,直接报ΔG_bind的焓变部分,标注”不包括熵效应”。
在BTK体系中跑了5个候选抑制剂的MM/PBSA计算,每个从MD轨迹中取100帧做结合能分解。结果是:MM/PBSA给出的结合能排序和对接打分不完全一致——有一个分子对接打分排名第3,MM/PBSA排到了第6,因为它的静电互补性不如对接打分估计的那么好,在MD的溶剂环境中暴露出几个未被满足的氢键给体和受体。
但MM/PBSA也有自己的问题。PB的连续介质模型在蛋白内部的低介电区域(ε≈2-4)和溶剂的高介电区域(ε≈80)之间的过渡处理是一个近似,对含金属离子的结合位点尤其不准——金属离子周围的极化效应在经典力场和连续介质模型中都欠描述。BTK体系中有一个抑制剂的关键药效团是和结合口袋中的镁离子配位的,MM/PBSA对这部分贡献的估计和后面做QM/MM的结果差了约3 kcal/mol。
力场的局限:AMBER还是CHARMM,还是两者都不够
当前蛋白-配体MD模拟的主力力场是AMBER(ff14SB或ff19SB蛋白参数+GAFF2通用小分子参数)和CHARMM(CHARMM36蛋白参数+CGenFF小分子参数)。两种力场对蛋白主链和二面角的处理有差异,但在大多数可溶性蛋白的模拟中,两套力场给出的RMSD和RMSF在纳秒尺度上是可比的。
真正的瓶颈不在蛋白力场,而在小分子配体的电荷参数。GAFF和CGenFF都是通用小分子力场,电荷用AM1-BCC或RESP方法从半经验量子化学计算中派生。对小分子药物来说,这个级别的电荷精度通常够用,但对含特殊官能团(比如磺酰胺、硼酸酯、硝基)的分子——半经验方法对这些基团的电荷分配可能不准。
团队的补救方案是:对关键候选分子,用DFT(B3LYP/6-31G*)重新算一遍RESP电荷,替换掉GAFF默认的半经验电荷,再跑一轮MM/PBSA。两个分子的结合能预测因此调整了1.5-2 kcal/mol——这个量级在一组5个候选的排序中完全可能改变最终的优选顺序。
从计算到实验的最后一公里
MD模拟对接的最终产出,不是什么漂亮的数据曲线,而是一个决策:哪几个分子值得送去合成和测试。
在BTK项目中,经过对接初筛→多构象对接精筛→MD模拟验证→MM/PBSA排序,把6个候选推给了实验团队。实验上测出其中4个IC₅₀在纳摩尔量级,1个在微摩尔,1个无活性。6进4的命中率在激酶抑制剂筛选中算是不错的结果,但那个微摩尔活性的分子在MM/PBSA预测中是排第2的——提醒我们自由能预测在这个精度水平下仍然有10-20%的显著错判概率。在科研学术网首页上能找到更多关于计算辅助药物发现的方法对比和选型经验。
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
量子化学模拟计算:方法选择与计算精度的平衡逻辑
小分子动力学模拟:溶剂效应与构象采样的计算策略
高斯分子动力学模拟:BOMD与CPMD方法的选择和能垒计算实践
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
纳米流体在受限空间中的输运行为模拟——从体相到纳米通道,水的扩散系数怎么变了
核酸结构的分子动力学模拟:从双螺旋到配体结合的动态路径
石墨烯力学性能的分子动力学模拟:周期性边界与自由边界对断裂行为的系统性影响
溶液环境中蛋白质构象变化的分子动力学模拟:显式溶剂与隐式溶剂模型在构象采样中的权衡
VASP计算磁各向异性:自旋轨道耦合、磁矩取向和k点的三角关系——SOC开关不是越早开越好
多肽的分子动力学模拟:在溶剂、离子和膜环境中跑一条多肽链,水盒子里的每一颗钠离子都在改变构象分布
金属原子间键能计算:从结合能到解离能的路径选择
吸附能计算中的范德华修正方案选择:DFT-D3、DFT-D3(BJ)与TS的定量对比
VASP能带计算中的k点收敛性测试:从粗网格到精确结果的路径
VASP功函数怎么计算:静电势方法与参数设置详解
VASP分子动力学模拟:AIMD计算的设置逻辑与注意事项
VASP计算分子能量:从孤立分子建模到BSSE校正的全流程