手机版
           

分子动力学模拟在蛋白-配体对接中的应用——从静态对接到动态结合

发布时间:2026-06-13   来源:科研学术网    
字号:

分子动力学模拟对接——把MD模拟和对接结合起来——解决的是传统刚性对接的一个根本缺陷:蛋白在配体结合过程中会调整构象,这个”诱导契合”效应在静态对接中被完全忽略。

两年前做过一个BTK激酶抑制剂的项目,一开始用标准对接跑了一轮虚拟筛选,筛出来的候选里有几个分子虽然在打分上表现不错,但在MD模拟中跑了20 ns以后配体从结合口袋”滑”了出来——不是因为打分错了,而是因为对接用的是刚性受体,没有捕捉到结合口袋的构象动力学。

受体的构象动力学:为什么跑MD之前和之后不一样

对接中使用的受体构象通常是PDB晶体结构或者是同源建模出来的静态模型。但真实的蛋白在溶液中是动态的,结合口袋的侧链和loop区在纳秒尺度上经历显著的构象涨落。对于某些激酶来说,ATP结合口袋的DFG-motif构象翻转(DFG-in到DFG-out)是调控活性的关键运动,这个运动的能垒和时间尺度使得它在静态对接中完全不可见。

在BTK项目里的处理方式是:先对apo态受体跑200 ns的MD模拟做构象采样,用RMSD聚类选出5-10个代表性构象,每个代表性构象分别做对接,最后取多个构象的对接结果做共识评分。相比只用一个晶体结构,这种方法捕捉到了DFG-motif在in和out之间的中间态,最终筛选出的抑制剂不仅对接打分高,在MD模拟中也保持了稳定的结合构象。

代价也很直接:200 ns的蛋白MD模拟,加上多构象对接的计算量,整个流程比传统对接慢了一个数量级。如果不是在初筛之后做精筛,而是全程用多构象对接,跑到天荒地老也跑不完。

MM/PBSA结合自由能:比对接打分更准,但也有自己的盲区

对接之后更进一步的验证方法是MM/PBSA(分子力学-泊松-玻尔兹曼表面积)或MM/GBSA结合自由能计算。这两类方法从MD轨迹中抽取一系列快照,对每个快照做结合自由能分解:ΔG_bind = ΔE_MM + ΔG_solv – TΔS。

其中ΔE_MM是分子力学能量(键能+角能+二面角+范德华+静电),ΔG_solv是溶剂化自由能(极性和非极性部分),TΔS是熵变。实际操作中TΔS通常用简正模分析估算,计算量大且精度受限——很多文献干脆忽略熵贡献,直接报ΔG_bind的焓变部分,标注”不包括熵效应”。

在BTK体系中跑了5个候选抑制剂的MM/PBSA计算,每个从MD轨迹中取100帧做结合能分解。结果是:MM/PBSA给出的结合能排序和对接打分不完全一致——有一个分子对接打分排名第3,MM/PBSA排到了第6,因为它的静电互补性不如对接打分估计的那么好,在MD的溶剂环境中暴露出几个未被满足的氢键给体和受体。

但MM/PBSA也有自己的问题。PB的连续介质模型在蛋白内部的低介电区域(ε≈2-4)和溶剂的高介电区域(ε≈80)之间的过渡处理是一个近似,对含金属离子的结合位点尤其不准——金属离子周围的极化效应在经典力场和连续介质模型中都欠描述。BTK体系中有一个抑制剂的关键药效团是和结合口袋中的镁离子配位的,MM/PBSA对这部分贡献的估计和后面做QM/MM的结果差了约3 kcal/mol。

力场的局限:AMBER还是CHARMM,还是两者都不够

当前蛋白-配体MD模拟的主力力场是AMBER(ff14SB或ff19SB蛋白参数+GAFF2通用小分子参数)和CHARMM(CHARMM36蛋白参数+CGenFF小分子参数)。两种力场对蛋白主链和二面角的处理有差异,但在大多数可溶性蛋白的模拟中,两套力场给出的RMSD和RMSF在纳秒尺度上是可比的。

真正的瓶颈不在蛋白力场,而在小分子配体的电荷参数。GAFF和CGenFF都是通用小分子力场,电荷用AM1-BCC或RESP方法从半经验量子化学计算中派生。对小分子药物来说,这个级别的电荷精度通常够用,但对含特殊官能团(比如磺酰胺、硼酸酯、硝基)的分子——半经验方法对这些基团的电荷分配可能不准。

团队的补救方案是:对关键候选分子,用DFT(B3LYP/6-31G*)重新算一遍RESP电荷,替换掉GAFF默认的半经验电荷,再跑一轮MM/PBSA。两个分子的结合能预测因此调整了1.5-2 kcal/mol——这个量级在一组5个候选的排序中完全可能改变最终的优选顺序。

从计算到实验的最后一公里

MD模拟对接的最终产出,不是什么漂亮的数据曲线,而是一个决策:哪几个分子值得送去合成和测试。

在BTK项目中,经过对接初筛→多构象对接精筛→MD模拟验证→MM/PBSA排序,把6个候选推给了实验团队。实验上测出其中4个IC₅₀在纳摩尔量级,1个在微摩尔,1个无活性。6进4的命中率在激酶抑制剂筛选中算是不错的结果,但那个微摩尔活性的分子在MM/PBSA预测中是排第2的——提醒我们自由能预测在这个精度水平下仍然有10-20%的显著错判概率。在科研学术网首页上能找到更多关于计算辅助药物发现的方法对比和选型经验。

图说天下

×
gromacs计算
lammps计算
VASP计算
分子对接
分子自组装