生物分子对接和小分子对接听起来是同一件事,但实际操作的技术路线截然不同。小分子对接搜索的是一个小体积口袋内的配体嵌入构象,而蛋白质之间的对接面对的是一个面积可能超过2000 Ų的大界面——侧链的柔性、backbone的构象调整、甚至二级结构元素的位移,都可能决定界面的最终形态。这些因素让生物分子对接的搜索空间维度比小分子对接大了几个数量级。

团队处理过一个抗SARS-CoV-2中和抗体与刺突蛋白RBD区域对接的项目。实验组已经用cryo-EM确认了抗体的大致结合区域(RBD的receptor-binding motif),但具体的接触残基和界面氢键网络不清楚——他们需要对接计算给出界面残基的候选列表,指导后续的突变验证实验。
抗体-抗原的界面面积约1800 Ų,涉及抗体CDR区域的约15个残基和RBD的约12个残基。与小分子对接不同,这里的搜索空间不再是”口袋内嵌入”,而是”两个大分子面的相对取向”——6个自由度(3个平移+3个旋转)加上界面区域侧链的柔性调整。
生物分子对接领域有三个主流工具:ZDOCK(刚性对接、快速筛选)、ClusPro(刚性对接+聚类、界面优化)、HADDOCK(实验数据驱动、柔性对接)。
ZDOCK和ClusPro的计算速度很快(几分钟出结果),但它们假设两个蛋白在对接过程中保持刚性——界面区域的侧链不做调整。这个假设对小分子对接是合理的(配体够小,口袋基本不动),但对蛋白-蛋白对接来说,刚性假设会导致约40%的界面残基预测错误——因为真实的界面形成过程伴随着显著的侧链重排。
团队认定HADDOCK更适合这个项目,原因有两个:一是HADDOCK允许界面区域侧链的半柔性调整(第一轮刚性对接→第二轮侧链优化→第三轮backbone微调),二是HADDOCK可以直接引入实验数据作为约束——cryo-EM给出的大致结合区域可以转化为Ambiguous Interaction Restraints(AIR),指导搜索朝正确方向集中。
HADDOCK的AIR约束是生物分子对接中最有特色的功能。团队在这个项目中定义了两组AIR:抗体CDR-H3区域的4个残基(Tyr32、Arg50、Ser52、Trp98)为”active residue”,RBD的6个残基(Tyr453、Leu455、Phe456、Arg457、Tyr473、Ala475)为”passive residue”。Active residue必须参与界面接触,passive residue可能参与也可能不参与——这种不对称约束让搜索空间从全局缩小到目标区域附近,效率提升且噪声降低。
约束的来源不只是cryo-EM数据。团队还用Mutagenesis文献辅助确认了几个关键残基——RBD的F456A突变让抗体结合亲和力下降了约80%,这个实验事实直接将Phe456标为active residue。
HADDOCK的三层柔性方案在这个项目中展现了明显的优势。刚性对接(it0阶段)给出的最优构象界面RMSD约3.8 Å——与cryo-EM参考结构偏差偏大。侧链优化(it1阶段)后RMSD降到2.2 Å——界面区域CDR侧链的重排让接触面积增加了约300 Ų。Backbone微调(it2阶段)后RMSD进一步降到1.6 Å——CDR-H3 loop的微调让Tyr32和Phe456之间的距离缩短了0.5 Å,形成了一个之前被遗漏的关键π-π堆积。
三层柔性处理的计算时间从it0的30分钟增加到it2的4小时——时间成本翻倍但精度提升显著。对于需要精确界面残基列表来指导突变实验的项目,这个投入是完全必要的。
回过头看,生物分子对接在这个项目中给出的界面残基预测与后续定点突变验证的一致性达到75%——12个预测残基中有9个被实验证实为关键接触点,3个被实验否定。被否定的3个残基都位于柔性loop区域,这些区域的构象在溶液中可能与对接预测的静态构象有偏差。
需要坦承的是:HADDOCK的精度上限受限于两个因素——一是评分函数对界面能量的估计仍然是经验性的(不像DFT有物理级别的能量计算),二是backbone柔性在it2阶段只做了微调而非全范围采样。对于涉及大尺度构象变化的对接(如抗体的大CDR loop重排),当前的柔性处理方案仍然不够。
生物分子对接方法讨论,可以参考站点上的系列文章。
更多内容请访问 https://www.keyanxueshu.com/
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
量子化学模拟计算:方法选择与计算精度的平衡逻辑
LAMMPS计算径向分布函数:参数设置与物理含义的深度剖析
LAMMPS粗粒化建模:从全原子映射到CG力场参数拟合的实战路径
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
纳米流体在受限空间中的输运行为模拟——从体相到纳米通道,水的扩散系数怎么变了
核酸结构的分子动力学模拟:从双螺旋到配体结合的动态路径
分子结构预测:从DFT全局优化到ML辅助搜索的实战复盘
VASP分子动力学模拟:一个高温下MgO熔体结构的AIMD分析
siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程
污染扩散模拟计算:一个化工园区大气扩散项目的完整复盘
VASP计算中的磁性材料模拟:从自旋极化到磁相变
VASP计算在电池材料研究中的深度应用
表面科学模拟从清理表面到反应机理
VASP计算磁各向异性:自旋轨道耦合、磁矩取向和k点的三角关系——SOC开关不是越早开越好