手机版

结合能分子对接：从打分函数到MM/GBSA重打分的精准亲和力评估

发布时间：2026-07-02 来源：科研学术网

小中大

字号：

在基于结构的药物设计中，分子对接提供了极其经济的蛋白-配体结合模式预测和初步亲和力排序，但对接打分函数对结合能的估计精度通常受限于其半经验或经验性质——研究表明Vina打分与实验结合自由能的Pearson相关系数约在0.5-0.7之间，远不能满足”从对接直接获得定量结合自由能”的需求。结合能分子对接的进阶策略是在对接pose基础上进行更高精度的自由能重打分，将蛋白-配体结合亲和力预测的精度推向可与实验值直接比较的水平。本项目基于大量结合能计算项目的实践经验，对该方法体系进行系统阐述。

一、对接打分函数的原理与局限性

理解结合能分子对接的第一步是认识打分函数的物理基础与内在局限。Vina打分函数是半经验结合自由能函数的近似——它包含立体排斥项（两参数高斯函数描述范德华排斥和吸引）、疏水接触项（基于原子类型的线性疏水表面贡献）、氢键加权项（随角度变化的氢键惩罚/奖励函数）和可旋转键惩罚项（每个可旋转键对应约0.3-0.5 kcal/mol的构象熵损失）。Vina分数单位近似于kcal/mol，分数越负表示预测结合越强。然而，Vina打分函数的简化带来了系统性误差：它忽略了溶剂的显式结构和熵效应——结合过程中蛋白质构象熵的损失和溶剂水的释放熵是关键贡献，但打分函数无法精确描述；它使用固定电荷模型，忽略了结合过程中的极化效应；它对金属配位、卤键和阳离子-π等特殊相互作用的描述精度不足。本项目在评估对接打分质量时，使用retrospective enrichment指标——从已知配体库中检测对接排序的表现（如ROC AUC和BEDROC值），而非仅检查对接分数与实验亲和力的直接相关性。

二、MM/GBSA重打分方法的实现

MM/GBSA（Molecular Mechanics/Generalized Born Surface Area）方法是在结合能分子对接pose上进行自由能重打分的常用策略，它将结合自由能分解为分子力学能量项（ΔE_MM）、溶剂化自由能项（ΔG_solv）和熵贡献项（-TΔS）：ΔG_bind = ΔE_MM + ΔG_solv – TΔS。计算实现流程为：从对接pose出发，对复合物、受体和配体分别跑短时MD模拟（通常2-5 ns），从平衡后的轨迹中均匀采样（通常100-200帧），对每帧计算上述能量分解，最后对所有帧求平均得到MM/GBSA结合自由能。本项目在使用MM/GBSA重打分时的关键参数选择如下：GB模型选择igb=2（GB-OBC1）或igb=5（GB-OBC2），igb=5对蛋白-配体体系通常表现更好；盐浓度设为0.15 M（模拟生理条件）；非极性溶剂化贡献使用LCPO方法从溶剂可及表面积估算（γ=0.0072 kcal/(mol·Å²)）；熵贡献通过准谐振近似计算（mmpbsa_py_nabnmode），但由于熵计算的收敛性差且耗时严重，如果仅用于相对排序，常省略熵项。MM/GBSA重打分相较于对接打分的改进显著——本项目在某个含56个已知配体的测试集上，Vina打分与实验pIC50的R²=0.42，而MM/GBSA重打分将R²提升至0.68。

三、MM/PBSA与绝对结合自由能方法

对于结合能分子对接结果的进一步精度提升，MM/PBSA方法和FEP/TI绝对自由能方法是更高层次的选择。MM/PBSA通过数值求解Poisson-Boltzmann方程来计算极化溶剂化自由能，比GB的广义近似更精确——特别是对结合界面涉及大量电荷变化（如磷酸基团结合或金属离子配位）的体系，PB对介电屏蔽的描述更准确。但PB计算的计算成本约为GB的10-50倍，且同样需要通过MD采样获得多帧数据。自由能微扰（FEP）是当前计算绝对或相对结合自由能最精确的方法——通过在λ空间中从0到1变分演化配体的相互作用，使用Bennett接受比（BAR）或多态Bennett接受比（MBAR）方法组合各λ窗口的数据获得自由能。FEP计算的精度可达1 kcal/mol以内，但单个配体的计算成本通常需要数万CPU核时。本项目在实际项目中采用分层策略：大规模虚拟筛选阶段使用Vina打分进行初筛（千-万级化合物），中级选择阶段使用MM/GBSA重打分（百级化合物），高级精准阶段使用FEP/TI方法对少数候选物进行定量自由能预测。

四、结合能成分的物理化学解析

结合能分子对接的一个关键价值在于将总结合自由能分解为物理化学上有意义的分量，揭示哪些相互作用驱动结合。MM/GBSA的自由能分解包括：范德华贡献（ΔE_vdW）——通常为负值且绝对值较大，反映蛋白-配体的形状互补性和疏水堆积作用；静电贡献（ΔE_ele）——可能是负值（有利）或正值（不利），取决于氢键网络和电荷互补性；溶剂化静电贡献（ΔG_GB）——通常与ΔE_ele符号相反，因为极性残基从水中转移到蛋白-配体界面需要部分去溶剂化；非极性溶剂化贡献（ΔG_SA）——通常为负值有利，因为配体结合减少了疏水表面暴露面积。本项目在分析某PARP抑制剂结合能时发现，范德华贡献（-52.3 kcal/mol）远大于静电净贡献（ΔE_ele+ΔG_GB=-8.7 kcal/mol），表明该抑制剂的结合主要由形状互补和疏水堆积驱动——这与PARP结合口袋以疏水壁为主的结构特征一致。自由能分解还可定位关键残基——若某个残基对结合总自由能的贡献<-2.0 kcal/mol，则该残基可能为”热点残基”，其突变会显著影响结合亲和力。

五、实验结合数据与计算值的对标

结合能分子对接的最终验证是与实验结合数据的定量对比。实验结合亲和力通常以Kd（解离常数）、Ki（抑制常数）或IC50（半抑制浓度）表示，与结合自由能的关系为ΔG_bind = RT·ln(Kd)，其中R=1.987 cal/(mol·K)，T=298K时RT=0.593 kcal/mol。本项目在执行对接结合能计算与实验对标时，需要注意以下数据口径陷阱：IC50与绝对Kd的关系受实验条件（底物浓度[L]）影响（Cheng-Prusoff方程），将IC50直接等同于Kd仅当[L]远小于Km时才合理。生化实验中Kd通常通过ITC、SPR、微量热泳动（MST）测量——这些方法的Kd值受缓冲液、温度和蛋白质纯度的影响，与计算条件的物理场景不同。本项目在同一数据集上的对标经验表明，MM/GBSA计算ΔG与实验ΔG之间的平均无符号偏差（MUE）通常在1.5-3.0 kcal/mol范围内——对于先导化合物优化（lead optimization）阶段的亲和力排序，这一精度已足够指导合成决策。

更多计算案例与服务详情请访问 https://www.keyanxueshu.com 了解。如需针对特定蛋白-配体体系的结合能分子对接计算，欢迎通过本站联系渠道与本项目团队沟通。