手机版

自由能计算：药物先导化合物优化的热力学靶心

发布时间：2026-07-03 来源：科研学术网

小中大

字号：

自由能计算在药物设计管线中处于一个微妙的位置——它既不是最便宜的筛选手段，也不是最精确的实验替代品，但当一个先导化合物系列需要在几个相似骨架之间做取舍时，自由能计算往往是唯一能给出定量热力学依据的方法。我们参与过一个激酶抑制剂优化项目，核心任务是在保留母核结构的前提下，通过侧链修饰提升结合亲和力，整个决策链条就锚定在自由能计算的精度上。

项目踩到的坑

这个项目最初用MM-PBSA对三十个候选化合物做了批量打分，结果排名前五的分子在后续SPR（表面等离子共振）实验中有三个的结合亲和力反而低于先导化合物。问题不在于MM-PBSA方法本身不靠谱，而在于项目组把它用在了超出其精度边界的场景——侧链变化引起的自由能差异仅有0.5-1.5 kcal/mol，而MM-PBSA在这个区间的统计噪声已经与信号本身相当。项目在这里停滞了两周，因为每多一轮错误合成，都是数万元的试剂成本和一个月的周期损耗。

方法的性格：FEP与MM-PBSA的精度分层

认定FEP（自由能微扰）更适合这个精细优化阶段，理由很直接：FEP通过λ窗口逐步将参考分子”炼金术般”转换为目标分子，沿路径对dU/dλ进行热力学积分，理论上可以捕捉到MM-PBSA忽略的溶剂化熵贡献和构象重排效应。代价是计算成本——单个突变对的FEP计算需要数十纳秒的分子动力学采样，GPU加速下单次仍需12-24小时，且对起始构型质量高度敏感。

MM-PBSA并非没有用武之地。在虚拟筛选阶段，面对上千个分子的初筛需求，它的吞吐量优势无可替代——单条轨迹后处理即可获得结合自由能估计，无需额外模拟。精度分层的关键在于理解：MM-PBSA适合做”排雷”，把明显不合理的分子剔除；FEP适合做”裁判”，在少数候选之间给出可靠的相对自由能排序。

FEP的技术参数设置直接影响结果可信度。这个项目采用GROMACS中的 Bennett Acceptance Ratio（BAR）方法，λ窗口设为12个，每个窗口5 ns平衡加15 ns采样，软核势参数alpha设为0.5以避免端点奇点。溶剂模型选择TIP3P，虽然TIP4P-Ew在溶剂化自由能方面表现更优，但计算成本增加约30%，对于大规模相对自由能计算不划算。关于FEP方法的理论框架，[GROMACS手册](https://manual.gromacs.org/current/reference-manual/algorithms/free-energy-implementation.html)中的描述非常清晰，而[Alchemistry Wiki](https://alchemistry.org/)则提供了更系统的最佳实践指南。

数据的态度：误差棒比数值更重要

FEP计算给出的相对结合自由能与实验值的MAE（平均绝对误差）为0.8 kcal/mol，看似不小，但关键信息藏在误差棒里——项目组对每个突变对都做了三次重复计算，block averaging后的统计误差控制在0.3 kcal/mol以内。这意味着当计算预测某侧链修饰将提升结合力1.2 kcal/mol时，这个结论在统计上是站得住的。

有一个案例值得记录：苯环对位引入氟原子的突变，FEP预测ΔΔG为-0.4 kcal/mol，实验值为-0.3 kcal/mol，吻合良好。但间位氟取代的计算预测为-0.6 kcal/mol，实验却显示几乎无改善。回溯轨迹后发现，间位氟与附近的一个柔性侧链形成了短暂的非典型卤键，FEP将这个弱相互作用过度计入了——这类假阳性提醒我们，自由能计算的数值需要配合轨迹分析来解读。

回过头看的判断

项目最终借助FEP筛选出两个优于先导化合物的侧链修饰方案，体外活性分别提升了4倍和7倍，算是被实验验证了的结论。值得警醒的是，如果在精细优化阶段仍然依赖MM-PBSA，项目组很可能在三个假阳性分子上浪费大量合成资源。自由能计算的真正价值，在于选择与精度需求匹配的方法层级——用对场景，比用对方法更重要。

对于需要量化分子结合热力学差异的项目，自由能计算提供了从粗筛到精筛的完整工具链。只要在方法选择上保持诚实——不指望MM-PBSA解决亚kcal/mol的区分问题，不把FEP用在千分子级别的初筛上——它的结论足以支撑关键决策。