手机版
           

自由能计算:药物先导化合物优化的热力学靶心

发布时间:2026-07-03   来源:科研学术网    
字号:

自由能计算在药物设计管线中处于一个微妙的位置——它既不是最便宜的筛选手段,也不是最精确的实验替代品,但当一个先导化合物系列需要在几个相似骨架之间做取舍时,自由能计算往往是唯一能给出定量热力学依据的方法。我们参与过一个激酶抑制剂优化项目,核心任务是在保留母核结构的前提下,通过侧链修饰提升结合亲和力,整个决策链条就锚定在自由能计算的精度上。

项目踩到的坑

这个项目最初用MM-PBSA对三十个候选化合物做了批量打分,结果排名前五的分子在后续SPR(表面等离子共振)实验中有三个的结合亲和力反而低于先导化合物。问题不在于MM-PBSA方法本身不靠谱,而在于项目组把它用在了超出其精度边界的场景——侧链变化引起的自由能差异仅有0.5-1.5 kcal/mol,而MM-PBSA在这个区间的统计噪声已经与信号本身相当。项目在这里停滞了两周,因为每多一轮错误合成,都是数万元的试剂成本和一个月的周期损耗。

方法的性格:FEP与MM-PBSA的精度分层

认定FEP(自由能微扰)更适合这个精细优化阶段,理由很直接:FEP通过λ窗口逐步将参考分子”炼金术般”转换为目标分子,沿路径对dU/dλ进行热力学积分,理论上可以捕捉到MM-PBSA忽略的溶剂化熵贡献和构象重排效应。代价是计算成本——单个突变对的FEP计算需要数十纳秒的分子动力学采样,GPU加速下单次仍需12-24小时,且对起始构型质量高度敏感。

MM-PBSA并非没有用武之地。在虚拟筛选阶段,面对上千个分子的初筛需求,它的吞吐量优势无可替代——单条轨迹后处理即可获得结合自由能估计,无需额外模拟。精度分层的关键在于理解:MM-PBSA适合做”排雷”,把明显不合理的分子剔除;FEP适合做”裁判”,在少数候选之间给出可靠的相对自由能排序。

FEP的技术参数设置直接影响结果可信度。这个项目采用GROMACS中的 Bennett Acceptance Ratio(BAR)方法,λ窗口设为12个,每个窗口5 ns平衡加15 ns采样,软核势参数alpha设为0.5以避免端点奇点。溶剂模型选择TIP3P,虽然TIP4P-Ew在溶剂化自由能方面表现更优,但计算成本增加约30%,对于大规模相对自由能计算不划算。关于FEP方法的理论框架,[GROMACS手册](https://manual.gromacs.org/current/reference-manual/algorithms/free-energy-implementation.html)中的描述非常清晰,而[Alchemistry Wiki](https://alchemistry.org/)则提供了更系统的最佳实践指南。

数据的态度:误差棒比数值更重要

FEP计算给出的相对结合自由能与实验值的MAE(平均绝对误差)为0.8 kcal/mol,看似不小,但关键信息藏在误差棒里——项目组对每个突变对都做了三次重复计算,block averaging后的统计误差控制在0.3 kcal/mol以内。这意味着当计算预测某侧链修饰将提升结合力1.2 kcal/mol时,这个结论在统计上是站得住的。

有一个案例值得记录:苯环对位引入氟原子的突变,FEP预测ΔΔG为-0.4 kcal/mol,实验值为-0.3 kcal/mol,吻合良好。但间位氟取代的计算预测为-0.6 kcal/mol,实验却显示几乎无改善。回溯轨迹后发现,间位氟与附近的一个柔性侧链形成了短暂的非典型卤键,FEP将这个弱相互作用过度计入了——这类假阳性提醒我们,自由能计算的数值需要配合轨迹分析来解读。

回过头看的判断

项目最终借助FEP筛选出两个优于先导化合物的侧链修饰方案,体外活性分别提升了4倍和7倍,算是被实验验证了的结论。值得警醒的是,如果在精细优化阶段仍然依赖MM-PBSA,项目组很可能在三个假阳性分子上浪费大量合成资源。自由能计算的真正价值,在于选择与精度需求匹配的方法层级——用对场景,比用对方法更重要。

对于需要量化分子结合热力学差异的项目,自由能计算提供了从粗筛到精筛的完整工具链。只要在方法选择上保持诚实——不指望MM-PBSA解决亚kcal/mol的区分问题,不把FEP用在千分子级别的初筛上——它的结论足以支撑关键决策。

图说天下

×
cp2k计算
dft计算
Gaussian计算
MS计算
VASP计算