为什么有些候选药物分子口服后完全吸收不了?答案往往隐藏在溶剂化自由能里。进入细胞的前提是能从水中”逃逸”进疏水的膜环境——这个过程的能量代价就是溶剂化自由能的差值。一个定量预测logP(油水分配系数)的计算方案,本质上就是在算水相和油相两个溶剂化自由能之差。

溶剂化自由能的定义和计算路径
热力学上,溶剂化自由能(ΔG_solv)是把一个溶质分子从气相转移到溶剂中所释放的自由能。对于水,它叫水合自由能(ΔG_hyd);对于正辛醇(模拟细胞膜),它叫亲脂自由能。logP直接是ΔG_hyd和正辛醇ΔG_solv之差除以RT ln(10)。
在GROMACS中,计算ΔG_solv的标准做法是单拓扑FEP:把溶质分子从完全耦合态(λ=0.溶液中正常存在)渐变到完全解耦态(λ=1.溶质从体系中消失)。这个过程中体系自由能的变化就是溶剂化自由能的负值。
计算方案:从气态到溶液的自由能级联
实际操作中不能直接把一个分子从溶液中”删掉”——那样会在盒子中留下一个真空孔洞。正确做法是分三个阶段:
第一阶段:溶剂中关闭溶质的静电相互作用。 只关库仑力(电荷→0),范德华相互作用保持。目的是先把溶质从极性环境里退出,范德华体积保留避免溶剂向内塌缩。
第二阶段:关闭范德华相互作用。 溶质此时已经中性,再逐步缩小范德华半径至零。软核势在这一阶段最关键——没有它,径向分布函数在r→0处发散,数值不稳定。
第三阶段(可选):不需要的”气态参考”。 在前两阶段完成后,溶质完全不与溶剂相互作用——实际上是一个真空孔洞。这个孔洞的自由能贡献可以通过解析公式估算(约几个kJ/mol量级),在精度要求<2 kJ/mol时可以考虑校正。
单阶段直接关掉所有相互作用是天真做法:静电和范德华同时减弱意味着中间λ态中溶剂水分子既感受不到电荷定向又感受不到体积排斥——它们会涌进溶质区域,造成不可逆的溶剂重组,后续λ窗口的采样质量极差。
GROMACS中的分步FEP方案
关键mdp片段(以第一阶段为例,仅关库仑):
free-energy = yes
couple-moltype = SOLUTE
couple-lambda0 = vdw-q ; λ=0: 全部耦合
couple-lambda1 = vdw ; λ=1: 保留vdW, 关库仑
sc-alpha = 0.5
sc-power = 1
sc-sigma = 0.3
; λ窗口分布(静电阶段两端加密)
init-lambda-state = 0
nstdhdl = 100
第二阶段(关范德华):
couple-lambda0 = vdw ; λ=0: 保留vdW, 无库仑
couple-lambda1 = none ; λ=1: 完全解耦
λ窗口分布对静电阶段(0.0. 0.1. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.8. 0.85. 0.9. 0.95. 1.0)相对均匀,因为库仑相互作用的∂H/∂λ在λ上近似线性。范德华阶段(0.0. 0.1. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.75. 0.8. 0.85. 0.9. 0.95. 1.0)在λ→1附近加密——因为范德华力在最后0.2的区间从弱吸引突然消失。
两个阶段的自由能之和是总溶剂化自由能(取负值)。如果带电溶质在纯水中,需要额外的带电周期边界条件校正(PBC correction),补偿盒子有限尺寸导致的净电荷静电偏差。GROMACS中没有内建的精确PBC校正,需要用解析修正——对于净电荷为q的溶质在介电常数ε_s的溶剂中,校正项约为q²/(8πε₀ε_sR)×(1-1/ε_s),其中R是等效盒子半径。
与实验的交叉验证:FreeSolv数据库
FreeSolv(https://escholarship.org/uc/item/6sd403pz)是目前最全面的小分子水合自由能实验数据库,收录了643个中性有机小分子的实验ΔG_hyd值,覆盖药物设计中常见的官能团类型。它是溶剂化自由能计算方法开发和验证的金标准。
用你的GROMACS FEP方案计算FreeSolv中的分子集(建议取样>50个分子),与实验值对比的均方根误差(RMSE)是客观的方法精度指标。GAFF力场+AM1-BCC电荷在FreeSolv上的RMSE约3.7-4.5 kJ/mol,更精细的RESP电荷或IPolQ-Mod charges能改善到约2.5-3.0 kJ/mol。如果你的RMSE超过5 kJ/mol,力场参数(特别是原子电荷分配)需要重新检查。
logP的预测路径
有了ΔG_hyd和正辛醇ΔG_solv,logP就是一步减法:
ΔG_transfer = ΔG_oct – ΔG_hyd
logP = -ΔG_transfer / (RT ln 10)
在298 K下,RT ln 10 ≈ 5.7 kJ/mol,意味着logP每差1个单位对应约5.7 kJ/mol的转移自由能差。常见有机小分子的logP在-3到+5之间,水合自由能在-50到+20 kJ/mol范围——这两个数字基本框定了FEP计算需要达到的精度。
需要在不同pH下考虑电离状态对logP的影响(logD vs logP),但GROMACS目前不支持恒定pH模拟和质子化状态随环境变化的在线切换——这是经典力场模拟的固有限制。结合QM/MM或经验pKa预测修正可以部分弥补。
溶剂化自由能是药物设计中计算筛选链条上的基础环节。科研学术网(https://www.keyanxueshu.com)预测的端到端计算方案。
GROMACS自由能计算方法对比:FEP自由能微扰与TI热力学积分的实战选择
GROMACS膜蛋白模拟全流程:脂双层构建、嵌入平衡与跨膜通道分析
GROMACS SMD拉伸动力学模拟指南:弹簧常数、拉速与力谱分析
GROMACS溶剂化自由能计算:水合能与logP预测的完整实战流程
GROMACS计算全流程:从体系构建到成品轨迹的实操经验
MS做分子动力学模拟:Materials Studio的Forcite模块参数设置与结果分析
动力学模拟计算:从Ab Initio MD到经典MD的方法选择与误差控制
MD分子动力学计算模拟:从力场选择到平衡判据的完整工作流
蛋白相互作用模拟:从对接到动力学,方法选择与实战边界
多肽的分子动力学模拟:力场选择、溶剂模型与构象采样的实战经验
高分子材料分子动力学模拟:链段运动与玻璃化转变的模拟思路
LAMMPS计算热导率:两种方法的实操经验与对比
LAMMPS计算吸附能:我的完整实操流程与关键参数