分子对接模拟在药物发现管线中是最前置的计算筛网——当一个全新靶点结构刚被解析出来,还没有任何先导化合物时,分子对接模拟往往是唯一能在短时间内覆盖百万级化合物库的方法。我们接手过一个靶向SARS-CoV-2主蛋白酶的虚拟筛选项目,任务是从二十万个类药化合物库中筛出50个候选分子进入实验验证,整个筛选逻辑建立在分子对接模拟的打分可靠性之上。

第一轮筛选使用AutoDock Vina默认参数,对接盒覆盖整个活性口袋,打分排名前50的分子中有32个在实验中毫无抑制活性。这个假阳性率高达64%,远高于文献报道的30-40%平均水平。问题出在两个层面:一是对接盒设置过大,把很多实际上无法进入口袋的分子也纳入了搜索空间;二是Vina默认打分函数对静电相互作用的描述过于粗略,导致一批带有强极性基团但取向错误的分子获得了虚高打分。项目在这里浪费了两周的合成验证周期,这批假阳性分子的合成和测试成本加起来超过了八万元。
认定Vina作为初筛工具仍然是最合理的选择,理由在于它的搜索效率—— Lamarckian遗传算法在全局搜索中的收敛速度远快于AutoDock4的传统遗传算法,单分子对接时间控制在分钟级别。面对二十万分子的库规模,换用更精确的AutoDock4意味着计算时间从三天延长到一个月,这在项目周期内不可接受。
正确的策略不是更换工具,而是分层使用。项目组将筛选流程拆分为两阶段:第一阶段用Vina做粗筛,打分阈值设为-7.5 kcal/mol,将库缩减至两千个分子;第二阶段对这批分子用Glide SP模式重新对接,要求柔性对接并输出多个构象,用更精细的打分函数做二次排序。关于分子对接工具的选择与参数设置,[AutoDock Vina文档](https://vina.scripps.edu/manual/)提供了详细的参数说明,而[RCSB PDB](https://www.rcsb.org/)上的靶点结构注释则是确认活性口袋位置的关键参考。
柔性处理是另一个决定成败的细节。靶点主蛋白酶的催化二联体(His41-Cys145)周围的柔性侧链如果被固定为晶体构象,部分配体的结合模式会因空间位阻被错误排除。项目组对His41和Met165两个残基设为柔性侧链,每个残基允许4个可旋转键,搜索空间从刚性的晶格状态扩展到了热力学可及的低能构象。代价是计算时间增加约三倍,但假阳性率从64%降到了28%——这个交换值得。
分子对接模拟最容易被误用的地方,是拿打分绝对值做跨分子比较。Vina打分-9.0的分子不一定比-8.0的活性更强,因为打分函数对不同化学骨架的校准基准不同。项目组采用的处理方式是计算富集因子(EF)——以已知活性分子的排名分位数作为基准,评估虚拟筛选的富集效果。当EF@1%达到15以上时,说明排名前1%的分子中富集了15倍于随机水平的活性分子,这个指标比绝对打分值有意义得多。
有一个案例值得记录:一个Vina打分仅-7.8的分子在二次筛选中被Glide排到了前20,实验IC50为0.4 μM,是整个批次中最强的抑制剂。如果项目组只信任Vina打分的前50名,这个分子根本不会进入实验。差距不会说谎,但单一打分函数的”差距”经常是错觉。
项目最终通过两阶段筛选策略获得6个验证有效的先导化合物,最佳分子IC50达到0.4 μM,算是被实验证明了的结论。值得警醒的是,如果项目组在第一轮翻车后直接放弃分子对接模拟改用其他方法,那6个有效分子将永远停留在虚拟库里。分子对接模拟的价值不在于打分的绝对精度,而在于它在合理参数设置下能够提供统计意义上的富集效率——这才是虚拟筛选真正需要的。
对于需要从大规模化合物库中快速筛选候选分子的项目,分子对接模拟仍然是性价比最高的入口。只要在打分函数选择、柔性处理和假阳性控制上保持审慎,它的结论足以指导实验资源分配。
GROMACS分子动力学模拟:从力场选择到自由能计算的完整工作流
GROMACS计算自由能:FEP全流程参数优化与膜蛋白体系的特殊处理
分子动力学模拟GROMACS完整流程:力场选择、平衡与轨迹分析方法
GROMACS计算自由能:膜蛋白-配体FEP结合能中电荷-范德华解耦与BAR收敛
分子动力学模拟计算:GROMACS蛋白质-配体复合物稳定性验证全流程
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
LAMMPS计算揭示纳米晶铜拉伸变形:位错演化与晶界行为的原子尺度分析
LAMMPS计算自由能:伞形采样与自由能微扰的实战方案
LAMMPS计算扩散系数:从Einstein关系式到多尺度扩散分析
LAMMPS计算径向分布函数:从g(r)提取微观结构信息的完整方法
LAMMPS粗粒化建模:从全原子映射到介观模拟的力场构建方法
拉伸动力学模拟:在力的作用下揭示生物大分子的机械性质
LAMMPS计算层错能:晶界、孪晶与位错核心结构的能量分析
LAMMPS分子动力学模拟工作流:聚合物、合金与复合材料典型案例
结合能计算:从催化剂筛选到吸附构型验证的关键标尺
分子动力学模拟计算在蛋白质-配体结合自由能预测中的力场依赖性与采样挑战
高分子材料分子动力学模拟:力场选择、链动力学与力学响应分析
VASPKIT计算吉布斯自由能:从声子谱到热力学量的完整流程
结构预测建模:材料基因组方法在新材料设计中的实战应用
LAMMPS计算自由能:热力学积分与Bennett接受率法的精度对比及最佳实践
HOMO能级理论计算:从DFT泛函比较到固态效应的多尺度修正策略
HOMO能级计算服务:Gaussian软件在有机半导体材料能级预测中的实战应用