手机版
           

分子对接模拟:从虚拟筛选到结合模式预测的实战边界

发布时间:2026-07-03   来源:科研学术网    
字号:

分子对接模拟在药物发现管线中是最前置的计算筛网——当一个全新靶点结构刚被解析出来,还没有任何先导化合物时,分子对接模拟往往是唯一能在短时间内覆盖百万级化合物库的方法。我们接手过一个靶向SARS-CoV-2主蛋白酶的虚拟筛选项目,任务是从二十万个类药化合物库中筛出50个候选分子进入实验验证,整个筛选逻辑建立在分子对接模拟的打分可靠性之上。

项目在哪里翻车

第一轮筛选使用AutoDock Vina默认参数,对接盒覆盖整个活性口袋,打分排名前50的分子中有32个在实验中毫无抑制活性。这个假阳性率高达64%,远高于文献报道的30-40%平均水平。问题出在两个层面:一是对接盒设置过大,把很多实际上无法进入口袋的分子也纳入了搜索空间;二是Vina默认打分函数对静电相互作用的描述过于粗略,导致一批带有强极性基团但取向错误的分子获得了虚高打分。项目在这里浪费了两周的合成验证周期,这批假阳性分子的合成和测试成本加起来超过了八万元。

方法的性格:为什么Vina仍然不可替代

认定Vina作为初筛工具仍然是最合理的选择,理由在于它的搜索效率—— Lamarckian遗传算法在全局搜索中的收敛速度远快于AutoDock4的传统遗传算法,单分子对接时间控制在分钟级别。面对二十万分子的库规模,换用更精确的AutoDock4意味着计算时间从三天延长到一个月,这在项目周期内不可接受。

正确的策略不是更换工具,而是分层使用。项目组将筛选流程拆分为两阶段:第一阶段用Vina做粗筛,打分阈值设为-7.5 kcal/mol,将库缩减至两千个分子;第二阶段对这批分子用Glide SP模式重新对接,要求柔性对接并输出多个构象,用更精细的打分函数做二次排序。关于分子对接工具的选择与参数设置,[AutoDock Vina文档](https://vina.scripps.edu/manual/)提供了详细的参数说明,而[RCSB PDB](https://www.rcsb.org/)上的靶点结构注释则是确认活性口袋位置的关键参考。

柔性处理是另一个决定成败的细节。靶点主蛋白酶的催化二联体(His41-Cys145)周围的柔性侧链如果被固定为晶体构象,部分配体的结合模式会因空间位阻被错误排除。项目组对His41和Met165两个残基设为柔性侧链,每个残基允许4个可旋转键,搜索空间从刚性的晶格状态扩展到了热力学可及的低能构象。代价是计算时间增加约三倍,但假阳性率从64%降到了28%——这个交换值得。

数据的态度:打分函数的绝对值没有意义

分子对接模拟最容易被误用的地方,是拿打分绝对值做跨分子比较。Vina打分-9.0的分子不一定比-8.0的活性更强,因为打分函数对不同化学骨架的校准基准不同。项目组采用的处理方式是计算富集因子(EF)——以已知活性分子的排名分位数作为基准,评估虚拟筛选的富集效果。当EF@1%达到15以上时,说明排名前1%的分子中富集了15倍于随机水平的活性分子,这个指标比绝对打分值有意义得多。

有一个案例值得记录:一个Vina打分仅-7.8的分子在二次筛选中被Glide排到了前20,实验IC50为0.4 μM,是整个批次中最强的抑制剂。如果项目组只信任Vina打分的前50名,这个分子根本不会进入实验。差距不会说谎,但单一打分函数的”差距”经常是错觉。

回过头看的判断

项目最终通过两阶段筛选策略获得6个验证有效的先导化合物,最佳分子IC50达到0.4 μM,算是被实验证明了的结论。值得警醒的是,如果项目组在第一轮翻车后直接放弃分子对接模拟改用其他方法,那6个有效分子将永远停留在虚拟库里。分子对接模拟的价值不在于打分的绝对精度,而在于它在合理参数设置下能够提供统计意义上的富集效率——这才是虚拟筛选真正需要的。

对于需要从大规模化合物库中快速筛选候选分子的项目,分子对接模拟仍然是性价比最高的入口。只要在打分函数选择、柔性处理和假阳性控制上保持审慎,它的结论足以指导实验资源分配。

图说天下

×
gromacs计算
lammps计算
VASP计算
分子对接
分子自组装