手机版

分子对接模拟：从虚拟筛选到结合模式预测的实战边界

发布时间：2026-07-03 来源：科研学术网

小中大

字号：

分子对接模拟在药物发现管线中是最前置的计算筛网——当一个全新靶点结构刚被解析出来，还没有任何先导化合物时，分子对接模拟往往是唯一能在短时间内覆盖百万级化合物库的方法。我们接手过一个靶向SARS-CoV-2主蛋白酶的虚拟筛选项目，任务是从二十万个类药化合物库中筛出50个候选分子进入实验验证，整个筛选逻辑建立在分子对接模拟的打分可靠性之上。

项目在哪里翻车

第一轮筛选使用AutoDock Vina默认参数，对接盒覆盖整个活性口袋，打分排名前50的分子中有32个在实验中毫无抑制活性。这个假阳性率高达64%，远高于文献报道的30-40%平均水平。问题出在两个层面：一是对接盒设置过大，把很多实际上无法进入口袋的分子也纳入了搜索空间；二是Vina默认打分函数对静电相互作用的描述过于粗略，导致一批带有强极性基团但取向错误的分子获得了虚高打分。项目在这里浪费了两周的合成验证周期，这批假阳性分子的合成和测试成本加起来超过了八万元。

方法的性格：为什么Vina仍然不可替代

认定Vina作为初筛工具仍然是最合理的选择，理由在于它的搜索效率—— Lamarckian遗传算法在全局搜索中的收敛速度远快于AutoDock4的传统遗传算法，单分子对接时间控制在分钟级别。面对二十万分子的库规模，换用更精确的AutoDock4意味着计算时间从三天延长到一个月，这在项目周期内不可接受。

正确的策略不是更换工具，而是分层使用。项目组将筛选流程拆分为两阶段：第一阶段用Vina做粗筛，打分阈值设为-7.5 kcal/mol，将库缩减至两千个分子；第二阶段对这批分子用Glide SP模式重新对接，要求柔性对接并输出多个构象，用更精细的打分函数做二次排序。关于分子对接工具的选择与参数设置，[AutoDock Vina文档](https://vina.scripps.edu/manual/)提供了详细的参数说明，而[RCSB PDB](https://www.rcsb.org/)上的靶点结构注释则是确认活性口袋位置的关键参考。

柔性处理是另一个决定成败的细节。靶点主蛋白酶的催化二联体（His41-Cys145）周围的柔性侧链如果被固定为晶体构象，部分配体的结合模式会因空间位阻被错误排除。项目组对His41和Met165两个残基设为柔性侧链，每个残基允许4个可旋转键，搜索空间从刚性的晶格状态扩展到了热力学可及的低能构象。代价是计算时间增加约三倍，但假阳性率从64%降到了28%——这个交换值得。

数据的态度：打分函数的绝对值没有意义

分子对接模拟最容易被误用的地方，是拿打分绝对值做跨分子比较。Vina打分-9.0的分子不一定比-8.0的活性更强，因为打分函数对不同化学骨架的校准基准不同。项目组采用的处理方式是计算富集因子（EF）——以已知活性分子的排名分位数作为基准，评估虚拟筛选的富集效果。当EF@1%达到15以上时，说明排名前1%的分子中富集了15倍于随机水平的活性分子，这个指标比绝对打分值有意义得多。

有一个案例值得记录：一个Vina打分仅-7.8的分子在二次筛选中被Glide排到了前20，实验IC50为0.4 μM，是整个批次中最强的抑制剂。如果项目组只信任Vina打分的前50名，这个分子根本不会进入实验。差距不会说谎，但单一打分函数的”差距”经常是错觉。

回过头看的判断

项目最终通过两阶段筛选策略获得6个验证有效的先导化合物，最佳分子IC50达到0.4 μM，算是被实验证明了的结论。值得警醒的是，如果项目组在第一轮翻车后直接放弃分子对接模拟改用其他方法，那6个有效分子将永远停留在虚拟库里。分子对接模拟的价值不在于打分的绝对精度，而在于它在合理参数设置下能够提供统计意义上的富集效率——这才是虚拟筛选真正需要的。

对于需要从大规模化合物库中快速筛选候选分子的项目，分子对接模拟仍然是性价比最高的入口。只要在打分函数选择、柔性处理和假阳性控制上保持审慎，它的结论足以指导实验资源分配。