蛋白药物小分子对接是计算机辅助药物设计里最成熟的标准流程之一,工具多、教程多、论文里用得更多。但正因为太成熟,很多人对它的局限性反而缺乏警觉。一个激酶抑制剂筛选项目,目标是从3000个化合物库里找出结合模式最优的五个候选,用作后续动物实验的先导化合物。项目的压力来自时间:必须在六周内完成筛选、分析和排序,给出明确的优先级列表。

第一轮对接用的是AutoDock Vina,配体构象采样设了默认的exhaustiveness=8.3000个分子跑了两天一夜。项目组当时觉得已经很充分了,结果出来一看,结合能排名靠前的分子里有相当一部分是已经报道过的激酶抑制剂专利化合物——这些在真实筛选场景里是要排除的。更麻烦的是,有几个结合能看起来不错的分子,实际用分子动力学做结合稳定性验证时,RMSD窗口偏差超过了2埃,结合姿态在100纳秒内发生了明显漂移。
对接精度:exhaustiveness和搜索空间设置的门道
AutoDock Vina的exhaustiveness参数控制全局搜索的彻底程度,默认值8在初筛阶段够用,但对于结合模式需要仔细甄别的候选分子来说,明显不够。项目在这里的教训是:初筛用低exhaustiveness快速过滤,精筛用exhaustiveness≥32对top 5%的分子重新打分,搜索空间(box)严格按照活性口袋的边界设定,不要为了省事把整个蛋白兜进去。
结合能的打分函数也有局限。Vina score是把多种相互作用类型打包成一个经验势能,精度受限于力场本身,对卤键和pi-pi堆积的描述往往偏弱。这个项目里有一个含溴取代基的化合物,打分排名中等偏后,但分子动力学模拟显示其结合稳定性出奇地好——溴原子和蛋白口袋深处的氢键供体形成了关键卤键,这个相互作用在Vina打分里被低估了。蛋白药物小分子对接做到这一步,纯粹依赖打分排序是有风险的,必须结合相互作用指纹图谱做综合评估。
分子动力学验证:必不可少的过滤环节
项目最终确定的分析流程是:初筛→聚类→精筛打分→MD稳定性验证→相互作用指纹比对。这套流程让进入最终名单的候选分子从初筛的top 100缩小到了top 12.结合稳定性和相互作用模式双重验证之后,留下了5个真正值得推进的化合物。这个数字和目标完全吻合,差距不会说谎——打分排名前10但MD里漂移大的分子,在指纹比对里无一例外地缺乏关键的保守水分子置换相互作用。
蛋白药物小分子对接这件事,工具是通用的,但分析流程必须针对具体靶点的特性定制。靶点的变构位点和正构位点对配体的要求完全不同,柔性区域的描述深度也直接影响对接精度。盲目套用教程参数,在这个项目里差点把一个好的卤键配体筛掉。
分子动力学模拟计算:GROMACS蛋白质-配体复合物稳定性验证全流程
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
蛋白定点突变预测在热稳定性改造中的计算策略:从RosettaΔΔG到AlphaFold2多突变扫描
分子动力学模拟RMSD:从轨迹对齐到分段分析的蛋白构象稳定性判断方法
LAMMPS计算径向分布函数:参数设置与物理含义的深度剖析
LAMMPS粗粒化建模:从全原子映射到CG力场参数拟合的实战路径
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
分子动力模拟解析蛋白质在水-有机溶剂界面的结构失稳全过程
VASP可以计算分子能量吗:气相分子DFT的周期边界修正与Gaussian交叉验证
分子动力学模拟对接:MD精修配体构象与对接打分互补的筛选策略
全原子分子动力学模拟原理:力场选择、时间步长与系综耦合的物理账本
分子结构预测:从DFT全局优化到ML辅助搜索的实战复盘
VASP分子动力学模拟:一个高温下MgO熔体结构的AIMD分析
siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程
污染扩散模拟计算:一个化工园区大气扩散项目的完整复盘