手机版
           

多对多分子对接:批量药物筛选的策略与陷阱

发布时间:2026-06-19   来源:科研学术网    
字号:

多对多分子对接不是把单靶点对接重复N次然后拼在一起。当一组化合物需要同时面对一组靶点蛋白时,流程设计的每个细节——从靶点预处理到打分函数选择——都会被批量计算的规模放大成系统性偏差,而这种偏差在单靶点模式下根本不会暴露。

一个抗肿瘤先导化合物筛选项目把这种放大效应展现得相当清楚:8个靶点蛋白,200个候选化合物,目标是在有限计算资源内获得每个化合物对每个靶点的结合轮廓。多靶点药物设计的逻辑前提是,许多肿瘤相关信号通路存在冗余,单一靶点抑制容易被旁路补偿;针对EGFR、ALK、ROS1、MET等靶点的药物序列本身就存在交叉,纯单靶点筛选容易遗漏广谱活性的候选。多对多分子对接在一次计算投入中给出化合物库对靶点集合的完整评估——哪些分子有选择性,哪些有泛活性,哪些在两者之间。

靶点预处理:质量决定可信度

8个靶点中6个有PDB共晶结构,2个需要同源建模补全。靶点质量直接影响对接打分的可信度,这一步的投入决定了后续所有结果的基线。Protein Preparation Wizard的流程看起来标准化:补缺失loop、分配质子化状态、优化氢键网络。但步骤的标准化不意味着结果的一致——分配质子化状态时,His残基的δ/ε质子化选择影响口袋静电分布,这里依据的是共晶配体周围的氢键几何,而非默认规则。

金属位点靶点的预处理更需审慎。HDAC晶体结构含两个催化锌离子,锌配位环境的参数设定(配位数、键长约束)直接影响口袋内势场。这一步后来被证明是整个项目中最关键的手动干预点。

Vina粗筛与偏差发现

AutoDock Vina的搜索空间以共晶配体几何中心为参考,Grid盒子统一设为22 Å × 22 Å × 22 Å,exhaustiveness=16(比默认8更严格,对深口袋更可靠),num_modes=9。8个靶点的Grid文件在批量提交前逐一目视检查,确认结合口袋完整包含在搜索空间内——这步耗时约4小时,后来避免了3个靶点的盒子偏移。

200个化合物经LigPrep处理:立体化学枚举、pH 7.4±1.0范围内质子化状态指派、OPLS3e力场构象优化,每个化合物最多保留32个低能量构象。预处理后配体条目从200扩展到约1380个。

Vina批量对接在16核工作站上运行约72小时。完成后打分矩阵为8×1380,但第一轮审视就发现了异常:HDAC靶点的打分分布整体偏高,已知无活性的阴性对照化合物在HDAC上的排名进入了前20%,其余7个靶点中阴性对照稳定在后50%。数据没有出错,是打分函数在特定靶点上的系统性偏差:HDAC口袋的两个锌离子与配体间的金属配位作用被Vina的经验势函数高估了。Grazulis等在J Comput Aided Mol Des上的系统性评测报告了类似现象,含金属位点的对接场景下经验打分函数的精度下降最为显著1

修正方案:HDAC靶点切换至Glide XP模式重新评分,启用金属螯合惩罚项(Metal Constraint Penalty)。阴性对照排名降至后50%,数据恢复可信度。

MM-GBSA重打分与候选筛选

Vina和Glide打分函数对结合自由能的估算误差约3-5 kcal/mol2,需要中间过滤层。从每个靶点的前20%取交集,去重后约170个候选化合物。

Prime MM-GBSA单点计算,受体骨架固定,VSGB 2.0水模型溶剂化处理。重打分后假阳性下降38%,与已知活性化合物排名相关性从0.41升至0.63。对旋转键≥8的高柔性候选,额外执行5 ns MD预平衡检验稳定性。

最终15个化合物进入酶活性验证,其中5个在两个以上靶点MM-GBSA值优于-48 kcal/mol,展现明确的多靶点结合模式,为双靶点药物设计提供起点3

多对多分子对接交付的不是一张候选清单,而是每个化合物在多靶点空间中的坐标图。单靶点对接永远看不到这种全局关联。回过头看,那次HDAC靶点的系统偏差如果不是矩阵数据的横向比较,根本不会被察觉——偏差本身就是多对多分子对接模式最有价值的副产品。

图说天下

×
gromacs计算
lammps计算
VASP计算
分子对接
分子自组装