多对多分子对接不是把单靶点对接重复N次然后拼在一起。当一组化合物需要同时面对一组靶点蛋白时,流程设计的每个细节——从靶点预处理到打分函数选择——都会被批量计算的规模放大成系统性偏差,而这种偏差在单靶点模式下根本不会暴露。

一个抗肿瘤先导化合物筛选项目把这种放大效应展现得相当清楚:8个靶点蛋白,200个候选化合物,目标是在有限计算资源内获得每个化合物对每个靶点的结合轮廓。多靶点药物设计的逻辑前提是,许多肿瘤相关信号通路存在冗余,单一靶点抑制容易被旁路补偿;针对EGFR、ALK、ROS1、MET等靶点的药物序列本身就存在交叉,纯单靶点筛选容易遗漏广谱活性的候选。多对多分子对接在一次计算投入中给出化合物库对靶点集合的完整评估——哪些分子有选择性,哪些有泛活性,哪些在两者之间。
8个靶点中6个有PDB共晶结构,2个需要同源建模补全。靶点质量直接影响对接打分的可信度,这一步的投入决定了后续所有结果的基线。Protein Preparation Wizard的流程看起来标准化:补缺失loop、分配质子化状态、优化氢键网络。但步骤的标准化不意味着结果的一致——分配质子化状态时,His残基的δ/ε质子化选择影响口袋静电分布,这里依据的是共晶配体周围的氢键几何,而非默认规则。
金属位点靶点的预处理更需审慎。HDAC晶体结构含两个催化锌离子,锌配位环境的参数设定(配位数、键长约束)直接影响口袋内势场。这一步后来被证明是整个项目中最关键的手动干预点。
AutoDock Vina的搜索空间以共晶配体几何中心为参考,Grid盒子统一设为22 Å × 22 Å × 22 Å,exhaustiveness=16(比默认8更严格,对深口袋更可靠),num_modes=9。8个靶点的Grid文件在批量提交前逐一目视检查,确认结合口袋完整包含在搜索空间内——这步耗时约4小时,后来避免了3个靶点的盒子偏移。
200个化合物经LigPrep处理:立体化学枚举、pH 7.4±1.0范围内质子化状态指派、OPLS3e力场构象优化,每个化合物最多保留32个低能量构象。预处理后配体条目从200扩展到约1380个。
Vina批量对接在16核工作站上运行约72小时。完成后打分矩阵为8×1380,但第一轮审视就发现了异常:HDAC靶点的打分分布整体偏高,已知无活性的阴性对照化合物在HDAC上的排名进入了前20%,其余7个靶点中阴性对照稳定在后50%。数据没有出错,是打分函数在特定靶点上的系统性偏差:HDAC口袋的两个锌离子与配体间的金属配位作用被Vina的经验势函数高估了。Grazulis等在J Comput Aided Mol Des上的系统性评测报告了类似现象,含金属位点的对接场景下经验打分函数的精度下降最为显著1。
修正方案:HDAC靶点切换至Glide XP模式重新评分,启用金属螯合惩罚项(Metal Constraint Penalty)。阴性对照排名降至后50%,数据恢复可信度。
Vina和Glide打分函数对结合自由能的估算误差约3-5 kcal/mol2,需要中间过滤层。从每个靶点的前20%取交集,去重后约170个候选化合物。
Prime MM-GBSA单点计算,受体骨架固定,VSGB 2.0水模型溶剂化处理。重打分后假阳性下降38%,与已知活性化合物排名相关性从0.41升至0.63。对旋转键≥8的高柔性候选,额外执行5 ns MD预平衡检验稳定性。
最终15个化合物进入酶活性验证,其中5个在两个以上靶点MM-GBSA值优于-48 kcal/mol,展现明确的多靶点结合模式,为双靶点药物设计提供起点3。
多对多分子对接交付的不是一张候选清单,而是每个化合物在多靶点空间中的坐标图。单靶点对接永远看不到这种全局关联。回过头看,那次HDAC靶点的系统偏差如果不是矩阵数据的横向比较,根本不会被察觉——偏差本身就是多对多分子对接模式最有价值的副产品。
分子动力学模拟计算:GROMACS蛋白质-配体复合物稳定性验证全流程
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
蛋白定点突变预测在热稳定性改造中的计算策略:从RosettaΔΔG到AlphaFold2多突变扫描
分子动力学模拟RMSD:从轨迹对齐到分段分析的蛋白构象稳定性判断方法
LAMMPS计算径向分布函数:参数设置与物理含义的深度剖析
LAMMPS粗粒化建模:从全原子映射到CG力场参数拟合的实战路径
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
分子动力模拟解析蛋白质在水-有机溶剂界面的结构失稳全过程
VASP可以计算分子能量吗:气相分子DFT的周期边界修正与Gaussian交叉验证
分子动力学模拟对接:MD精修配体构象与对接打分互补的筛选策略
全原子分子动力学模拟原理:力场选择、时间步长与系综耦合的物理账本
分子结构预测:从DFT全局优化到ML辅助搜索的实战复盘
VASP分子动力学模拟:一个高温下MgO熔体结构的AIMD分析
siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程
污染扩散模拟计算:一个化工园区大气扩散项目的完整复盘