分子对接怎么做这个问题,在药物设计圈子里几乎每个入门者都会搜。教程遍地都是,工具随手可用——AutoDock Vina免费开源,几行命令就能跑完一次对接。但真正做过项目的人都知道,分子对接的结果质量取决于一系列前置准备和后置验证,而这些步骤恰恰是教程里最容易被一笔带过的部分。

团队处理过一个CDK2激酶抑制剂筛选项目,目标是从3000个化合物库里找出结合模式最优的5个候选,用作后续动物实验的先导化合物。时间压力来自客户:六周内完成筛选、分析和排序,给出明确的优先级列表。
分子对接怎么做的第一步不是写Vina命令,而是准备蛋白结构。从PDB下载的CDK2晶体结构(1HCK)有几个必须处理的问题:缺失的loop区域需要补全、水分子需要选择性删除(保守水保留,结晶水删除)、质子化状态需要根据pH设定——团队在pH 7.4条件下用PROPKA计算了各残基的质子化状态,His63为HID(Nδ质子化而非Nε),这个选择直接影响对接口袋的静电环境。
蛋白准备中有一个陷阱很多人踩:直接用PDB原始坐标做对接,不做能量最小化。晶体结构中的原子坐标是实验观测的平均位置,但侧链构象可能不适合对接——口袋区域的侧链取向可能被结晶条件或配体诱导偏移。团队在CDK2上做了极短时间(500步)的限制性最小化(只放开口袋区域侧链),优化后口袋的Leu83侧链从晶体构型偏转了约15°——这个偏转让口袋底部多出了约0.4 Å的空间,直接影响了后续配体的嵌入深度。
另一个必须检查的是蛋白的原子类型和电荷分配。AutoDock Vina使用的力场对金属离子(如CDK2中结合ATP的Mg²⁺)的描述有局限——默认电荷分配可能不准确。团队在这个项目中直接删除了Mg²⁺(因为筛选的是ATP竞争性抑制剂,不需要模拟金属离子与ATP的配位),但保留了与Mg²⁺配位的关键水分子。
3000个配体的3D构象生成用Open Babel批量处理,每个配体生成最多10个低能构象。构象数量不是越多越好——对于柔性分子(超过5个可旋转键),构象空间的维度爆炸会让Vina的搜索效率急剧下降。团队的策略是:初筛阶段只保留3个低能构象(减少搜索空间),精筛阶段对top 200保留全部10个构象。
搜索空间(Grid Box)的设定是分子对接怎么做中最具技术含量的步骤。团队严格按照CDK2活性口袋的边界设定box中心和尺寸——中心坐标取口袋核心残基(Leu83、His84、Asn86)的几何中心,box尺寸22×22×22 Å。一个常见错误是把box设得过大(比如覆盖整个蛋白),这会让Vina在非口袋区域浪费搜索预算,甚至在远离活性位点的表面凹槽找到虚假的”结合位点”。
AutoDock Vina的exhaustiveness参数控制全局搜索的彻底程度,默认值8在初筛阶段够用,但对于需要仔细甄别候选分子的精筛来说明显不足。团队的策略是两级打分:初筛用exhaustiveness=8快速过滤全部3000分子,精筛用exhaustiveness=32对top 200重新打分。
这个分级策略的效果很直接:初筛top 20中有6个分子在精筛后排名下降超过50位——它们的初筛高分来自搜索不够彻底导致的偶然”侥幸构象”。精筛后排名稳定上升的分子,才是真正具有物理可靠的结合模式的候选。
Vina score是多种相互作用打包成的经验势能,精度受限于力场本身——对卤键和π-π堆积的描述偏弱。这个项目中有一个含溴取代基的化合物,初筛排名中等偏后,但分子动力学模拟显示其结合稳定性出奇好——溴原子和口袋深处的氢键供体形成了关键卤键,这个相互作用在Vina打分里被低估了。
项目最终确定的分析流程是:初筛→精筛→MD稳定性验证→相互作用指纹比对。这套流程让进入最终名单的候选从3000缩小到5个。打分排名前10但MD里漂移大的分子,在指纹比对里无一例外地缺乏保守水分子置换相互作用——差距不会说谎,评分函数的偏差在这里被MD验证清晰地揭出来了。
分子对接怎么做不是一个软件操作问题,是一条需要物理判断贯穿全流程的分析链条。对接案例和参数模板,可以参考站点上的系列文章。
更多内容请访问 https://www.keyanxueshu.com/
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
量子化学模拟计算:方法选择与计算精度的平衡逻辑
LAMMPS计算径向分布函数:参数设置与物理含义的深度剖析
LAMMPS粗粒化建模:从全原子映射到CG力场参数拟合的实战路径
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
纳米流体在受限空间中的输运行为模拟——从体相到纳米通道,水的扩散系数怎么变了
核酸结构的分子动力学模拟:从双螺旋到配体结合的动态路径
分子结构预测:从DFT全局优化到ML辅助搜索的实战复盘
VASP分子动力学模拟:一个高温下MgO熔体结构的AIMD分析
siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程
污染扩散模拟计算:一个化工园区大气扩散项目的完整复盘
VASP计算中的磁性材料模拟:从自旋极化到磁相变
VASP计算在电池材料研究中的深度应用
表面科学模拟从清理表面到反应机理
VASP计算磁各向异性:自旋轨道耦合、磁矩取向和k点的三角关系——SOC开关不是越早开越好