蛋白药物小分子对接服务的价值定位很清晰:在实验合成和活性测试之前,用计算手段筛选数以万计的化合物,把候选范围缩小到百级甚至十级,降低药物发现的成本和时间。但”筛选”和”筛选得准”之间,差的是对每个技术环节的严谨把控。

对接服务的第一步是确认靶点蛋白的三维结构是否可用。PDB数据库里可能有同一个蛋白的多个晶体结构——不同分辨率、不同配体、不同突变体——选哪个对对接结果的影响很大。
选择标准有几个维度:分辨率优先选2.0 Å以下的;R-free因子应在20-25%的合理范围内;蛋白构象应与目标疾病相关的活性状态一致(有些激酶的DFG-in和DFG-out构象对应的结合口袋形状完全不同)。
团队在一个CDK9抑制剂对接项目中,找到了3个PDB结构:6G2H(分辨率2.6 Å,DFG-in)、5L1I(分辨率1.8 Å,DFG-in)、6O0X(分辨率2.1 Å,DFG-out)。客户需要的是ATP竞争性抑制剂,所以必须用DFG-in构象——6O0X直接排除。5L1I分辨率最高,但结合口袋里有一个非共价配体的存在,删除后口袋侧链的构象可能需要重新优化。6G2H分辨率虽然低一些,但口袋是apo状态,构象更接近靶点天然状态。最终选了5L1I做对接(高分辨率优先),同时对口袋侧链做了质子化状态和旋转异构体的优化。
虚拟筛选的化合物库来源通常是商用数据库(ZINC、Enamine、ChemDiv等)或客户自有的化合物库。无论来源如何,化合物在对接之前必须经过标准化预处理:质子化状态调整(根据pH)、互变异构体生成、3D构象生成(可能存在多个低能构象)、电荷计算(Gasteiger或AM1-BCC)。
预处理看起来是机械操作,但有一个容易出错的地方:手性中心的处理。如果化合物的某个手性中心在对接时被错误地翻转,对接结果可能完全不同——因为镜像构象在空间上的取向完全不同,与口袋的互补性可能从优变差。
团队用Open Babel做了化合物库的标准化处理,对每个有手性中心的化合物保留了所有立体异构体(而不是只保留一个),在对接时分别处理。虽然增加了计算量,但避免了因为手性翻转导致的假阴性(漏掉活性化合物)。
对于数万量级的化合物库,直接用高精度对接(exhaustiveness=32 + MM-GBSA重排序)不现实。团队采用三步分层筛选:
第一步:快速对接(Vina, exhaustiveness=8),筛掉打分>-7 kcal/mol的化合物。这一步的计算成本最低(每秒约100-200个化合物),能把库从5万缩小到5000。
第二步:中等精度对接(Vina, exhaustiveness=24),对5000个候选做更充分的构象搜索。筛掉打分>-8.5 kcal/mol的,剩约500个。
第三步:MM-GBSA重排序,对500个候选做精细打分,取top-50作为最终推荐。
三步筛选的总计算时间约48小时(32核集群),从5万到50个——筛选率1000:1。如果直接用MM-GBSA对5万个化合物做评估,同样的计算资源可能需要几个月。
对接服务交付的不是一份打分列表,而是一份可操作的分析报告。报告内容包括:top-50化合物的结合构象图和打分排名、关键残基与化合物的相互作用分析(氢键、疏水接触、π-π堆积)、化合物的结构多样性和药物相似性(Lipinski五规则)、已知活性化合物的对比(如果客户有参照数据)。
蛋白药物小分子对接服务在分子动力学的各类应用中属于对接-筛选的典型场景。它的价值不在于”算出正确答案”,而在于”大幅缩小搜索空间,让实验资源集中在最有潜力的候选上”。更多药物计算服务的信息,可参阅科研学术网首页。
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
量子化学模拟计算:方法选择与计算精度的平衡逻辑
小分子动力学模拟:溶剂效应与构象采样的计算策略
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
纳米流体在受限空间中的输运行为模拟——从体相到纳米通道,水的扩散系数怎么变了
核酸结构的分子动力学模拟:从双螺旋到配体结合的动态路径
石墨烯力学性能的分子动力学模拟:周期性边界与自由边界对断裂行为的系统性影响
溶液环境中蛋白质构象变化的分子动力学模拟:显式溶剂与隐式溶剂模型在构象采样中的权衡
siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程
污染扩散模拟计算:一个化工园区大气扩散项目的完整复盘
VASP计算中的磁性材料模拟:从自旋极化到磁相变
VASP计算在电池材料研究中的深度应用
表面科学模拟从清理表面到反应机理
VASP计算磁各向异性:自旋轨道耦合、磁矩取向和k点的三角关系——SOC开关不是越早开越好
多肽的分子动力学模拟:在溶剂、离子和膜环境中跑一条多肽链,水盒子里的每一颗钠离子都在改变构象分布
金属原子间键能计算:从结合能到解离能的路径选择