手机版
           

蛋白药物小分子对接服务:从靶点选择到先导化合物优化的计算辅助流程

发布时间:2026-06-15   来源:科研学术网    
字号:

蛋白药物小分子对接服务的价值定位很清晰:在实验合成和活性测试之前,用计算手段筛选数以万计的化合物,把候选范围缩小到百级甚至十级,降低药物发现的成本和时间。但”筛选”和”筛选得准”之间,差的是对每个技术环节的严谨把控。

靶点结构评估:不是有PDB就行

对接服务的第一步是确认靶点蛋白的三维结构是否可用。PDB数据库里可能有同一个蛋白的多个晶体结构——不同分辨率、不同配体、不同突变体——选哪个对对接结果的影响很大。

选择标准有几个维度:分辨率优先选2.0 Å以下的;R-free因子应在20-25%的合理范围内;蛋白构象应与目标疾病相关的活性状态一致(有些激酶的DFG-in和DFG-out构象对应的结合口袋形状完全不同)。

团队在一个CDK9抑制剂对接项目中,找到了3个PDB结构:6G2H(分辨率2.6 Å,DFG-in)、5L1I(分辨率1.8 Å,DFG-in)、6O0X(分辨率2.1 Å,DFG-out)。客户需要的是ATP竞争性抑制剂,所以必须用DFG-in构象——6O0X直接排除。5L1I分辨率最高,但结合口袋里有一个非共价配体的存在,删除后口袋侧链的构象可能需要重新优化。6G2H分辨率虽然低一些,但口袋是apo状态,构象更接近靶点天然状态。最终选了5L1I做对接(高分辨率优先),同时对口袋侧链做了质子化状态和旋转异构体的优化。

化合物库的构建和预处理

虚拟筛选的化合物库来源通常是商用数据库(ZINC、Enamine、ChemDiv等)或客户自有的化合物库。无论来源如何,化合物在对接之前必须经过标准化预处理:质子化状态调整(根据pH)、互变异构体生成、3D构象生成(可能存在多个低能构象)、电荷计算(Gasteiger或AM1-BCC)。

预处理看起来是机械操作,但有一个容易出错的地方:手性中心的处理。如果化合物的某个手性中心在对接时被错误地翻转,对接结果可能完全不同——因为镜像构象在空间上的取向完全不同,与口袋的互补性可能从优变差。

团队用Open Babel做了化合物库的标准化处理,对每个有手性中心的化合物保留了所有立体异构体(而不是只保留一个),在对接时分别处理。虽然增加了计算量,但避免了因为手性翻转导致的假阴性(漏掉活性化合物)。

对接流程:分层筛选策略

对于数万量级的化合物库,直接用高精度对接(exhaustiveness=32 + MM-GBSA重排序)不现实。团队采用三步分层筛选:

第一步:快速对接(Vina, exhaustiveness=8),筛掉打分>-7 kcal/mol的化合物。这一步的计算成本最低(每秒约100-200个化合物),能把库从5万缩小到5000。

第二步:中等精度对接(Vina, exhaustiveness=24),对5000个候选做更充分的构象搜索。筛掉打分>-8.5 kcal/mol的,剩约500个。

第三步:MM-GBSA重排序,对500个候选做精细打分,取top-50作为最终推荐。

三步筛选的总计算时间约48小时(32核集群),从5万到50个——筛选率1000:1。如果直接用MM-GBSA对5万个化合物做评估,同样的计算资源可能需要几个月。

结果验证和交付

对接服务交付的不是一份打分列表,而是一份可操作的分析报告。报告内容包括:top-50化合物的结合构象图和打分排名、关键残基与化合物的相互作用分析(氢键、疏水接触、π-π堆积)、化合物的结构多样性和药物相似性(Lipinski五规则)、已知活性化合物的对比(如果客户有参照数据)。

蛋白药物小分子对接服务在分子动力学的各类应用中属于对接-筛选的典型场景。它的价值不在于”算出正确答案”,而在于”大幅缩小搜索空间,让实验资源集中在最有潜力的候选上”。更多药物计算服务的信息,可参阅科研学术网首页

图说天下

×
gromacs计算
lammps计算
VASP计算
分子对接
分子自组装