“多糖能做分子对接吗?”——这个问题项目组被问了三次,前两次的回答都是”不太适合”。直到第三次,客户带来一个肝素-抗凝血酶III(ATIII)的结合预测需求,项目组才认真研究了多糖对接的方法学。结论是:能做,但工具选择、构象搜索策略和评分函数修正都跟小分子对接完全不同。项目组最终预测的结合位点与晶体结构(PDB: 1AZX)偏差约2 Å RMSD——这个精度在多糖对接领域算得上优秀。

多糖对接难在哪里
小分子对接的标准假设是”锁钥模型”或”诱导契合”——配体在受体口袋中找到一个低能构象。多糖对接打破了这个假设的两个前提:
挑战1:极端的构象灵活性
肝素五糖(Arixtra的核心结构)有8个糖环,每个糖苷键(连接两个糖环的键)可以旋转,加上每个糖环的羟基也可以旋转。总自由度约20-30个。AutoDock Vina的搜索算法在>10个柔性键时效率急剧下降——搜索空间随自由度指数增长。
挑战2:糖类-蛋白质相互作用的特殊性
多糖与蛋白质的结合主要靠氢键(糖羟基密集)和静电作用(糖胺聚糖带负电)。传统的分子对接评分函数(如Vina score、AutoDock4 score)主要针对小分子药物优化,对氢键网络和电荷相互作用的权重可能不够。
挑战3:水分子介导的作用
多糖-蛋白质界面上经常有结构水分子充当氢键桥梁。传统对接忽略水分子,导致这些重要的相互作用被遗漏。
多糖对接的准备流程
项目组在肝素-ATIII对接中建立的准备流程:
Step 1: 多糖3D结构生成
肝素五糖的序列为:ΔUA(2S)-GlcNS(6S)-IdoA(2S)-GlcNS(6S)-IdoA(2S)。项目组用GLYCAM-Web服务器生成初始3D构型,力场参数用GLYCAM06(专为糖类开发的力场)。
关键细节:糖环的构象(⁴C₁椅式 vs ¹C₄ vs ²S₀)对结合模式影响巨大。肝素中的IdoA(艾杜糖醛酸)是特殊的——它可以在⁴C₁和¹C₄甚至²S₀之间切换。项目组生成了IdoA的两种构象各做一次对接,取能量最低者。
Step 2: 受体准备
从PDB获取ATIII结构(1AZX),去除原有配体和水分子。加氢(pH 7.4.HIS质子化状态用PROPKA预测)。受体柔性残基的选择:根据文献,ATIII的肝素结合位点涉及Arg46、Arg47、Lys114、Lys125等碱性残基。项目组将这些残基设为柔性侧链。
Step 3: 对接参数设置
由于柔性键太多(多糖20个+受体侧链10个),AutoDock Vina直接跑会超时。项目组采用的策略:
分步对接:
第一步:多糖刚性对接(固定糖苷键扭转角),搜索结合位点
第二步:在最佳位点附近,放开糖苷键做局部柔性优化
关键糖苷键约束: 根据文献,肝素五糖中IdoA(2S)-GlcNS(6S)的糖苷键扭转角φ≈-60°, ψ≈-120°是活性构象。项目组将这个键的搜索范围限制在±30°内,大幅缩小搜索空间。
电荷参数: 肝素的硫酸基团带-1或-2电荷。项目组用AM1-BCC方法计算部分电荷,确保硫酸基团的高电荷密度被正确描述。
对接算法选择
项目组对比了三种工具:
AutoDock Vina:
优势:速度快,适合初步筛选
劣势:柔性键>10时搜索不充分
结果:RMSD约4 Å(不够精确)
AutoDock-GPU(AD4评分函数):
优势:可以设置更细的网格地图,氢键和静电权重可调
劣势:计算时间比Vina长10倍
结果:RMSD约3 Å
Glide (Schrödinger):
优势:标准精度(SP)和额外精度(XP)模式,XP模式对多糖的形状匹配更好
劣势:商业软件,成本高
结果:RMSD约2 Å(最佳)
HADDOCK:
优势:可以用实验数据(NMR化学位移扰动、突变数据)作为约束
劣势:需要实验数据输入
结果:在无约束时RMSD约3-4 Å,有NMR约束时RMSD可降至约1.5 Å
项目组最终选择Glide XP模式做生产对接,AutoDock Vina做快速预筛。
评分函数修正
多糖对接的评分需要特殊处理。项目组对Vina评分做了两项修正:
1. 氢键密度修正:
多糖每个糖环有3-4个羟基,氢键密度远高于普通小分子。Vina的氢键项权重为1.0.项目组将其提升到1.5(通过修改源码或后处理重打分)。修正后,含有密集氢键的正确构象评分显著改善。
2. 介电常数调整:
肝素结合位点富含Arg/Lys(正电荷残基),而肝素本身带强负电。这种电荷-电荷相互作用在真空介电常数下被严重高估。项目组将介电常数从1.0(真空)调到4.0(蛋白质内部),避免了虚假的强静电吸引。
修正后的评分与实验结合自由能的对比:未修正评分明显偏强(偏高约1倍),修正后偏差降至约1 kcal/mol,可接受。肝素五糖与ATIII的实验结合自由能约-8至-10 kcal/mol(来自ITC实验)。
构象采样的增强策略
对于更长的多糖(>10个糖环),即使是分步对接也无法充分采样。项目组采用的增强策略:
MD预处理:用GLYCAM06力场在Amber中跑100 ns的溶剂化MD,收集多糖的代表性构象(聚类分析取前5个构象),每个构象独立做对接。
伞形采样:在关键糖苷键上做伞形采样,获得扭转角的自由能曲面。低能区域的构象作为对接的初始构型。
对接后MD验证:对接得到的最佳构象在显式溶剂中跑10 ns MD,观察结合模式是否稳定。如果MD中多糖脱离了口袋,说明对接结果不可靠。
反思:多糖对接仍是一个开放问题
项目组的肝素-ATIII对接成功,部分得益于这个体系有大量实验数据(晶体结构、突变实验、SAR)可以参考。对于缺乏实验数据的全新多糖-蛋白体系,对接精度会显著下降。
多糖对接领域的未来方向是开发专门的评分函数和搜索算法。目前最好的策略是”对接+MD验证+实验反馈”的组合——不要指望单一对接步骤给出可靠答案。更多分子对接的实战经验,可以查看分子对接相关文章,或返回科研学术网首页。
GROMACS计算自由能:膜蛋白-配体FEP结合能中电荷-范德华解耦与BAR收敛
分子动力学模拟计算:GROMACS蛋白质-配体复合物稳定性验证全流程
GROMACS分子动力学模拟:一个离子液体体系中锂离子传输的机理研究
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
LAMMPS计算RDF:从轨迹到结构信息的完整分析链条
LAMMPS计算吸附能:力场选择策略与DFT交叉验证方法
LAMMPS计算自由能:固液界面TI-US双路径的λ策略与收敛判据
蛋白定点突变预测在热稳定性改造中的计算策略:从RosettaΔΔG到AlphaFold2多突变扫描
分子动力学模拟RMSD:从轨迹对齐到分段分析的蛋白构象稳定性判断方法
LAMMPS计算径向分布函数:参数设置与物理含义的深度剖析
LAMMPS粗粒化建模:从全原子映射到CG力场参数拟合的实战路径
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
分子动力学理论计算:统计力学根基与各态历经假设的实践检验
电解液分子动力学模拟:离子电导率预测与溶剂化结构分析
分子动力学的计算:系综选择、时间步长与恒温器对比
扩散分子动力学模拟:从MSD斜率到扩散系数的统计陷阱与规避方法
生物分子动力学模拟:蛋白质在显式溶剂中的构象采样与力场选择
分子动力学模拟如何做:从初始结构到可发表轨迹的十步工作流
VASP计算吉布斯自由能:金属表面吸附自由能中ZPE、振动熵与平动熵的校正链
分子动力模拟解析蛋白质在水-有机溶剂界面的结构失稳全过程