点突变预测蛋白互作——从结构到能量的计算策略

发布时间：2026-06-13 来源：科研学术网

小中大

字号：

点突变预测蛋白互作，问题形式很简单：一个蛋白-蛋白复合物，给定某个点突变（比如p53的R175H），这个突变对复合物结合亲和力的改变是多少？答案决定了这个突变是破坏性的、良性的、还是可以增强相互作用的工程改造位点。

但真正做起来，要回答这个ΔΔG的问题，需要把突变前后的复合物分别做结合自由能计算，两个体系的能量差里包含了构象变化、溶剂重排、熵变等多个物理贡献。每一步都有近似，累积起来就是预测误差的主要来源。

ΔΔG计算：从统计势到热力学积分

计算点突变对蛋白互作影响的金标准，是ΔΔG = ΔG_wild – ΔG_mutant，其中ΔG是复合物形成的结合自由能。直接计算ΔG需要采样复合物、单体A、单体B三个状态的热力学平衡，这对常规MD来说只有中等大小的蛋白才能做到（100-200个残基的体系，约几十纳秒到μs的采样）。

实际项目中的做法通常分两层：快速筛选层和精确计算层。

快速筛选层用统计势方法（如FoldX、DynaMut、Mutations@AIMS），这类方法基于已知突变数据库训练的统计模型，输入是PDB结构和突变位点，输出是ΔΔG的预测值。FoldX用的是基于力场的经验模型，把突变后的能量变化分解为范德华、静电、溶剂化、氢键、熵等各项贡献，计算速度很快（几分钟到几十分钟一个突变）。

精确计算层用分子动力学结合自由能微扰（FEP）或热力学积分（TI）。FEP的思想是：从一个参考态（野生型）出发，通过λ参数的连续变化，把野生型的残基”炼成”突变型的残基，在λ空间的每个窗口跑MD采样，最后用Zwanzig公式计算自由能差。FEP对单点突变的计算精度通常在1-2 kcal/mol范围，比统计势方法高，但计算成本也高了一到两个数量级。

构象变化的忽略与不考虑

蛋白质在点突变后可能发生构象变化，这个变化如果影响结合界面，ΔΔG的计算就必须考虑构象重排。但绝大多数计算方法——包括FoldX和大多数FEP实现——默认突变前后蛋白质的主链构象不变，只改变侧链构象。

这个假设在突变发生在表面、不影响核心堆积时通常是合理的。但如果突变发生在蛋白核心区，或者突变导致界面重构，主链构象的变化就不能忽略。p53的R175位于DNA结合结构域的核心，R175H突变不仅改变了侧链，还引起了局部主链的微小位移，进而影响了p53和DNA的相互作用。在这种情形下，忽略主链构象变化的ΔΔG计算会严重低估突变的破坏性。

遇到这种情况，通常的做法是：对突变后的体系跑一轮MD模拟（50-100 ns），看RMSD和界面接触是否有显著变化。如果变化明显，用MD弛豫后的结构重新计算ΔΔG。这个额外的MD步骤增加了计算量，但在关键突变位点的分析中值得做。

静电相互作用：蛋白互作中被低估的能量项

点突变对蛋白互作的影响，很大一部分来自静电相互作用的改变。一个在界面上的带电残基（Arg、Lys、Glu、Asp）突变成中性残基（Ala、Gly），界面上的盐桥或氢键被打断，结合能的变化通常在1-3 kcal/mol。反过来，中性残基突变成带电残基，如果新形成的静电相互作用在溶剂环境中得不到补偿，结合能也可能不升反降。

在p53-MDM2相互作用的分析中，p53的Phe19、Trp23、Leu26三个残基嵌入MDM2的疏水口袋，构成关键的结合界面。如果这三个残基中的任何一个突变成带电残基，不仅破坏了疏水相互作用，带电侧链在MDM2口袋中还会引起不利的静电排斥。FoldX的计算结果反映了这一趋势，但用经典的库仑公式（不加介电屏蔽）来估算静电贡献的话，会严重高估或低估突变的影响——因为蛋白内部的介电常数（ε≈4）和溶剂（ε≈80）之间的过渡需要一个连续介质模型来描述。

错义突变的致病性评估：从能量到表型

点突变预测蛋白互作的最终用途，通常在疾病相关错义突变的致病性评估上。一个错义突变如果破坏了蛋白-蛋白相互作用，很可能是致病的；如果影响不大，可能是良性的。但ΔΔG本身不是致病性的直接判据——破坏一个非关键相互作用的突变，即使ΔΔG很大，也可能不影响细胞功能。

ClinVar数据库里有很多这样的例子：某个错义突变的ΔΔG预测值是破坏性的（ΔΔG > 2 kcal/mol），但临床注释是良性的（Benign）。原因可能是这个蛋白互作本身在细胞环境中不是必需的，或者有代偿机制。

所以，点突变预测蛋白互作作为致病性评估的一个维度，需要和其他证据（序列保守性、结构可及性、人群频率、功能实验）整合起来，才能给出可靠的结论。在科研学术网首页上能看到更多关于计算突变分析和蛋白互作预测的工程化方案。