做核酸分子动力学模拟的人,第一次建体系的时候大概率会被离子中和这一步卡住。DNA在溶液里浑身带负电,磷酸骨架每两个核苷酸就贡献一个负电荷,一条12碱基的双链DNA净电荷轻易超过-20e。直接扔进水盒子里跑MD,系统撑不过100 ps——静电排斥让双链直接散架。
这不是你的模拟设置错了,是力场在提醒你:真实溶液里这些负电荷是被抗衡离子屏蔽的,你的模拟盒子也必须把它们加进去。

核酸力场的水比蛋白质力场还深。AMBER的DNA力场从ff94一路迭代到最新的OL15,每个版本都在修正糖苷键二面角的偏好。CHARMM的DNA力场(CHARMM36)对A-form和B-form的平衡有更好的描述。
实际选型有个简单的判据:如果你的模拟里DNA主要是标准B-form双链,AMBER OL15是目前最稳的选择;如果涉及非标准构象(Z-DNA、三链、G-四链体),CHARMM36的覆盖度更好。
RNA的情况更复杂。RNA的构象空间比DNA大得多,碱基堆积和氢键模式也更丰富。AMBER的RNA力场(OL3)是目前最广泛验证的,但仍有已知的偏差——比如U-turn构象的能量评估偏高,需要手动修正 glycosidic torsion 的参数。
第一步:结构准备。从PDB下载的结构,先检查有没有缺失的碱基或修饰。很多晶体结构里只给了电子密度可见的碱基,末端几个碱基密度弱,模型里直接砍掉了。MD模拟里缺碱基会导致局部结构不稳,需要先用建模工具(LEaP for AMBER,psfgen for CHARMM)补全。
第二步:溶剂化和离子中和。SPC/E和TIP3P水模型都能用,TIP3P和AMBER力场配套更好。离子中和有个细节:不能只加够电中性的Na+或Cl-,还要加够生理盐浓度(~150 mM NaCl)。只做电中性中和,DNA的沟渠里离子分布不真实,会影响后续配体结合的自由能计算精度。
第三步:能量最小化。先做500-1000步的最陡下降,再做共轭梯度,直到最大力小于1000 kJ/mol·nm。如果体系里有晶体水,最小化的步数要加倍,晶体水的位置往往和MD平衡结构有偏差,需要慢慢弛豫。
第四步:平衡。NVT平衡先把温度拉到指定值(通常300K),用Langevin恒温器或者v-rescale。NPT平衡再拉压强到1 atm。核酸体系建议各做500 ps,步长2 fs(用constraint的话可以4 fs)。
RMSD和RMSF:RMSD看整个结构是否稳定,核酸的RMSD通常在2-4 Å之间波动,超过6 Å就要怀疑结构是否散了。RMSF看哪个碱基柔性大,通常末端碱基的RMSF高,结合口袋里的碱基如果RMSF异常高,说明这个位点构象不稳定。
氢键分析:核酸的氢键分两种——Watson-Crick配对氢键和沟渠里的水分子介导氢键。GROMACS的gmx hbond可以直接算,但更细的分析需要自己写脚本:每个碱基对的氢键数目随时间变化,能告诉你配体结合是否破坏了局部的氢键网络。
Minor groove宽度:这个量对配体识别非常关键。AT-rich区域的minor groove天然比较窄,小分子如果锚定在这里,通常会和沟底的一串水分子形成有序结构。计算minor groove宽度可以用mdanalysis或cpptraj,沿着螺旋轴扫描每个碱基步的P-P距离。
配体结合的ΔG,最常用MM-PBSA近似。GROMACS里有gmx_MMPBSA工具,AMBER里有全套的mm_pbsa.pl和MMPBSA.py。
MM-PBSA的好处是快,从MD轨迹里取样几百帧就能给出结合自由能的近似值。缺点是误差大(通常3-5 kcal/mol),而且对熵的贡献估算粗糙。如果要做决策级的结合能比较,需要做热力学积分(Thermodynamic Integration)或者FEP,算起来贵10-100倍,但精度可信得多。
坑一:模拟时间不够。核酸的构象变化时间尺度在微秒到毫秒级,100 ns的模拟往往只采样了局部构象。如果关心的是构象转变(比如DNA弯曲、配体诱导的构象变化),至少需要微秒级采样,或者用加速采样方法(Gaussian accelerated MD,GaMD)。
坑二:力场漂移。有些AMBER老版本力场(ff99)对DNA的A-form有系统偏差,会在模拟里把B-form DNA慢慢扭成A-form。确认你用的力场版本,OL15和bsc1是这个领域目前最稳的选择。
坑三:忽略离子特异性。Na+和K+在核酸体系里的表现不一样,K+更容易稳定G-四链体。如果用错了抗衡离子,G-四链体的拓扑结构在模拟里可能维持不住,会直接解折叠。
MD模拟最适合回答动态问题:配体结合和解离的路径是什么?哪个碱基的突变会破坏结构稳定性?药物分子在沟渠里是怎么调整的?
不适合回答的问题:绝对的亲和力度数(用实验测,MD只能给相对比较);突变后的折叠自由能变化(用专用的ΔΔG预测工具,比如Rosetta);大于毫秒的时间尺度事件(用Markov State Model降维,但建模成本很高)。
核酸分子动力学模拟的价值,不在于算出某个精确数值,而在于让你看到晶体结构里看不到的那个维度——时间。结构给了你一张静态的地图,MD告诉你这张地图上哪些路是通的、哪些是死的。
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
量子化学模拟计算:方法选择与计算精度的平衡逻辑
小分子动力学模拟:溶剂效应与构象采样的计算策略
高斯分子动力学模拟:BOMD与CPMD方法的选择和能垒计算实践
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
纳米流体在受限空间中的输运行为模拟——从体相到纳米通道,水的扩散系数怎么变了
核酸结构的分子动力学模拟:从双螺旋到配体结合的动态路径
石墨烯力学性能的分子动力学模拟:周期性边界与自由边界对断裂行为的系统性影响
溶液环境中蛋白质构象变化的分子动力学模拟:显式溶剂与隐式溶剂模型在构象采样中的权衡
VASP计算磁各向异性:自旋轨道耦合、磁矩取向和k点的三角关系——SOC开关不是越早开越好
多肽的分子动力学模拟:在溶剂、离子和膜环境中跑一条多肽链,水盒子里的每一颗钠离子都在改变构象分布
金属原子间键能计算:从结合能到解离能的路径选择
吸附能计算中的范德华修正方案选择:DFT-D3、DFT-D3(BJ)与TS的定量对比
VASP能带计算中的k点收敛性测试:从粗网格到精确结果的路径
VASP功函数怎么计算:静电势方法与参数设置详解
VASP分子动力学模拟:AIMD计算的设置逻辑与注意事项
VASP计算分子能量:从孤立分子建模到BSSE校正的全流程