siRNA(小干扰RNA)的作用机制是RNA干扰——21-23个核苷酸的双链RNA引导RISC复合体到靶标mRNA上,通过序列互补配对实现mRNA的降解。理论上,任何一段与靶标mRNA互补的21nt序列都可以设计成siRNA,但实际上,不同序列的沉默效率可以差两个数量级以上。siRNA序列高通量筛选就是要在几百个候选序列中找到那些沉默效率高、off-target风险低、免疫刺激性小的”优等生”。

siRNA设计的第一个筛选维度是序列偏好性。十几年的积累已经总结出了成熟的siRNA序列规则:
这些规则可以快速筛掉大部分不合格序列。以一个1000 nt的mRNA为例,理论上有约980个可能的21nt靶位点(每两个连续位点重叠19nt),经过序列规则筛选后通常剩余约200-300个候选位点。
siRNA双链的两端解链自由能有差异——RISC复合体偏好解链从5’端较不稳定的那条链开始。这条链(反义链/guide strand)的5’端A/U含量越高、热力学稳定性越低,就越容易被RISC优先装载。
不对称规则的表达方式是:反义链5’端的解链自由能(ΔG_5’)应低于正义链5’端的ΔG(ΔΔG>0)。具体计算方法是用最近邻模型估算双链两端的解链自由能差。
团队在一个针对BCL-2基因的siRNA筛选项目中,用不对称规则对300个候选位点做了二次筛选。筛选标准是ΔΔG>1.5 kcal/mol,筛完后剩余约80个候选序列。
siRNA的off-target效应是一个必须认真对待的问题——siRNA的种子区(反义链2-8位核苷酸)如果与其他非靶标mRNA的3’UTR区域有6-7个碱基的连续匹配,就会产生类似于miRNA的翻译抑制效应,导致非靶标基因的表达被意外下调。
计算评估off-target的方法是:把每个候选siRNA的种子区序列(6-8 nt)在人类转录组的3’UTR数据库中做全库BLAST搜索,统计匹配位点数量。如果一个siRNA的种子区在超过10个非靶标基因中找到完美匹配,就标记为高风险。
BCL-2项目中,80个候选序列里有15个因为off-target风险过高被排除。剩余65个序列进入下一轮评分。
经过序列规则、热力学不对称和off-target三轮筛选后,剩余的候选序列需要综合评分来排序。评分模型通常包含以下维度(各权重可根据项目需求调整):
BCL-2项目最终从65个候选中推荐了top-10序列,交由合作方合成并进行细胞水平的沉默效率测试。实测结果显示,top-3序列的沉默效率均在80%以上,最高达到92%——计算筛选的命中率显著优于随机选择(随机选择的沉默效率通常只有10-30%)。
siRNA序列高通量筛选是分子动力学延伸方向上计算辅助药物设计的典型应用。它不需要复杂的MD模拟或量子化学计算,但需要对RNA生物学、热力学和生物信息学的交叉理解。更多核酸药物计算设计的信息,可参阅科研学术网首页。
全原子分子动力学模拟原理:从力场参数到轨迹分析的完整链条
蛋白质-配体结合自由能的MM/PBSA计算中采样不足如何影响结果
聚合物玻璃化转变温度的分子动力学模拟——Tg计算中五个容易忽略的收敛问题
高斯Anharmonic计算:为什么谐振近似会误导你
Gaussian频率计算:振动分析与热化学数据的提取方法
蛋白配体分子动力学模拟:从对接结果到结合稳定性的验证
量子化学模拟计算:方法选择与计算精度的平衡逻辑
小分子动力学模拟:溶剂效应与构象采样的计算策略
高分子动力学模拟:链长、温度和缠结——三个变量交织成Tg和扩散系数的十度偏差
LAMMPS计算结合能:聚合物-纳米填料界面的结合能,从拔出模拟到PMF,力场精度决定你拉出来的是多少
LAMMPS粗粒化建模:把几万个原子缩减到几百个珠子,精度不是白送的
材料拉伸模拟计算:从弹性段到颈缩失稳,有限元不是把曲线跑出来就算完
纳米流体在受限空间中的输运行为模拟——从体相到纳米通道,水的扩散系数怎么变了
核酸结构的分子动力学模拟:从双螺旋到配体结合的动态路径
石墨烯力学性能的分子动力学模拟:周期性边界与自由边界对断裂行为的系统性影响
溶液环境中蛋白质构象变化的分子动力学模拟:显式溶剂与隐式溶剂模型在构象采样中的权衡
siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程
污染扩散模拟计算:一个化工园区大气扩散项目的完整复盘
VASP计算中的磁性材料模拟:从自旋极化到磁相变
VASP计算在电池材料研究中的深度应用
表面科学模拟从清理表面到反应机理
VASP计算磁各向异性:自旋轨道耦合、磁矩取向和k点的三角关系——SOC开关不是越早开越好
多肽的分子动力学模拟:在溶剂、离子和膜环境中跑一条多肽链,水盒子里的每一颗钠离子都在改变构象分布
金属原子间键能计算:从结合能到解离能的路径选择