手机版
           

siRNA序列高通量筛选:从靶标mRNA到有效siRNA序列的计算设计流程

发布时间:2026-06-15   来源:科研学术网    
字号:

siRNA(小干扰RNA)的作用机制是RNA干扰——21-23个核苷酸的双链RNA引导RISC复合体到靶标mRNA上,通过序列互补配对实现mRNA的降解。理论上,任何一段与靶标mRNA互补的21nt序列都可以设计成siRNA,但实际上,不同序列的沉默效率可以差两个数量级以上。siRNA序列高通量筛选就是要在几百个候选序列中找到那些沉默效率高、off-target风险低、免疫刺激性小的”优等生”。

位点选择:序列偏好规则

siRNA设计的第一个筛选维度是序列偏好性。十几年的积累已经总结出了成熟的siRNA序列规则:

  • GC含量在30-52%之间——太高(>60%)会导致siRNA双链过于稳定,RISC复合体的解链效率下降;太低(<30%)会导致双链不稳定,容易降解。
  • 避免连续4个以上的相同碱基(如AAAA、GGGG)——这些序列可能形成异常的二级结构。
  • 3’端(反义链)偏好A/U碱基——有利于RISC的正确链选择。
  • 5’端(反义链)偏好G/C碱基——有利于siRNA双链的稳定性。

这些规则可以快速筛掉大部分不合格序列。以一个1000 nt的mRNA为例,理论上有约980个可能的21nt靶位点(每两个连续位点重叠19nt),经过序列规则筛选后通常剩余约200-300个候选位点。

热力学稳定性:不对称规则

siRNA双链的两端解链自由能有差异——RISC复合体偏好解链从5’端较不稳定的那条链开始。这条链(反义链/guide strand)的5’端A/U含量越高、热力学稳定性越低,就越容易被RISC优先装载。

不对称规则的表达方式是:反义链5’端的解链自由能(ΔG_5’)应低于正义链5’端的ΔG(ΔΔG>0)。具体计算方法是用最近邻模型估算双链两端的解链自由能差。

团队在一个针对BCL-2基因的siRNA筛选项目中,用不对称规则对300个候选位点做了二次筛选。筛选标准是ΔΔG>1.5 kcal/mol,筛完后剩余约80个候选序列。

Off-target评估:种子区匹配的系统性排查

siRNA的off-target效应是一个必须认真对待的问题——siRNA的种子区(反义链2-8位核苷酸)如果与其他非靶标mRNA的3’UTR区域有6-7个碱基的连续匹配,就会产生类似于miRNA的翻译抑制效应,导致非靶标基因的表达被意外下调。

计算评估off-target的方法是:把每个候选siRNA的种子区序列(6-8 nt)在人类转录组的3’UTR数据库中做全库BLAST搜索,统计匹配位点数量。如果一个siRNA的种子区在超过10个非靶标基因中找到完美匹配,就标记为高风险。

BCL-2项目中,80个候选序列里有15个因为off-target风险过高被排除。剩余65个序列进入下一轮评分。

综合评分和最终推荐

经过序列规则、热力学不对称和off-target三轮筛选后,剩余的候选序列需要综合评分来排序。评分模型通常包含以下维度(各权重可根据项目需求调整):

  • 序列偏好性得分(基于上述规则是否全部满足)
  • 热力学不对称性得分(ΔΔG越大越好)
  • Off-target风险得分(匹配位点越少越好)
  • 二级结构可及性(靶位点在mRNA二级结构中的暴露程度——用RNAfold预测)

BCL-2项目最终从65个候选中推荐了top-10序列,交由合作方合成并进行细胞水平的沉默效率测试。实测结果显示,top-3序列的沉默效率均在80%以上,最高达到92%——计算筛选的命中率显著优于随机选择(随机选择的沉默效率通常只有10-30%)。

siRNA序列高通量筛选是分子动力学延伸方向上计算辅助药物设计的典型应用。它不需要复杂的MD模拟或量子化学计算,但需要对RNA生物学、热力学和生物信息学的交叉理解。更多核酸药物计算设计的信息,可参阅科研学术网首页

图说天下

×
gromacs计算
lammps计算
VASP计算
分子对接
分子自组装