陈小锋
RakeSamp: 目前最精细的RNA二级结构随机生成软件/算法
2023-2-16 10:25
阅读:1774

RNA分子参与了细胞里多种生化过程,其功能作用由其结构确定;而通常较容易实验得到的仅有RNA分子所包含的碱基(A,U,G,C)序列,并非由这些碱基相互作用形成化学键进而折叠形成的维结构。

在复杂性和准确度上进行折衷,人们对RNA的二级(二维)结构从数学计算和预测的角度进行了大量研究。 

RNA二级结构里,人们识别出可能对其功能起决定作用的子结构,包括:茎区(stack),发夹环(hairpin),凸包(bulge),内环(internal loop),多环(multiloop),外环(exterior loop)等 。下图为一个RNA二级结构的例子:

motif-rna.png

从计算和预测的角度来讲,一方面需要知道有意义的、满足一定性质的可能结构的数量级,另一方面希望有高效的算法可以随机生成一个满足性质的可能结构 

现有技术:不能计算和设计算法随机生成满足多个子结构联合分布的RNA二级结构

进展:我们给出了满足多个子结构联合分布的精确计算公式,并设计出随机生成一个满足该联合分布RNA二级结构的算法。


单从影响因子来讲,这个工作也可以投影响因子更高的杂志;由于其它考量,最后选择发表在国际生物数学学会旗舰期刊 Bulletin of Mathematical Biology 上。论文链接:RNA Secondary Structures with Given Motif Specification: Combinatorics and Algorithms | SpringerLink


合作者: Christian Reidys (弗吉尼亚大学教授), Michael Waterman(南加州大学教授)


展望:该工作可以潜在用于帮助校准自由能模型的子结构能量参数,可以结合机器学习来预测RNA二级结构等等。


RakeSamp 软件和C++语言代码免费发布在GitHub https://github.com/RickyXFChen/RakeSamp.

欢迎大家使用!



转载本文请联系原作者获取授权,同时请注明本文来自陈小锋科学网博客。

链接地址:https://m.sciencenet.cn/blog-3428175-1376479.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?