人类基因组是由约30 亿个字符组成的遗传“密码本”,决定细胞和个体发育的命运。该“密码本”的98%字符是具有“暗物质”之称的非编码序列,而且约80%能够转录成为 “暗物质”核糖核酸(RNA)1。这些“暗物质”RNA大多数都是不具有帽子结构的RNA(noncapped RNA,napRNA),且普遍作为非编码RNA(ncRNA)在基因表达调控和疾病发生发展中扮演了重要角色。然而,目前的研究主要集中于具有帽子结构的RNA(capped RNA,capRNA)2和短的napRNA3,人们对长的napRNA(序列长度≥100核苷酸)的种类组成、结构、生物生成及功能机制都知之甚少。
2024年3月18日,中山大学生命科学学院杨建华/屈良鹄/李斌团队在Nature Communications期刊上发表了题为“NAP-seq reveals multiple classes of structured noncoding RNAs with regulatory functions”的研究论文。该研究开发了NAP-seq测序技术和napSeeker算法,在单碱基精度鉴定具有各种末端修饰的napRNA的全长序列,发现多种新类型napRNA和成百上千的新结构型ncRNA,解析它们在不同的细胞刺激和骨骼肌分化阶段的动态变化图谱,揭示了napRNA的表达、结构特征、生物生成特性及其在细胞活动中的功能机制,为在各种生物中发现新的结构型napRNA及其功能机制研究提供了新方法和新思路。
由于napRNA一般不具有polyA尾,因此传统的利用PolyA富集的RNA-seq方法无法鉴定napRNA。即使是测定total RNA的RNA-seq方法由于通过随机六聚体引物对片段化的RNA进行逆转录(RT)产生cDNA,也导致无法鉴定全长的napRNA序列和不能用于分类napRNA及不能用于确定其二级结构等等。虽然通过小RNA测序(sRNA-seq)技术测定短napRNA发现了一些功能性小非编码RNA(如:miRNA,piRNA),然而几乎所有涉及sRNA-seq的研究都集中在小于50 核苷酸的napRNA,而不是各种长度和不同末端修饰的所有napRNA,尤其是长链(≥100 核苷酸)和结构复杂的napRNA。针对这些问题,研究团队开发一种捕获长链napRNA的全长序列的新测序方法—NAP-seq,具体的简化步骤包括:对RNA样品进行除杂、T4 PNK修复RNA末端、长度筛选、自主设计的3’端接头和5’端接头连接、非目标RNA的去除、巢式RT-PCR与预扩增、可选的片段化、在两种不同的测序平台(Oxford Nanopore三代单分子测序平台和Illumina二代测序平台)测序和开发新算法鉴定napRNA等步骤。
--
FROM 59.41.66.*