截止2022年1月20日,研究团队使用来自全球禽流感数据共享数据库(GISAID)中可用的6,466,300个SARS-CoV-2基因组数据(数据包含3,000个集群,来源于1,544个PANGO谱系和2,904个非同义突变),对PyR0模型进行了拟合分析。通过对统计分析框架的优化和数据的整理,该模型评估出目前常见的SARS-CoV-2谱系的适应性(图1)。模型分析结果显示,所有的病毒谱系都随时间呈上升趋势,适应性更高的优势谱系会影响和中断之前的优势谱系。此外,一些PANGO谱系在某些地区具有多个连续的峰值。研究团队通过算法将1,544个PANGO谱系划分成3,000个更精细的集群,发现不同PANGO亚谱系具有显著的异质性。
研究团队通过PyR0模型准确推算出Omicron BA.2具有迄今为止最高的适应性(图1),比最早出现的原始毒株(谱系A)高出8.9倍,并准确预示了该毒株将在其流行的国家/地区取代其他毒株,成为主导毒株。同样,PyR0模型还在2020年11月底之前识别出阿尔法毒株(B.1.1.7)的竞争优势,这比世界卫生组织将其列为“值得关注的变异株(VoC)”提前了一个月。综上所述,PyR0模型能提供早期预警并帮助识别VoC,这证实了其对公共卫生的实用性,凸显出快速共享基因组数据的价值。
进一步,研究团队分析了单个氨基酸突变对于病毒适应性的影响。通过对SARS-CoV-2中的基因突变与病毒适应性的相关程度进行分析,确定了2,904个氨基酸突变,并依据显著性对其进行了排序。已知SARS-CoV-2基因组编码四种结构蛋白,即刺突蛋白(spike,S)、包膜蛋白(envelope,E)、膜蛋白(membrane,M)和核衣壳蛋白(nucleocapsid,N)。研究团队发现在S基因、N基因和ORF1多蛋白基因(ORF1a、ORF1b)中,与病毒适应性相关的基因突变较多。
在S基因中,研究团队确认了三个增强病毒适应性的突变热点,每个热点都在一个确定的功能区域内:N末端结构域、受体结合结构域(RBD)和furin蛋白酶切位点。
通过可视化建模,研究团队分析了S蛋白、核衣壳N端结构域、聚合酶和两种蛋白酶原子结构中得分最高的突变。结果显示,S基因中许多顶级突变发生在与ACE2受体直接接触的RBD中,包括K417N/T和E484K。另外两个顶级突变(T478K和S477N)发生在与S-ACE2界面相邻的flexible loop中。
全文链接:
https://mp.weixin.qq.com/s/0Y8MUXKGx0V2yRYjBNxyjw【 在 purplesoul 的大作中提到: 】
: 近日,美国麻省理工学院联合哈佛大学博德研究所研究团队在Science上发表了题为“Analysis of 6.4 million SARS-CoV-2 genomes identifies mutations associated with fitness”的文章。研究团队开发了一种名为“PyR0”
: ..................
发自「今日水木 on Redmi K30」
--
FROM 183.6.141.*