| 联系我们 | English
 
科研进展
︰  数理科学
︰  化学材料
︰  生命科学
︰  地球科学
︰  工程装备
︰  信息管理
联系方式
中国科学院青年创新促进会
电话:010-82998237
邮箱:qch@mail.iggcas.ac.cn
地址:北京市朝阳区北土城西路19号
当前位置: 首页 > 科研进展 > 生命科学
Genomics Proteomics & Bioinformatics|北京基因组所(国家生物信息中心)青促会会员发布新冠病毒信息库升级版
编辑:青促会   时间:2023/11/15

近日,由中国科学院北京基因组研究所(国家生物信息中心)团队发布了新冠信息库RCoV19的升级版。该研究内容以“RCoV19: A One-stop Hub for SARS-CoV-2 Genome Data Integration, Variant Monitoring, and Risk Pre-warning”为题在国际学术期刊Genomics Proteomics & Bioinformatics 在线发表。

2020年1月22日,北京基因组所(国家生物信息中心)率先公开发布全球第一个新冠病毒综合性信息库RCoV19(原名2019nCoVR),动态整合全球新冠病毒基因组信息,支持全球新冠病毒基因组数据的汇交存储与共享,并提供突变注释信息和演化支系等信息。经过持续更新,RCoV19已发展为国际上规模最大、资源最丰富的新冠病毒研究公共平台。

图片1-1.png


新冠信息库首页


       为更好服务新冠病毒科学研究与基于基因组大数据的监测预警体系建设,研究团队近期对RCoV19进行了升级和完善。新冠肺炎是近一个世纪以来传播范围最广、影响最大的流行病,新冠病毒的基因组序列数量远超其他已知病毒序列的总和。新冠病毒基因组序列来源多标准不统一、数据量大、持续增长,为数据的快速整合分析与挖掘带来了巨大挑战。同时,新冠肺炎疫情仍在全球蔓延,新冠病毒基因组也在不断发生变异和演化。为此,团队发展并建立大规模新冠病毒基因组数据的自动化整合、实时监测和高风险株系预警的方法和平台。

团队研发了新冠病毒基因组数据整合审编的标准规范和处理流程,构建了自动化的数据审编模型和高效的数据共享平台,实现了全球新冠病毒基因组数据收集、去冗余、交叉引用、质量评估、更新入库的一站式自动化操作和分析,提供了实时全面的新冠病毒基因组元信息、全球分布与统计等信息,以及高效的个性化高级检索服务。基于数据库整合的海量数据,团队建立了基因组快速变异解析流程、单倍型网络演化构建算法以及基于机器学习的高风险株系预警模型,开发了新冠病毒传播演化实时监测平台、高风险变异株预警可视化系统和交互式突变谱快速比对功能模块,实现了新冠病毒基因组序列、变异和演化支系的可视化动态监测,高风险变异株的及早预警,以及重要序列或谱系的变异特征规律分析。上述方法平台为基因组大数据驱动的公共卫生安全响应提供了重要的技术和数据支持。此外,人工审编了新冠病毒基因组突变的效应知识,涵盖感染性/传染性、抗体抗性、药物抗性和T细胞表位等,帮助科研人员及防控政策决策人员更好地理解新冠病毒的变异特性,为科学研究及防控决策提供重要的参考。

北京基因组所(国家生物信息中心)李翠萍工程师、马利娜副研究员(第九批会员)、邹东高级工程师和硕士生张荣钦为该文共同第一作者,鲍一明研究员和宋述慧研究员(第七批会员)为该文共同通讯作者。本研究得到了中国科学院青年创新促进会、中国科学院战略重点研究计划、2022年度“一带一路”国际科学组织联盟联合研究合作专项、国家自然科学基金等项目的支持。

 

中国科学院青年创新促进会  版权所有
电话:010-82998237
邮箱:qch@mail.iggcas.ac.cn
地址:北京市朝阳区北土城西路19号,中国科学院地质与地球物理研究所
邮编:100029

 
 

扫码关注
青促会公众号
 
     
Copyright © 2011-2021 www.yicas.cn All Rights Reserved
工信部备案--京ICP备05029136号-6