近日,国家烟草基因研究中心作为第一单位完成的研究论文“PCMDB: a curated and comprehensive resource of plant cell markers”(第一作者:基因中心金静静、卢鹏;通讯作者:基因中心曹培健)在国际生物学权威期刊《Nucleic Acids Research》(中科院分区1区Top期刊,影响因子16.97)在线发表。这是基因中心生物信息学学术论文影响因子继2020年首次突破10分后的又一全新跨越,再次创下行业作为第一单位发表论文影响因子的最高水平。
单细胞转录组测序技术的蓬勃发展,推动生物学研究进入单细胞水平。单细胞测序数据分析的关键一步是利用细胞标记基因对细胞类型进行注释,但目前植物细胞标记基因分散在大量研究文献中,在一定程度上限制了了其在植物单细胞转录组分析中的应用。
为创造性地开发一套科学系统、精准实用的植物细胞标记数据库,基因中心基于三个数据来源(实验验证、基于单细胞测序数据、基于高通量转录组数据),针对约13万篇文献开展了大数据分析和人工注释,挖掘了烟草、拟南芥、水稻、玉米、大豆、番茄等6个模式植物的81117个植物细胞标记基因,覆盖了22个组织的263种细胞类型。基因中心自主开发的PCMDB数据库可实现植物细胞标记基因位置、序列、表达等信息的多维度查询和可视化显示。5个搜索引擎以及eFP Browser、Bar、t-SNE、U-MAP等展示分析工具,为数据库提供了强大的数据分析能力。针对用户自有单细胞测序数据,PCMDB部署了SCSA和SignleR分析工具,可实现在线细胞类型鉴定。此外,针对目前数据库尚未覆盖的其他67种植物,PCMDB提供了基于序列相似性鉴定的候选细胞标记基因。作为一站式数据库,PCMDB将为植物单细胞测序研究提供精准、全面的大数据分析平台支撑。
PCMDB数据库分析和展示工具
近年来,基因中心扎实落实郑州烟草研究院要求,积极谋划布局,产出了一批具有较高学术水平的科研成果。今年以来,作为第一单位,基因中心已发表影响因子在10分以上的论文2篇。
重庆中烟,以新质生产力推动企业高质量发展