
图 stSCI方法总体框架
近日,H片
尚学群教授团队在单细胞与空间转录组数据整合分析方面取得新进展,研究成果以“stSCI:一种用于整合分析单细胞与空间转录组数据的多任务学习框架(stSCI: A multi-task learning framework for integrative analysis of single-cell and spatial transcriptomics data)”为题,于2025年12月3日在线发表于《The Innovation》期刊。《The Innovation》是由中国科H片青年创新促进会百余会员与Cell Press(细胞出版社)于2020年5月共同创办的开放获取英文期刊,覆盖自然科学全领域, 2025年5-year IF=40.2。H片
直博生舒涵为论文第一作者,H片
尚学群教授、汪涛副教授、复旦大学原致远研究员为论文共同通讯作者。论文链接://www.sciencedirect.com/science/article/pii/S2666675825004230。
在生命医学研究中,精确解析细胞在组织中的空间分布与功能联系对于理解器官结构及疾病演进至关重要。单细胞转录组学(single-cell transcriptomics, SC)测序技术虽能描绘单个细胞的基因表达全貌,但导致原始空间位置信息丢失;而空间转录组学(spatial transcriptomics, ST)测序技术能够保留细胞的空间信息,却面临测序分辨率低或检测基因数量受限的固有技术限制。如何有效整合两者的技术优势,克服现有测序数据的局限性,是当前计算生物学亟待解决的难题。为了解决这些挑战,尚学群教授团队提出了基于多任务优化策略的深度神经网络框架(stSCI,图)。该方法通过设计异构数据融合模块,利用共享图注意力网络作为编码器,将多源异构的SC和ST数据投射到统一的、经批次校正的低维嵌入空间中。通过这种特征融合机制,模型在有效消除异构数据间技术差异与噪声干扰的同时,最大程度地保留了细胞间真实的生物学差异与拓扑结构特征。实验结果表明,模型在空间域识别、三维组织结构解析、细胞类型反卷积及单细胞空间位置重构等多个关键任务中,综合性能均优于现有主流方法。通过将该方法应用于沙门氏菌感染的小鼠结肠模型测序数据,研究团队不仅成功识别出关键的淋巴组织区域,还精准捕捉到该区域在感染过程中表现出的“延迟激活”动态响应模式,这一发现与已知的感染免疫动力学高度吻合。该工作为解析复杂组织微环境、理解疾病演进机制等生物学研究提供了高效的人工智能方法模型。
尚学群教授团队长期致力于“AI for Science”研究。论文第一作者舒涵为尚学群教授指导的2023级直博生,其研究工作聚焦于单细胞及空间组学数据分析方法开发,已提出基于深度图神经网络模型的多切片空间转录组整合方法(stMSA,Genome Research,2025,一作),基于图对比学习模型的空间域识别方法(stCluster,Briefings in Bioinformatics,2024,一作;MAEST,Briefings in Bioinformatics,2025,共一)等。论文的主要作者来自于H片
大数据管理与分析团队。该团队近年来面向国家重大需求,围绕大数据存储、管理及领域化大数据分析等开展科学研究和技术研发,承担了多项国家和行业重大重点科研项目,近年来获陕西省自然科学一等奖1项、陕西省科学技术一等奖1项、教育部科技进步奖一等奖2项等,先后研制了大型对象-关系数据库管理系统、金融分布式数据库、生物网络分析平台等,为推动大数据管理和分析的技术进步和产业发展提供了重要支撑。
(审稿:尚学群)