2023年1月,华中科技大学生命学院系统生物学与生物信息学系宁康教授团队,以华中科技大学为唯一单位在国际权威学术期刊《生物信息学简报》(Briefings in Bioinformatics)发表题为“Tracing human life trajectory using gut microbial communities by context-aware deep learning”的研究论文,提出一个基于肠道微生物群落数据使用迁移学习实现的人体健康轨迹追踪框架,初步解决了年龄依赖性的人体健康状态诊断问题。华中科技大学生命学院强基计划登峰班1901班本科生张皓鸿和学院2021届本科毕业生冲辉为论文共同第一作者,宁康教授为论文的通讯作者。
人类肠道微生物群落在不同的生命阶段以及不同健康状况的人体中的组成各不相同。这种动态的模式在很大程度上取决于环境和时序因素,例如年龄增长、疾病进展以及饮食习惯变化。因此,人类肠道微生物组的时序变化可以反映追溯宿主的生活轨迹。
然而,目前肠道微生物组的时序研究存在着三个主要的问题:(1)时序分析方法缺乏情景适应性,在面对新的应用情景时需要重新建模,费时且无法利用已有模型的知识;(2)由于肠道微生物组的时序数据的采样难度大,难以提供充足的训练数据;(3)不同的队列之间,以及不同的采样时间点之间,存在很大的批次效应。针对这些问题,作者开发了microDELTA,一个基于肠道微生物群落数据使用迁移学习实现的人体健康轨迹追踪框架。
microDELTA的原理图和案例图
microDELTA的工作流程由模型构建和模型适应两大组成部分组成。首先,基于公开数据集构建基本模型(Base model),该数据集包含来自代表19种疾病以及健康对照的生13,642个人类肠道微生物群落样本。其次,采用迁移学习方法为不同环境下的生活轨迹构建迁移模型。在这之中,迁移步骤使得能够使用基于近数百万个关于肠道微生物群落样本的现有知识,用于特定背景下的人体健康轨迹追踪。作者使用这一工具分析了来自一个人一生不同阶段的不同时序事件,并与传统的随机森林与神经网络方法进行了对比。
作者首先将microDELTA用于一个婴儿数据集进行年龄预测。结果表明在各个年龄分组中,microDELTA构建的迁移模型相较于独立神经网络模型有着更高的准确性。这些结果揭示了婴儿发育过程中肠道微生物组的动态变化,也体现了microDELTA的情景适应性,可用于婴幼儿早期发育的健康监测。其次,作者将microDETLA用于一个由10位健康成人旅行者组成的数据集进行了宿主旅行轨迹的追踪。结果显示microDETLA不但可以预测其肠道菌群时序变化趋势,还可以捕捉这一过程中的特例。再次,作者将microDELTA用于一个由成年非洲哈扎人组成的数据集进行了宿主所处季节变化的追踪,由于这个数据集所含样本较少,神经网络方法显示出明显的过拟合现象,但microDELTA仍能很好地区分宿主所处的干湿两季,且结果呈现为一条随时间变化的平滑轨迹。最后,作者将microDELTA用于一个由来自四个地区(中国四川,中国江苏,美国,意大利)的年轻人与老年人组成的数据集,探究衰老与肠道微生物组的关系。由于该数据集来自多个不同的地域,存在很强的批次效应。不同于传统的风范,microDELTA方法能够在一定程度上提升区分能力。
综上所述,作者利用microDELTA这种基于人类肠道微生物的生命轨迹迁移学习方法分析了一系列跨越人类生命不同阶段的代表性事件,从婴儿到成人再到老年人,展示了人类肠道群落在人类生命周期中处于不同状态的不同动态模式。这些结果也表明,迁移学习方法能够针对缺乏上下文意识,数据不足以及在不同上下文中存在批量效应的情况下生成准确灵活的模型,可以准确追踪人类肠道微生物群落的特定生命轨迹,较为完善的解决了年龄依赖性的人体健康状态诊断问题,对未来的健康监测与临床实践有着重要意义。
近年来,华中科技大学生命学院宁康教授团队在生物信息学交叉学科领域进行不断探索,针对人体微生物组学大数据,发展了一系列人工智能挖掘方法,并成功应用于肠道疾病、类风湿性关节炎、非传染性慢性疾病、人体癌症等多种疾病的前期诊断和复发监控,相关论文发表于PNAS、Gut、Annals of the Rheumatic Diseases、Genome Biology、Genome Medicine、Microbiome、Briefings in Bioinformatics等医学、生物学和生物信息学领域国际顶尖期刊,相关方法和模型,已经在合作医疗机构进行临床测试。该研究得到科技部国家重点研发计划(No. 2018YFC0910502),国家自然科学基金(Nos. 32071465, 31871334, 31671374)等的资助。
此次科研成果是宁康教授团队在学院探索本科生拔尖创新人才培养中的一次成功实践,是贯彻落实“一生一方案”本硕博贯通培养教育教学理念中的一次成功尝试。生命学院对于包括强基计划登峰班本科生在内的全体本科生广泛开展大学生创新创业训练,率先实现“双创双向百分百”。学院本科生通过各级各类大创项目训练和国内外顶级大学生双创赛事和学科竞赛得到充分锻炼,每年百余人获得国际国内竞赛奖项,十余位本科生取得较高水平的科研成果。强基计划登峰班学生大学期间可自主选择专业方向,加入科研团队,与课题组导师形成紧密的师生双创共同体,在大四阶段提前先修研究生阶段课程,并在导师长期指导下持续在其感兴趣的研究方向开展科研探索。
文章信息:
Haohong Zhang, Hui Chong, Qingyang Yu, Yuguo Zha, Mingyue Cheng, Kang Ning*. Tracing human life trajectory using gut microbial communities by context-aware deep learning. Briefings in Bioinformatics, 2023, bbac629.
文章链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac629/6984796