|
中科院昆明动物研究所马占山团队最近发布了两项生物信息技术(算法和软件),这两项技术可用于精准诊断菌群相关疾病指标的研发,也可以用于其它环境微生物群系监测的研究。其技术报告近日分别发表在学术期刊 Microbial Ecology 【“The P/N (Positive-to-Negative Links) Ratio in Complex Networks—A Promising In Silico Biomarker for Detecting Changes Occurring in the Human Microbiome” 】 和 Scientific Reports 【Trios—promising in silico biomarkers for differentiating the effect of disease on the human microbiome network】。两项技术的国家发明专利已进入实质审核阶段。
现今仍然有一类疾病(例如:乳腺炎、BV、IBD、肥胖、牙周炎等),由于对其发病机制缺乏完整的了解,而使得临床诊断存在诸多障碍。它们具有一些共同特征:用一通俗说法,就是与人体“菌群失调(Dysbiosis)”密切关联,类似于自然生态系统(例如: 森林、湖泊)失衡可能会引发生态灾害。 “人体菌群”或者更准确的应该称作“人体微生物群系(Microbiome)” 是指分布在人体体内(肠道、生殖道、呼吸道、口腔)和体表(皮肤)的大量微生物(包括细菌、病毒、噬菌体、质粒等)。如果单指细菌,则“菌群”这一传统使用名词可以继续使用。如果包括了病毒、噬菌体、质粒等,则“微生物群系”应该是更加恰当的名词。 另目前中文翻译中大量使用了“微生物组”一词,但如果考虑与传统上类似的“(动植物)区系(Biomes)”一词使用,以及与“微生物宏基因组(Metagenomics)”区别,则“微生物群系(Microbiome)”显然是较为恰当的翻译。 “组”(Omics)这一在生物信息学时代存在被滥用风险的词汇,应该为分子水平(基因、宏基因,蛋白质等)保留,而将“区系”(Biome)和“群系”(Microbiome)用于以生命个体或个体以上单元(例如群落)的研究中。而且中文其它生物“组”学也都对应英文“Omics”, 故将“biome”译成“组”也就略显牵强,而传统上已经使用了近一个世纪的“群、系”则似乎更为合理。 由于目前绝大多数研究仍然集中在对细菌菌群的研究,故下文中没有严格区分“微生物群系”和“菌群”。
科学家近年来研究发现,人体仅肠道中细菌的数量便超过了人体体细胞的数量,而这些细菌所携带的基因更是超过我们人类自身基因数量的100倍之多。如果将我们人体比喻为另一个“地球”,人体微生物群系就像我们所居住的地球上所分布的各种生物群系。 换句话说,人体微生物群系是一个由成千上万微生物物种组成的动态、开放生态系统。与地球上其它生态系统(群系)类似,人体微生物群系中对人体有害的种类其实非常罕见。事实上,他们中的绝大多数是我们人类的朋友。也正如生态系统破坏可能引发生态灾难类似,人体微生物群系(菌群)失调可能会严重影响我们健康、甚至引发疾病。 事实上,人类自进入工业化时代以来, 现代化的生活方式(特别是饮食习惯的改变)可能为人类微生物群系带来了深刻的变化,这些改变很大程度上是不利于健康的。肥胖、糖尿病、痛风、IBD等免疫代谢相关疾病的高发构成了一张可能仍在不断加长的疾病清单。许多科学家将这类疾病称之为菌群相关疾病(Microbiome Associated Diseases:MAD)。
然而,针对MAD的大规模、深入研究仅仅是过去10年间的事。由于受到菌群检测技术的限制,长期以来对此类疾病病因的研究往往迷失了方向;其中一些疾病的病因至今任然未知。 例如,有些疾病被认为是感染性疾病(例如乳腺炎、BV、牙周炎),但医学界却找不出确切的病原菌。又例如,有些疾病被笼统归之为代谢性疾病(例如肥胖、IBD),但确切的发病机制往往并不清楚。基因测序技术、特别是宏基因测序技术对MAD疾病的研究带来了革命性的突破。 在基因测序技术发明之前,人类只能依赖于菌群培养技术检测体内微生物,而采用培养方法所能检测到的微生物可能不足人体菌群种类的百分之一。正是10年前美国“人体微生物群系研究计划”以及欧盟“人体肠道微生物群系研究计划”等所采用的宏基因组学研究技术将MAD疾病的研究推向了医学前沿。
对于这些研究可能产生的影响, 哈佛大学医学院院长Sydney Burwell教授在2011年预测“10年后我们会发现,医学院现在所教授的内容有一半儿是错的”。六年后的今天,Burwell教授的预测可以讲基本正确,但对于MAD疾病的研究仍然是方兴未艾。 特别是对寻找MAD疾病“病原”和诊断标准的研究仍然鲜有重大突破。巨大的挑战例如:与传统感染性疾病不同,通常不存在单一的“敌人”(病原菌)。即使存在“敌人”,敌人也非常“狡猾”,他们可能形成机会性的邪恶联盟。马占山团队2015年首次揭示的乳腺炎发病机制就是其实例之一。这些机会性邪恶联盟往往“潜伏”在健康人体菌群内,一旦机体发生有利于他们扩张的环境,则迅速“兴风作浪”。
虽然从人类微生物群系计划一开始,科学家就已近认识到了MAD疾病、乃至微生物群系研究本质上是一生态学问题,并从以研究动植物为对象的宏观生态学汲取了大量理论、方法和技术。人体微生物群系生态学(也成医学生态学)被认为是进入了黄金时代;但这些进展并没有解决MAD疾病的诊断和病因研究中的根本性挑战!例如,几乎所有人体菌群研究都进行多样性分析、和多样性指数计算 。现实中,这些多样性指数对于疾病诊断的意义有限。 据马占山团队与美国Vermont大学一项对多样性指数在健康与疾病样本之间差别的统计分析报告,多样性指数例如 Shannon index、包扩被广泛认为是最优良的多样性指数(Hill Numbers)仅仅在大约1/3 的情形才具有统计学上严格的显著差异。团队更进一步的研究发现,1/3似乎是诸多生态学分析技术难以突破的上限。其中原因可能并不是这些生态学分析技术的问题,更多的可能是菌群生态系统本来就如此!生态系统有相当的稳定性!稳定的菌群生态系统意味着许多生态指标可能也非常稳定,疾病不见得能够对哪些指标产生统计学上显著的影响,自然无法用于诊断疾病。
鉴于生态学分析技术的局限性,科学家对应用复杂网络科学研究菌群生态网络也展开了大量研究。 虽然网络科学在过去10多年间被认为是许多自然科学和社会科学领域最重要的技术之一,然而在MAD疾病诊断领域却进展甚微。由于先前所定义的复杂网络特征忽略了菌群网络中特殊节点的作用,以及其相互作用方式;结果是,这些特征要不是在疾病和健康样本之间无显著差别,要不是“七上八下”。 马占山团队制定了如下策略寻找全新的网络特征,包括(1)“承认”代表特殊微生物种类的网络节点(例如,最高丰度物种、最高优势度物种、网络枢纽节点等)可能具备的特殊作用;(2)区分种间相互作用的模式(相生、相克或阴、阳关系);(3)选取尽可能简单的特征。
以上策略有效地揭示了人体微生物群系网络内部相互作用的三条基本原理:其一、物种生来并不平等,特殊物种可能具有特殊的诊断价值;其二、相生相克或阴阳平衡程度应具有重要诊断价值;其三、奥卡姆剃刀原理(以简御繁)。正是基于此三项原理,马占山团队定义了两类生物信息标记(指标)算法。一类是菌群网络中12种三角(基序)关系(trios), 另一类是菌群网络中正负比例。三角关系虽然简单,但往往是决定系统格局和稳定性的重要因素。国际关系中曾经的中美苏“三角关系”可能就是三角关系影响系统格局的例子之一。此次马占山团队定义的12种三角关系应该足以描述影响复杂网络系统格局和稳定性的要素;而正负比例指标显然受到了传统中医阴阳平衡思想的启示。团队通过分析公共数据库中已经发表的菌群相关疾病的研究数据,示范了两项生物信息诊断技术的有效性。当然,新诊断技术的适用性和有效性并非限于所检验过的这些疾病。 事实上, 团队所建立的原理、算法和软件为用户研发其它菌群(微生物群系)相关疾病的个性化精准诊断提供了全套分析和计算技术。据了解,目前尚无其它类似能够用于研发可靠、特异的菌群相关疾病诊断指标的通用技术(算法和软件)。 因此,新技术的发布为菌群相关疾病的精准诊断和其他环境微生物群系监测的研究提供了一项前景良好的核心使能技术。
以上报道所涉及的技术报告可从如下链接获得。
https://link.springer.com/article/10.1007%2Fs00248-017-1079-7
|
|