您当前的位置:首页 > 科研服务> 高通量测序结果分析 > meta genome数据分析
meta genome数据分析
宏基因组
    Meta genomics是一种以环境样品中的微生物群体基因组为研究对象,以测序分析和功能基因筛选为研究手段,研究微生物多样性、 种群结构、进化关系、功能活性、相互协作关系及与环境之间关系的新方法。

    Meta genomics DNA测序是基于新一代测序仪对特定环境微生物种群全基因组DNA研究技术。该方法的特点是在提取微生物种群的DNA后,制备DNA文库进行高通量的测序,可以从整体上对样品群落进行分析,不受微生物是否能培养的限制,而且研究对象从单一基因组到一个基因组集合,也摆脱了对于传统基因组研究的物种限制,开辟了微生物群体基因组学研究的新路径。



***数据分析***
基本数据分析
  • SR2011-01 物种鉴定/注释
  • SR2011-02 进化树分析
  • SR2011-03 物种相对丰度分析
  • SR2011-04 群落丰度差异分析
高级数据分析
  • SR2011-05 疾病标志物分析
  • SR2011-06 基因注释和基因功能丰度差异分析
  • SR2011-07 宏基因组拼接
  • SR2011-08 群落中的菌群共生关系网络

***详细内容***

SR2011-01 物种鉴定/注释
    将测序所得序列与专业数据库进行比对,得出样品中所含物种的信息。


图 11-1物种信息量统计

图11-2通过数据库比对结果发现94.2%的reads属于放线菌门(Actinobacteria),拟杆菌门(Bacteroidetes),壁厚菌门(Firmicutes)和变形菌门(Proteobacteria),但是它们在EU和BF中的比例有显著差异。BF肠道中拟杆菌门的微生物占大部分, 而壁厚菌门所占比例较低,含有大量纤维素和木聚糖水解基因的Prevotella和Xylanibacter菌株只存在于BF中,并且所占比例较高。

图 11-2饮食对肠道微生物的影响
SR2011-02 进化树分析
    进化树(Evolutionary Trees),在生物学中,用来表示物种之间的进化关系,又称“系统树”、“系谱树”。图11-3是根据16S rDNA序列构建的菌株a10以及相关种、属的的系统进化树。在进化树上每个叶子结点代表一个物种,如果每一条边都被赋予一个适当的权值,那么两个叶子结点之间的最短距离就可以表示相应的两个物种之间的差异程度。采用邻接法进行进化树的绘制,进化树图11-3所示。系统进化树显示菌株a10与Streptomyces roseoviridisstrainJS-9(玫瑰绿链霉菌)和Streptomyces roseusstrain JS-18(浅玫瑰色链霉菌)的同源性较好,相似性为99. 8%。
 
图 11-3 宏基因组系统树

SR2011-03 物种相对丰度分析
    物种丰度是指群落内物种数目的多少。从一定程度上可以认为,物种丰度越大其结构越复杂,其抵抗力稳定性就越大。通过统计学手段,分析出环境样品中的主要成分及不同样品间的明显差异因素。结合物种鉴定,可以得到关键菌群。图11-4是肠道群落中57个最常见菌群的相对丰度箱线图。
 
图 11-4 肠道群落中最常见菌群的相对丰度箱线图

SR2011-04 群落丰度差异分析
    通过横向比较,可以看出各个群落中的物种丰度差异,从而发掘该群落的相对稳定物种。图11-5是16S测序结果的相对丰度分析。从A图上可以看出,无论是5primer还是3primer的结果,都反映了梭状芽胞杆菌(Clostridiales)是该类群落中的主要菌群。而通过跨群落之间的比较,可以看出梭状芽胞杆菌(Clostridiales)在不同的群落之间是存在明显的丰度差异。
 
图11-5 各物种16S的相对丰度

SR2011-05 疾病标志物分析
    不同疾病模型的体内菌落环境对疾病所处阶段以及疾病情况存在明显的影响。通过对不同疾病模型的菌落成分进行PCA(主成份分析)分析,可以发掘疾病标志物。图11-6是二期糖尿病病人(T2D patients)和一期糖尿病病人(Controls)的主成份分析结果图,由此可得知图上所标示的四种菌群是区分两种疾病模型的重要标志物。
 
图11-6 二期糖尿病病人和一期糖尿病病人的主成份分析

SR2011-06 基因注释和基因功能丰度差异分析
    将所得序列与已有的数据库进行比对,进行基因功能的注释。其中,常用的数据库包括NT、NR、GO、COG、KEGG、SEED、Swiss-Prot等。然后对基因的丰度差异进行统计。通过对丰度差异基因进行GO(基因功能富集分析)和KEGG(生物通路分析),发掘丰度差异功能,从而分析菌群间差异的可能机理。



 图11-7肠道群落菌群宏基因组的KEGG分析
SR2011-07 宏基因组拼接
    对环境样品DNA进行大规模测序后,通过严格的拼接方式,可获得较长的DNA片段。当样品的生物多样性较低,且达到一定测序通量后,很有可能直接获得一个或多个微生物基因组草图(图11-8)。

 
图11-8 图形化的微生物基因组
SR2011-08 群落中的菌群共生关系网络
    通过大量测序,可以获得样品的群落结构信息,如微生物物种在该环境下的分布情况及成员间协作关系等。通过实验还可以确定一些特殊的主要基因或DNA片段,从而发掘各个菌群成员的共生关系。图11-9是二型糖尿病病人的肠道微生物群落的共生关系网络图。MLG是指宏基因组连锁群,通过分析,一共找到47个MLG,发掘出52484个基因标志物。网络节点的颜色代表该MLG的分类,节点大小反映该MLG所含基因标志物的个数,线则代表两个MLG之间的秩相关性。蓝色线条代表两个MLG之间的相关性系数大于0.4,红色线条代表相关性系数小于0.4。由此构建出群落的共生关系网络,并找出在不同疾病模型中的共生网络差异。

 
图11-9 二型糖尿病病人的肠道微生物群落的共生关系网络图 

版权所有:广州市锐博生物科技有限公司 Copyright©2013 Guangzhou RiboBio Co., Ltd.  免费热线:400-686-0075
地址:广州开发区科学城科学大道182号创新大厦C3区13-14层   邮编:510663   粤ICP备05022931号   浏览器建议:IE8.0 1024X768分辨率
主营产品及服务:piRNA  寡核酸  siRNA  miRNA  microRNA   RNAi  shRNA  lncRNA  ncRNA  细胞增殖  生物芯片  高通量测序