欢迎来到得力文库 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
得力文库 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    微生物多样性分析.ppt

    • 资源ID:859519       资源大小:20.01MB        全文页数:66页
    • 资源格式: PPT        下载积分:2金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要2金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    微生物多样性分析.ppt

    土壤微生物多样性检测分析学习汇报,目录,土壤微生物多样性简介16S rDNA测序的基础理论喀斯特地区土壤微生物多样性检测结果分析,什么是微生物多样性?土壤微生物群落和种类?研究土壤微生物多样性的意义?,土壤微生物多样性简介,微生物多样性,狭义上,指微生物物种多样性;广义上,指微生物生命活动层次的角度,将微生物多样性分为遗传(基因)多样性、生理多样性、物种多样性和生态多样性四个层面。物种多样性的主要研究对象是微生物系统分类、物种数量、物种构成等。,土壤微生物群落和种类,原生动物,细菌,藻类,真菌,土壤微生物中细菌最多,作用强度和影响最大,放线菌和真菌类次之,藻类和原生动物等数量较少,影响也小。,研究土壤微生物多样性的意义?,土壤微生物大部分对作物生长发育是有益的,它们对土壤的形成发育、物质循环和肥力演变等均有重大影响。形成土壤结构:土壤微生物通过代谢活动的氧气和二氧化碳的交换,以及分泌的有机酸等有助于土壤粒子形成大的团粒结构。分解有机质、矿物质:作物的残根败叶经过土壤微生物的作用,形成腐殖质;土壤微生物的代谢产物能促进土壤中难溶性物质的溶解。固氮作用:将空气中的氮气转化为植物能够利用的固定态氮化物。调节植物生长:根瘤菌、菌根和真菌等能为植物直接提供氮素、磷素等各种有机营养,促进植物的生长。在研究土壤改良和地力提升的过程中,土壤微生物多样性是反应土壤肥力变化的一个重要指标,同时通过人为控制微生物的多样性可以起到改良地力的作用。,微生物多样性的研究方法?,现代分子生物学技术的发展使我们看到了揭开土壤生态微观世界秘密的希望。,现代微生物多样性研究,主要运用分子生物学技术、二代和三代高通量测序、PCR-DGGE、实时荧光定量PCR等平台、结合生物信息分析手段,对样本中微生物的遗传信息进行检测和分析。,16S rDNA测序的基础理论,高通量测序的概念?测序实验流程及信息分析流程?测序结果分析中的常见方法,宏基因组( Metagenome):也称微生物环境基因组 Microbial Environmental Genome, 或元基因组,是由 Handelsman 等 1998 年提出的新名词, 其定义为"the genomes of the total microbiota found in nature" , 即生境中全部微小生物遗传物质的总和。,高通量测序的概念?,高通量测序技术(High-throughput sequencing):又称"下一代"测序技术("Next-generation" sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。,高通量测序技术,不太理解?,16S rRNA:rRNA(核糖体RNA)分子在生物体中普遍存在,其一级结构可分为反应物种间亲缘关系的保守区片段(conserved domain)和表明物种间差异的可变区片段(variable domain),是不同分类级别生物鉴定的分子基础。rRNA按沉降系数可分为5S、16S和23SrRNA三种。16SrRNA占细菌总RNA量的80%以上,基因序列长短适中,结构既有保守区域也有变异区域,是较好的生物标志物。,高通量测序的概念?,扩增子测序(Amplicon sequencing):通过测定特定的基因以及特定基因的目的片段,以达到群落调查的基本目的;16S、18S、ITS及功能基因amoa、pmoa、dsr、nif等基因测序都属于扩增子测序。宏基因组测序数据量大、成本高,与之相比,扩增子测序更为“小巧”,适合大多数研究工作。,16S rRNA基因不同区域序列的变异程度可分为9个可变区(V1-V9)和9个保守区(C1-C9)。除V2、V3、V4区稍长外,其他各高变区序列都很短,没有哪个高变区能区分所有细菌。人们根据需要可以对不同区域进行测序,但目前细菌V3-V4区是通用的测序区,包含信息量较全。,实验流程,信息分析流程,OTU(operational taxonomic units):即操作分类单元。通过一定的距离度量方法计算两两不同序列之间的距离度量或相似性,继而设置特定的分类阈值,获得同一阈值下的距离矩阵,进行聚类操作,形成不同的分类单元。在16S分析中引入OTU,首先对相似性序列进行聚类,分成数量较少的分类单元,基于分类单元进行物种注释。这不仅简化工作量,提高分析效率,而且OTU在聚类过程中会去除一些测序错误的序列,提高分析的准确性。每一个 OTU 通常被视为一个微生物物种。相似性小于97%就可以认为属于不同的种,相似性小于95%,可以认为属于不同的属。,OTU聚类,OTU聚类,绿色代表启发式聚类算法,用橘色代表层次聚类算法,蓝色代表其他(数学模型、复杂网络)OTU聚类算法。,OTU聚类方法还包括:Uclust、cd-hit、BLAST、mothur、usearch和 prefix/suffix,这些聚类方法均可以在QIIME软件中实施。不同聚类方法基于不同的算法,得到的聚类结果虽然不同,但是大体的聚类流程都是一致的:,序列聚类生成OTU的三种方法:,OTU聚类,我的样品OTU聚类方法为uparse。UPARSE方法在2013年发表在Nature Methods,专门用于OTU的构建。,在PCR反应中,在延伸阶段由于不完全延伸,就会导致嵌合体序列的出现。,OTU聚类嵌合体,PCR嵌合体生成,singleton OTU(只有一条代表序列的OTU)则通常认为是由于测序错误造成的,或者是来自于嵌合体。在聚类的同时usearch 会剔除嵌合体和singleton 序列。,OTU聚类后,挑选出每个OTU中的代表序列,与RDP(细菌、古菌16S)、Sliva(18S)或GreenGene(16S、叶绿体、线粒体)等数据库进行比对,进行物种注释。在各水平(phylum,class,order,family,genus,species)上统计各样品群落组成,利用QIIME软件生成不同分类水平上的物种丰度表,再利用R语言工具绘制成样品各分类学水平下的群落结构图。,OTU注释,OTU和物种是映射关系,它们一一对应或多对一。,OTU跟物种的关系,A、B、C分别表示OTU 1、OTU m和OTU n中有A、B、C条reads,假设OTU 1和OTU m比对到物种1,那么物种1的丰度是A+B;同理假设OTU n比对到物种2,物种2的丰度是C。,共有或特有物种Venn 图,物种群落结构分析,A-白云岩样地1B-白云岩样地2C-石灰岩样地1D-石灰岩样地2,门水平物种丰度聚类热图,物种丰度聚类分析,Heatmap 用于表示一个或多个组的样品在某一分类水平(门、纲、目、科、属、种、OTU)上的群落组成和丰度。丰度用颜色深浅来表征,并可根据丰度和组成进行聚类,也可按照特定的顺序进行横纵坐标的排列。,属水平物种丰度聚类热图,物种丰度聚类分析,物种相对丰度分布图,门水平上物种相对丰度分布图,物种相对丰度分布图,属水平上物种相对丰度分布图,相对丰度前50 的OTU 进化树,OTU系统进化分析(所有样本),Alpha 多样性(Alpha diversity)是对单个样品中物种多样性的分析,包含物种组成的丰富度(species richness) 和均匀度(species evenness)(多样性) 两个因素,通常计算的参数包括Observed_species 指数(观测到的物种数)、Chao1 指数、Shannon 指数、Simpson 指数、ACE指数以及PD whole tree 等。在评价样本的Alpha多样性时,既要考虑丰富度,又要考虑多样性,需根据上述指数综合考虑评价。多样性主要关注局域均匀生境下的物种数目,因此也被称为生境内的多样性(within-habitat diversity)。,Alpha 多样性,群落丰富度指数(群落中物种数量的多少)Observed_species 指数:观测到的物种数,即observed OTUs?Chao:是用chao1算法估计群落中含OTU数目的指数,chao1在生态学中常用来估计物种总数,由Chao(1984)最早提出。Ace:用来估计群落中含有OTU数目的指数,由Chao提出,是生态学中估计物种总数的常用指数之一,与Chao1的算法不同。Chao和Ace越大,说明群里中含有的OTU数目越多,群落的丰富度越大。单纯考虑群落中物种的数量,而不考虑群落中每个物种的丰度情况。,Alpha 多样性,群落多样性指数Simpson:是生态学中常用的一个指数,它反映的是优势种在群落中的地位和作用,若一个群里中优势种占的多,其他非优势物种所占的比例则会减少,这说明Simpson指数值越大,说明群落多样性越低,它与其他多样性指数均呈负相关。Shannon:用来估算样品中微生物的多样性指数之一。它与Simpson多样性指数均为常用的alpha多样性的指数。Shannon值越大,说明群落多样性越高。Shannon和Simpson指数用于衡量物种多样性,受样品群落中物种丰度和物种均匀度(Community evenness)的影响。相同物种丰度的情况下,群落中各物种具有越大的均匀度,则认为群落具有越大的多样性。PD whole tree:,Alpha 多样性,Chao 指数,singletons,即仅含有一条read的OTU,doubletons,即仅含有两条reads的OTU。可以这样理解:在一个放了各种各样玩具模型的水池中(例如下图。水池很大,其中玩具有相同的,有不同的,且各种类型及数目不限),随机来捞玩具。这时捞起来一个,发现之前有个玩具和这个捞起的玩具一模一样,这时有两个这种玩具在手上,这个玩具模型就是doubletons;当然也可能捞起一个玩具发现手里没有相同的,那这个就叫singletons。注意:手里如果已经有两个或以上,再捞一个起来这类情况对Chao1指数是没有贡献的!,Chao指数是用Chao1算法估计样品中所含OTU数目的指数,Chao1在生态学中常用来估计物种总数,由Chao(1984)最早提出。Chao指数的计算公式如下:经典公式:修正偏差后:其中, =估计的OTU数 ; =实际观测到的OTU数;F1=只含有一条序列的OTU数目(singletons);F2=只含有两条序列的OTU数目(doubletons)。,Chao 指数,对公式的理解从公式我们可以看到chao1指数是用来反映物种丰富度的指标。它通过观测到的结果推算出一个理论的丰富度,这个丰富度更接近真实的丰富度。一般来讲能观测到的物种丰富度肯定会比实际少,那么两者之间的差距有多大呢?chao1指数给出的答案是(F12)/(2*F2),它通过singletons和doubletons进行了合理的推算。分析chao1指数的后半段(F12)/(2*F2)我们不难发现它对singletons的权重要高于doubletons (即F12比2*F2变化的速度更快)。Chao1指数是基于这样一种假设:在一个群体中随机抽样,当稀有的物种(singletons)依然不断的被发现时,则表明还有一些稀有的物种没有被发现;直到所有物种至少被抽到两次(doubletons)时,则表明不会再有新的物种被发现。综上,chao1是度量物种丰富度的指标,它和丰度、均匀度无关,但是它对稀有的物种很敏感。(这也正是丰富度指标应该具有的特性!),Chao 指数,Ace指数是用来估计群落中OTU数目的指数,由Chao提出,是生态学中估计物种总数的常用指数之一,与Chao1的算法不同。Ace指数的计算公式如下:其中, , ,,Ace 指数,Ace 指数,ni为含有i条序列的OTU数目,Srare为含有“abund”条序列或少于“abund”的OTU数目,Sabund为多于“abund”条序列的OTU数目,abund为“优势”OTU的阈值,默认为10。,shannon指数可以回答样本各物种均一性如何。公式:其中,S指OTUs的数量;H为样品的信息含量(彼得/个体)=群落的多样性指数;Pi是样品中属于第i种的个体的比例,如样品总个体数为N,第i种个体数为ni,则pi=ni/N。,香农(Shannon)指数,举例:设有A,B,C三个群落,各有两个种组成,其中各种个体数组成如下: 括号内数字为pi。则,显然,H值的大小与我们的直觉是相符的:群落B的多样性较群落C大,而群落A的多样性等于零。在香农-威纳指数中,包含着两个成分:种数;各种间个体分配的均匀性(equiability或evenness)。各种之间,个体分配越均匀,H值就越大。如果每一个体都属于不同的种,多样性指数就最大;如果每一个体都属于同一种,则其多样性指数就最小。,香农(Shannon)指数,那么,均匀性指数如何来测定呢?可以通过估计群落的理论上的最大多样性指数(Hmax),然后以实际的多样性指数对Hmax的比率,从而获得均匀性指数,具体步骤如下:其中 Hmax为在最大均匀性条件下的种多样性值,S为群落中种数; 如果有S个种,在最大均匀性条件下,即每个种有1/S个体比例,所以在此条件下Pi=1/S,举例说,群落中只有两个种时,则: 这与前面的计算是一致的,因此,我们可以把均匀性指数定义为:EH/ Hmax,其中 E为均匀性指数,H为实测多样性值,Hmax 为最大多样性值log2S。,香农(Shannon)指数,两个生物多样性的重要因素:1. Richness丰富度即每个样本的物种数,样本中物种越多,样本越“丰富”。物种丰富度从概念上讲,并不考虑(样本中)每个物种有多少个个体。它给于个体数少的物种与个体数多的数种相同的权重。因此,在某地区1朵雏菊与1000朵金凤花对丰富度的影响是一样的。2. Evenness均匀度即不同物种的相对丰度(abundance),它与丰富度互相补充,相辅相成(make up)。,辛普森(Simpson)指数,三个概念:Richness, Evennes 和abundance的区分。例:A组:类1有3个,类2有5个,类3有6个;B组:类1有4个,类2有4个,类3有4个。那么A组有3类,B组也有3类,所以它们的richness是一样的;A组中3个类所含个体数均不相同,而B组中3个类所含个体数相同,因此A组和B组的evennes不同;A组类1有3个,B组类1有4个,所以就类1而言B组的abundance更高。,辛普森(Simpson)指数,辛普森(Simpson)指数,两个样本丰富度相同(均有3个物种),总的个体数也相同(均为1000朵)。但第1个地区样本的均匀度比第2个地区样本的均匀度更高。因为(在第1个地区)3个物种个体分布较均匀,第2个地区大多数是金凤花,仅有少数雏菊和蒲公英。因此认为样本2比样本1的多样性更低。,相比于由相似丰度的许多物种组成的群落,由一两个优势物种组成的群落具有更低的多样性。,Simpson's Index (D) 它反映的是在同一个样本中随机的抽取2个个体,这两个个体来自同一个类的概率。有以下两个版本的公式来计算simpson指数。两者不矛盾,均可接受。,辛普森(Simpson)指数,D值在0-1之间。0表示无限多样,1表示没有多样性。也就是说D值越大,多样性越低。这与直觉和逻辑不符,为了解决这个问题,通常会用1减去D:,Simpson's Index of Diversity 1-D这个值也在0-1之间,但是此时,值越大多样性越高,这就变得更直观了。这种情况下,指数代表的意义是在同一个样本中随机的抽取2个个体,这两个个体来自不同类的概率。对于违背直觉的D值,还有另一种处理办法,即用1除以D:Simpson's Reciprocal Index 1 / D1/D的最小值为1。当它为1时表示样本仅由1个物种组成。值越大,多样性越高。最大值是样本中的物种数。例如,假设一个样本中有5个物种,则1/D的最大值为5。,辛普森(Simpson)指数,例:A组:2, 4, 6, 8 B组:20, 40, 60, 80 C组:5, 5, 5, 5 D组:5, 5, 5, 5, 5代入公式1-D计算(因为微生物16SrRNA经典流程QIIME使用的scikit库是利用这个公式计算的),我们可以得出:A组simpson指数为: 1-(2/20)2+(4/20)2+(6/20)2+(8/20)2) = 0.7A组shannon指数为 1.846439B组simpson指数为: 1-(20/200)2+(40/200)2+(60/200)2+(80/200)2) = 0.7B组shannon指数为 1.846439 C组simpson指数为: 1-(5/20)2)*4 = 0.75C组shannon指数为 2.0D组simpson指数为: 1-(5/25)2)*5 = 0.8D组shannon指数为 2.321928,辛普森(Simpson)指数,AB组结果相同显示出在丰富度一致时simpson指数与丰度无关,它只与相对丰度(均匀度)有关。这和shannon指数一致,归根结底是因为公式中自变量都是相对丰度pi!CD组结果不同显示出在均匀度一致时simpson指数与丰富度有关,丰富度越大,simpson指数越大。这一点也和shannon指数的情况一致,归根结底,原因在于公式中都有加和项,而且加和部分无论是simpson指数的(pi)2还是shannon指数的x*log2(x)在区间(0,1上均大于0。因此,无论是shannon指数还是simpson指数每多加一项(即丰富度增加),值都会越来越大。回到抽样上来讲,当样本中每种个体数都相同时,在一个样本中随机抽取两个个体,种类越多抽到的这两个个体来自同一个种类的概率越小。AC组显示出当丰富度相同时,样本中种类越均一,simpson指数越大,即种类越均一,随机抽取两个个体属于同一个种类的概率越大。对应shannon指数的y = - x*log2(x), simpson指数的y = - x2 在(0,1间区上,也是一个斜率逐渐减小的单调递减函数。综上,simpson和shannon指数都是均匀度和丰富度的综合指标。,辛普森(Simpson)指数,Alpha多样性分析,A、B是白云岩样地;C、D是石灰岩样地。,样品曲线的延伸终点对应的的横坐标位置为该样品的测序数量,若多样性指数为observed_species 指数(表征实际观测到的物种数目),当曲线趋向平坦时,说明测序数据量足够,更多的数据量只会产生少量新的物种(也即是OTU),反之则表明继续测序还可能产生较多新的物种。,稀释曲线,稀释曲线,Beta 多样性(Beta Diversity)即样品间的生物多样性的比较,是对不同样品间的微生物群落构成进行比较。需在各个样品序列数目一致的前提下,进行样品间多样性的比较。Beta多样性算法:,Beta多样性,利用非加权的计算方法,主要比较的是物种的有无,如果两个群体的多样性越小,则说明两个群体的物种类型越相似。而加权方法,则需要同时考虑物种有无和物种丰度两个问题。binary jaccard和bray curtis算法仅基于样品所包含的序列特征(基于物种的丰度信息)比较物种差异(即基于OTU进行比较),而UniFrac 则利用了系统进化的信息(即基于系统发生树进行比较),考虑了物种间的进化距离来比较样品间的物种群落差异(限细菌)。Weighted Unifrac 距离是一种同时考虑各样品中微生物的进化关系和物种的相对丰度,计算样品的距离,而Unweighted Unifrac则只考虑物种的有无,忽略物种间的相对丰度差异。Uweighted Unifrac 距离对稀有物种比较敏感,而Bray curtis 和Weighted Unifrac 距离则对丰度较高的物种更加敏感。,原始数据完成数据处理与质控过滤后,对OTU按序列相似性进行聚类,此时基于OTU的计算方式认为各OTU之间是相互独立的不存在进化关系(各OTU间关系平等);而基于系统发生树的计算方法,会根据16S的序列信息对OTU进行进化树分类(目前仅支持16S测序数据的系统发生树距离计算,ITS系统发育信息不完善),此时不同OTU之间的距离实际上有“远近”之分。建议:在微生物多样性分析中,由于环境中的微生物复杂多样,各环境间物种的组成差异更为剧烈,所以通常采用非加权方法进行分析。但如果要研究对照与实验处理组之间的关系采用非加权分析比较不出明显差异,则更推荐加权分析方式。,Beta多样性,常见的Beta多样性分析方法:1、PCA(Principal Component Analysis)主成分分析与PCoA(Principal Co-ordinates Analysis)主坐标分析:通过一系列的特征值和特征向量进行排序,选择主要的前几位特征值,采取降维的思想,找到距离矩阵中最主要的坐标,从而观察个体或群体间的差异。2、NMDS(Nonmetric Multidimensional Scaling)非度量多维尺度分析:将对象间的相似性或相异性数据看成点间距离的单调函数,在保持原始数据次序关系的基础上,用新的相同次序的数据列替换原始数据进行度量型多维尺度分析,用于比对样本组之间的差异。3、UPGMA(Unweighted Pair-group Method with Airthmetic Means)非加权组平均聚类分析:基于各样品序列间的进化信息的差异来计算样品间的差异,可以反映样品在进化树中是否有显著的微生物群落差异。,Beta多样性,主成分分析 (Principal Component Analysis,PCA)是一种分析和简化数据集的技术,通过将方差进行分解,将多组数据的差异反映在二维坐标图上。对于微生物多样性分析,PCA分析是基于每个样品的OUT丰度作图。PCA用途:(1)揭示造成样本差异性的主成分及其贡献率。如在下图中,造成样本差异性最大的成分为PC1,贡献率为97.85%。(2)揭示不同处理下的样品的情况。样品组成越相似,样本在PCA中的距离越近。(3)样本间的差异性。两样本在横、纵坐标轴上的距离表示样本受主成分(PC1和PC2)影响下的相似性距离。,Beta多样性PCA,图中的点:不同颜色表示不同的分组。红色表示A组,蓝色表示B组。坐标轴:能够最大反映样本差异性的两个成分(PC1和PC2)。坐标轴上的刻度:为相对距离,无实际意义。百分数:表示成分的贡献率。如PC1成分的贡献率为97.85%,PC2成分的贡献率为1%。,假设对N个样品有衡量它们之间差异或距离的数据,就可以用此方法找出一个直角坐标系,将N个样品表示成N个点,而使点间的欧式距离的平方正好等于原来的差异数据,实现定性数据的定量转换,从多维数据中提取出最主要的元素和结构。通过主坐标分析可以实现多个样品的分类,进一步展示样品间物种多样性差异。,Beta多样性PCoA,样品PCoA(Unweighted Unifrac)分析图,样品PCoA(Weighted Unifrac)分析图,比较PCA和PCoA:相似之处:1、PCoA和PCA都属于非限制性分析。(非限制性分析是指只考虑物种本身,而不考虑外界的环境因子)2、PCoA和PCA的计算原理相同。都是通过计算,将“P维”的数据降到“2维或3维”。 3、PCoA图和PCA的解读一样。区别之处:1、PCA分析是基于原始的物种组成矩阵所做的排序分析,而PCoA分析则是基于由物种组成计算得到的距离矩阵得出的。2、在PCoA分析中,利用各样品序列间的进化信息来计算样品间距离,其中weighted考虑物种的丰度,unweighted没有对物种丰度进行加权处理。,Beta多样性,NMDS(非度量多维尺度法,Nonmetric Multidimensional Scaling)是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据分析方法。NMDS 包括一类排序方法,其设计目的是为了克服以前的排序方法(即线性模型,包括PCA、PCoA)的缺点,NMDS 的模型是非线性的,能更好地反映生态学数据的非线性结构。适用:于无法获得研究对象间精确的相似性或相异性数据,仅能得到他们之间等级关系数据的情形。特点:是根据样品中包含的物种信息,以点的形式反映在多维空间上,而对不同样品间的差异程度,则是通过点与点间的距离体现的,最终获得样品的空间定位点图。常用于比对样本组之间的差异,可以基于进化关系或数量距离矩阵。,Beta多样性NMDS,样品NMDS(Unweighted Unifrac)分析图,样品NMDS(Weighted Unifrac)分析图,Beta多样性NMDS,UPGMA(Unweighted pair-group Method with Arithmetic Mean):非加权组平均法,样品层次聚类。其原理是:假定前条件是在进化过程中,每一世系发生趋异的次数相同,即核苷酸或氨基酸的替换速率是均等且恒定的。UPGMA聚类树与柱状图结合绘图是将聚类树与丰度柱状图结合起来展示的一种分析手段。基于Beta多样性分析得到的四种距离矩阵,通过Python语言工具对样品进行层次聚类,用以判断各样品间物种组成的相似性;样品层次聚类树如下图:样品聚类树样品越靠近,枝长越短,说明两个样品的物种组成越相似;丰度柱状图根据各色块所占比例比较各样品的物种多样性高低、丰度相似性以及优势物种。,Beta多样性UPGMA,Beta多样性,基于Unweighted Unifrac 距离的UPGMA 聚类树,Beta多样性,基于Weighted Unifrac 距离的UPGMA 聚类树,Anosim分析是一种非参数检验,用来检验组间的差异是否显著大于组内差异,从而判断分组是否有意义。,样品组间群落结构差异显著性分析Anosim 分析,表1 Anosim 组间差异分析统计表,注:理论上,R 值范围为-1 到+1,实际中R 值一般从0 到1。R 值接近1 表示组间差异越大于组内差异,R 值接近0则表示组间和组内没有明显差异。统计分析的可信度用P-value 表示,P<0.05 表示统计具有显著性。,样品组间群落结构差异显著性分析Anosim 分析,对Anosim 的分析结果,基于两两样本之间的距离值排序获得的秩(组间的为between,组内的为within)。Between 表示组间结果,其它表示各自组内结果,纵坐标表示组内或者组间的距离的秩。,MRPP 多响应置换过程分析和Anosim 分析类似,只是排序方式不同,结果得到A 值、Observe Delta 值、Expect delta 值和Significance 值;Observe Delta 值越小说明组内差异越小,Expect delta 值越大说明组间差异越大。,样品组间群落结构差异显著性分析MRPP 分析,表2 MRPP 组间差异分析统计表,注:A 值大于0 说明组间差异大于组内差异,A 值小于0 说明组内差异大于组间差异。Observed Delta 值越小说明组内差异小,expect delta 值越大说明组间差异大。Significance 值小于0.05 说明差异显著。,Adonis 又称置换多因素方差分析(permutational MANOVA)或非参数多因素方差分析(nonparametric MANOVA)。它利用半度量(如Bray-Curtis)或度量聚类矩阵(如Euclidean)对总方差进行分解,分析不同分组因素对样品差异的解释度,并使用置换检验对划分的统计学意义进行显著性分析。,样品组间群落结构差异显著性分析Adonis 分析,注:Df 表示自由度;SumsOfSqs 总方差,又称离差平方和;MeanSqs 均方(差),即SumsOfSqs/Df;F.Model 表示F 检验值;R2 表示不同分组对样品差异的解释度,即分组方差与总方差的比值,R2 越大表示分组对差异的解释度越高;Pr 表示P 值,小于0.05 说明本次检验的可性度高。,表3 Adonis 组间差异分析统计表,AMOVA(分子方差分析法,Analysis of Molecular Variance) 分析是基于距离矩阵检验不同组间差异显著性的非参数分析方法。,样品组间群落结构差异显著性分析Amova 分析,表4 Amova 组间差异分析统计表,注:SS表示总方差,即离差平方和;df表示自由度;MS表示均方差,即SS/df;Fs表示F检验值;p-value表示P值,小于0.05时组间差异显著。,LEfSe 分析即LDA Effect Size 分析,可以实现多个分组之间的比较,同时也可进行分组内部亚组之间的比较分析,从而找到组间在丰度上有显著差异的物种(即biomaker)。该分析使用非参数因子Kruskal-Wallis 秩和验检检测不同分组间丰度差异显著的物种,并在此基础上利用成组的Wilcoxon 秩和检验来进行组间差异分析。最后,采用线性判别分析(LDA)来估算每个组分(物种)丰度对差异效果影响的大小。LEfSe 的统计结果包括三部分,分别是显著差异物种LDA 值分布柱状图,用以展示每个组内显著富集的物种及其差异影响;物种进化分支图,用以展示整个物种系统进化关系及不同组别中起重要作用物种分布规律;biomaker 在不同组各样本中的丰度比较图,用于展示组间具有统计学差异的物种在不同组中丰度分布。,样品组间物种差异显著性分析LEfSe 分析,LDA 值,进化分支,

    注意事项

    本文(微生物多样性分析.ppt)为本站会员(晴***)主动上传,得力文库 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知得力文库 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于得利文库 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

    © 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

    黑龙江省互联网违法和不良信息举报
    举报电话:0468-3380021 邮箱:hgswwxb@163.com  

    收起
    展开