vpa 高分期刊中频频登场的VPA分析到底是啥?

自然环境复杂多样,生物从来不是孤立存在的,而是与其所处的环境密不可分。在微生物群落的研究中,不仅要分析群落内部的变化,还要将群落放入整个生态环境中,分析环境与群落之间的响应/相互作用机制。
例如,土壤微生物群落的丰度可能受到土壤pH、氮、磷含量、温湿度等因素的综合影响;动物肠道微生物群落可能受宿主肠道环境的酸碱度、食物类型、宿主肠道分泌物质等因素的影响。微生物群落与环境的相关性/相互作用分析可以帮助我们在更高的层次上解释群落结构变化的机制。
环境因素分析中的缺陷
群落分析中常见的环境因子分析包括CCA典型对应分析和RDA冗余分析。这两种分析都是基于降维的思想,将样本、物种和环境因素的信息映射到一个二维平面,从而判断它们之间的关系,可以用来寻找对群落结构有影响的环境因素。它们是当前论文中最常见的环境因素分析。
然而,这两种分析有一个共同的盲点,即无法直接定量地显示一个环境因素对社区整体变化的影响。这两种环境因子分析的本质其实是用几组解释变量(即环境因子数据)共同解释一组响应变量(即微生物数据)的变化。当我们需要一个解释变量能够解释的方差变异度信息(即一个环境因素对群落结构变化的贡献)时,我们可以用一种新的分析方法——VPA方差分割分析(VPA)来补充。
VPA分析原理
VPA分析的思想是在20世纪90年代提出的。2006年,PERES-NETO等人发表论文对其进行改进和补充[图1],随后逐渐被人们所接受。一般来说,VPA分析的原理是对每个解释变量(环境因素)独立运行CCA或RDA,得到每个解释变量(环境因素)对响应变量(微生物群落)方差变异的解释贡献,然后取多组数据得到每个解释变量(环境因素)的独立解释贡献和环境因素联合解释的贡献。

vpa 高分期刊中频频登场的VPA分析到底是啥?


文章图片

图1 VPA分析文献[1]
例如,如图2所示,微生物群落数据d的方差的总体解释程度为y,并且检测到两个环境因素数据x和w。利用VPA分析的思想,将两个环境因子的数据独立运行RDA分析(RDA简单解释:所有标准化解释变量对响应变量逐一进行多元回归分析,得到拟合值和残差值,最后整合到拟合值矩阵中,通过PCA和排序得分分析得到RDA分析结果),得到各环境因子对整体群落变异的修正解释度,然后运行两者得到修正解释度数据R2(RDA中得到)
【独立经营X环境因素RDA】:A+B部分解释的贡献率
【独立运行W环境因子RDA】:b+ C解释的贡献率
【X与W环境因子联合运行的RDA】:A+B+C部分的贡献比例说明
所以:
[a]=[联合运行X和W环境因子的RDA]-[独立运行W环境因子的RDA]
[c]=[联合运行x和w环境因子的RDA]-[独立运行x环境因子的RDA]
[b]=[x和w环境因子联合运行的RDA]-[a]-[c]
[这两个环境因素无法解释的残差]=Y- [a]-[b]- [c]

vpa 高分期刊中频频登场的VPA分析到底是啥?


文章图片

图2贡献示意图
通过文氏图的显示,我们可以清楚地看到各环境因素对总体变化的解释程度、共同解释程度和残差。需要说明的是,图中的公共部分是由环境因素数据对微生物解释的共线性造成的。如果环境因素完全相互独立,理论重叠部分= 0;另外,如果解释贡献为负,说明这组环境因子数据对群落数据方差变化的解释程度低于使用随机变量的解释程度,一般解释为0。在选择环境因子时,建议减少共线性和负贡献较高的环境因子,以保证结果的准确性。

推荐阅读