上一篇微生物与代谢联合分析之相关性分析中,小编为大家介绍了单变量相关性分析,还没有看过的小伙伴们可以先点击了解。但对于微生物和代谢物之间复杂的多重对应关系,就需要通过多变量相关性分析进行深入探讨了。目前较为常用的多变量相关性分析包括协惯量分析(CIA)、典范对应分析(CCA)、普鲁克分析(PA)和O2PLS分析。
协惯量分析
协惯量分析(Co-inertiaAnalysis,CIA)是一种对称融合排序方法,用于衡量两组数据集之间的一致性。CIA的基本原理是基于两组变量的协方差矩阵,提出两变量的协同结构,并投影到同一空间,通过组分之间最大协方差来描述两个数据集之间的共有结构,以反映数据集的共有趋势或共同关系。
图1CIA排序图典范对应分析
典范对应分析(CanonicalCorrespondenceAnalysis,CCA)是一种基于多元限制性排序的特征提取方法。CCA将对应分析与多元回归分析相结合,在对应分析的迭代过程中,每次计算均进行两组数据的多元线性回归,基于最大相关性提取对两组数据最佳线性关系贡献值最大的典型变量。CCA要求数据集内变量线性独立,并且样本数不少于变量数。在变量过多时也会出现过度拟合,因此需要在进行分析前根据情况筛选关键的代谢产物进行CCA分析。图2CCA分析结果图
上面提到的CIA和CCA分析都是利用回归分析计算微生物与代谢物之间的相关性,而下面要介绍的普鲁克分析和O2PLS模型分析则是从组学数据整体角度出发,对两个组学的数据进行相关性分析。普鲁克分析
普鲁克分析(ProcrustesAnalysis,PA)是一种形状分布分析方法,基本思想是通过连续迭代,发现标准形状(canonicalshape),利用最小二乘法确定样本形状到标准形状的仿射变换形式。PA利用PCA和CCA等数据降维结果对多组学数据进行可视化整合,以便快速检查多组学数据集的一致性。图3Procrustes样本投影图O2PLS模型
O2PLS模型用于两个数据组间的整合分析,包括系统生物学组学间关联、分子调控机制-表型间关联等各种大数据组的内在联系都可通过此模型进行整合分析。该模型一方面可反映不同数据组间的整体关联,另一方面可直接体现不同变量在模型中的权重。不同于常用的相关性系数计算,通过O2PLS模型不仅可获得变量间的相关性系数,更重要的是获得变量在模型中的权重,从而更加精准地发现关键调节现象。
图4O2PLS载荷图或许上面对于分析方法的描述有些生涩,那接下来就让我们通过几篇文章了解下,研究人员是如何利用多变量相关分析发现微生物和代谢物之间的关系吧~婴儿出生后肠道细菌和代谢特征变化
Evolutionofgutmicrobiota