diff --git a/2024/08/26/DIANN/index.html b/2024/08/26/DIANN/index.html index eee7507..b559a1b 100644 --- a/2024/08/26/DIANN/index.html +++ b/2024/08/26/DIANN/index.html @@ -501,6 +501,20 @@

Summa + + diff --git a/2024/08/27/Pcoa/index.html b/2024/08/27/Pcoa/index.html new file mode 100644 index 0000000..dfad884 --- /dev/null +++ b/2024/08/27/Pcoa/index.html @@ -0,0 +1,613 @@ + + + + + + + + + + + ZhaoPeng Lv's blog + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ + +
+
+
+
+ + + +
+ + + + + +
+ +

距离计算公式

+

距离证明2

+ +
    +
  1. 用举例矩阵降维后,得到特征向量,然后投影
    +

    PCA分析
    在PCoA相比于PCA更适合于生态数据的排序,这主要是由于微生物数据一般来说都非常复杂,物种(ASV/OTU)数远多于样本数,且常呈“长尾分布”,即高丰度物种较少,而大多数物种的丰度都极 低;而PCA分析是基于物种丰度矩阵(欧式距离;PCoA分析则是基于样本距离矩阵)做降维处理的(Ramette, 2007),因此,物种数越多(维度越高),其损失的信息就越多(特别是那些低丰度物种的差异信息)。

    +
    +
  2. +
+

布雷-柯蒂斯相异性:定义和示例

它经常用于生态学和生物学中,以量化两个地点之间发现的物种之间的差异。

+

Bray-Curtis 相异度计算如下:

+

BC ij = 1 – (2*C ij ) / (S i + S j )

+

金子:

+
    +
  • C ij :每个地点发现的物种最低值的总和。
  • +
  • **Si :**在_第 i 个_地点计数的样本总数
  • +
  • S j :在_j_点计数的样本总数
  • +
+

Bray-Curtis 相异度始终介于 0 和 1 之间,其中:

+
    +
  • 0表示两个站点没有差异。换句话说,它们每种物种的数量完全相同。
  • +
  • 1表示两个站点完全不同。换句话说,它们不共享任何同一类型的物种。
  • +
+

以下示例显示如何计算两个站点的 Bray-Curtis 相异度。

+

示例:Bray-Curtis 相异度的计算

假设一位植物学家出去统计两个不同地点的五种不同植物物种(A、B、C、D 和 E)的数量。

+

布雷-柯蒂斯差异

+

通过将这些数字积分到 Bray-Curtis 相异度公式中,我们得到:

+
    +
  • BC ij = 1 – (2*C ij ) / (S i + S j )
  • +
  • BC ij = 1 – (2*15) / (21 + 24)
  • +
  • BCij = 0.33
  • +
+

这两个位点之间的 Bray-Curtis 差异为0.33 。

+

Bray-Curtis 相异性的关键假设

布雷-柯蒂斯相异性假设两个站点大小相等。

+

这是一个至关重要的假设,因为如果一个地点比另一个地点大四倍,那么大地点自然会比小地点拥有更多的物种,仅仅是因为需要覆盖的面积要大得多。

+

2 大得多。

+

所以当我们计算Bray-Curtis相异时,它会非常大。然而,这可能会产生误导,因为两个站点之间的差异不在于其组成,而在于其大小。

+

Jaccard 相似度指数是两个数据集之间相似度的度量。

+

Paul Jaccard开发,该指数范围从 0 到 1。越接近 1,两个数据集越相似。

+

Jaccard相似指数计算如下:

+

杰卡德相似度=(两组中的观察值数量)/(任意一组中的观察值数量)

+

或者,写成记号形式:

+

J(A, B) = |A∩B| / |A∪B|

+

如果两个数据集具有完全相同的成员,则它们的 Jaccard 相似度指数将为 1。反之,如果它们没有共同的成员,则它们的相似度将为 0。

+

向量的大小,也就是向量的长度(一般称作为 模),向量a的模记为: 三角形斜长边的计算公式

+ + + +
+ + + + +
+
    +
  • + + Copyright: + + Copyright is owned by the author. For commercial reprints, please contact the author for authorization. For non-commercial reprints, please indicate the source. + +
  • +
+
+ + +
+ + + + + + + + + +
+ + +
+ +
+
+
+
    +
  • + Copyrights © + 2024 + ZhaoPeng Lv +
  • +
+
    +
  • + +
  • +
+
    +
  • + + + + Visitors: + | + Views: + + +
  • +
+
    + +
+
    + +
+
    +
  • + + + + +
  • +
+
+
+
+
+
+ +
+ +
+ +
+ +
+ +
+ + +
+ +

+
+ + +
+
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ + + \ No newline at end of file diff --git a/archives/2024/08/index.html b/archives/2024/08/index.html index 7e65fd1..46fd004 100644 --- a/archives/2024/08/index.html +++ b/archives/2024/08/index.html @@ -72,6 +72,22 @@

2024/8

+
+
+
+ + + +
+ + +
+
+ + +
diff --git a/archives/2024/index.html b/archives/2024/index.html index af8df26..8bdc6af 100644 --- a/archives/2024/index.html +++ b/archives/2024/index.html @@ -72,6 +72,22 @@

2024

+ + + +
diff --git a/archives/index.html b/archives/index.html index 841376d..73c937a 100644 --- a/archives/index.html +++ b/archives/index.html @@ -72,6 +72,22 @@

Archives

+ + + +
diff --git a/index.html b/index.html index 7a70c57..9acc4ea 100644 --- a/index.html +++ b/index.html @@ -153,6 +153,35 @@

ZhaoPeng Lv's blog

+ + +
DIA-NN + + + /2024/08/27/Pcoa/ +

距离计算公式

+

距离证明2

+ +
    +
  1. 用举例矩阵降维后,得到特征向量,然后投影
    +

    PCA分析
    在PCoA相比于PCA更适合于生态数据的排序,这主要是由于微生物数据一般来说都非常复杂,物种(ASV/OTU)数远多于样本数,且常呈“长尾分布”,即高丰度物种较少,而大多数物种的丰度都极 低;而PCA分析是基于物种丰度矩阵(欧式距离;PCoA分析则是基于样本距离矩阵)做降维处理的(Ramette, 2007),因此,物种数越多(维度越高),其损失的信息就越多(特别是那些低丰度物种的差异信息)。

    +
    +
  2. +
+

布雷-柯蒂斯相异性:定义和示例

它经常用于生态学和生物学中,以量化两个地点之间发现的物种之间的差异。

+

Bray-Curtis 相异度计算如下:

+

BC ij = 1 – (2*C ij ) / (S i + S j )

+

金子:

+
    +
  • C ij :每个地点发现的物种最低值的总和。
  • +
  • **Si :**在_第 i 个_地点计数的样本总数
  • +
  • S j :在_j_点计数的样本总数
  • +
+

Bray-Curtis 相异度始终介于 0 和 1 之间,其中:

+
    +
  • 0表示两个站点没有差异。换句话说,它们每种物种的数量完全相同。
  • +
  • 1表示两个站点完全不同。换句话说,它们不共享任何同一类型的物种。
  • +
+

以下示例显示如何计算两个站点的 Bray-Curtis 相异度。

+

示例:Bray-Curtis 相异度的计算

假设一位植物学家出去统计两个不同地点的五种不同植物物种(A、B、C、D 和 E)的数量。

+

布雷-柯蒂斯差异

+

通过将这些数字积分到 Bray-Curtis 相异度公式中,我们得到:

+
    +
  • BC ij = 1 – (2*C ij ) / (S i + S j )
  • +
  • BC ij = 1 – (2*15) / (21 + 24)
  • +
  • BCij = 0.33
  • +
+

这两个位点之间的 Bray-Curtis 差异为0.33 。

+

Bray-Curtis 相异性的关键假设

布雷-柯蒂斯相异性假设两个站点大小相等。

+

这是一个至关重要的假设,因为如果一个地点比另一个地点大四倍,那么大地点自然会比小地点拥有更多的物种,仅仅是因为需要覆盖的面积要大得多。

+

2 大得多。

+

所以当我们计算Bray-Curtis相异时,它会非常大。然而,这可能会产生误导,因为两个站点之间的差异不在于其组成,而在于其大小。

+

Jaccard 相似度指数是两个数据集之间相似度的度量。

+

Paul Jaccard开发,该指数范围从 0 到 1。越接近 1,两个数据集越相似。

+

Jaccard相似指数计算如下:

+

杰卡德相似度=(两组中的观察值数量)/(任意一组中的观察值数量)

+

或者,写成记号形式:

+

J(A, B) = |A∩B| / |A∪B|

+

如果两个数据集具有完全相同的成员,则它们的 Jaccard 相似度指数将为 1。反之,如果它们没有共同的成员,则它们的相似度将为 0。

+

向量的大小,也就是向量的长度(一般称作为 模),向量a的模记为: 三角形斜长边的计算公式

+]]>
+