10高通量测序-层次聚类

如题所述

举报该问题

第1个回答 2022-07-26

层次聚类(Hierarchical Clustering)通常与热图有关(heatmap)。热图的列代表不同的样本，行代表来自不同样本的基因。红色表示基因高表达，蓝色或紫色低表达。层次聚类根据相似性对行或列进行排序，很容易看到数据中的相关性。下图左边是没有层次聚类，右图是层次聚类。热图通常附有 树状图(dendrogram)

在本例中，我们只是将行 (Gene)进行聚类。

Gene1和Gene3是最相似的，所以为分类1。

回到第一步，把分类1看成一个基因，重复步骤1、2、3。Gene3和Gene4是最相似的，所以为分类2。

因为只剩下分类1和分类2，所以我们合并它们。层次聚类通常伴随着树状图，它既表明了聚类的相似性，也表明了聚类形成的顺序。分类1是最先形成和最相似的，且分支最短。分类2第二相似，也是第二短的分支。包含所有基因的分类3是最后形成的。它有最长的分支。

注意：

1.Gene间相似性怎么确定？

计算基因之间的 欧几里得距离 ：

距离度量(distance metric) :

选择欧几里得还是曼哈坦距离是随意的，无论是生物学上还是生理上都没有理由选择其中一个而不是另一个。选择一个能让你更深入了解数据的方法。

2.分类(clusters)之间如何比较相似性？

分类之间比较的方法：

为了直观地了解不同方法是如何工作的，假设我们的数据在X-Y平面上展开，现在想象一下，我们已经形成了绿色类和黄色类，我们可以比较灰色的点与：

如果我们使用R，默认设置hclust()是与每个类最远的点，下面三种分类之间比较的热图

相似回答

高通量测序技术及原理介绍答：高通量测序技术也被称作二代测序技术（Next Generation Sequencing, NGS），这是相对一代测序技术（Sanger Sequencing）而言的，同时由于高通量测序的出现使得我们能对一个物种的基因组和转录组进行全面、细致的分析成为可能，所以又被称为深度测序(deep sequencing)。高通量测序技术以能一次并行对几十万到几...

高通量测序介绍答：高通量测序技术（High-throughput sequencing）又称“下一代”测序技术（“Next-generation” sequencing），以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。高通量测序技术是对传统测序一次革命性的改变，一次对几十万到几百万条DNA分子进行序列测定，因此在有些文献中称其为...

什么是高通量测序答：高通量测序技术（High-throughput sequencing）又称“下一代”测序技术（"Next-generation" sequencing technology），以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。根据发展历史、影响力、测序原理和技术不同等，主要有以下几种：大规模平行签名测序（Massively Parallel Signatu...

什么叫层次聚类分析答：最后一个CHEMALOEN，它则是在层次聚类时构造动态模型。3 基于密度方法，根据密度完成对象的聚类。它根据对象周围的密度（如 DBSCAN）不断增长聚类。典型的基于密度方法包括：DBSCAN(Densit-based Spatial Clustering of Application with Noise):该算法通过不断生长足够高密度区域来进行聚类；它能从含有噪声...

小白的生信笔记(1)——高通量测序的一些基础知识答：PacBio的SMRT仍然运用边合成边测序的策略,但是其超强活性的DNA聚合酶是实现超长读长(~1000bp)的关键。反应在纳米管中进行,方便达到超高通量的目的。利用的是ZMW(零模波导孔)原理在超小的纳米孔中区别荧光信号的背景。其测序速度很快,每秒约10个dNTP。目前的问题在于测序的错误率太高(81-83%),这也是大多数三代...

高通量测序分的原理答：高通量测序：高通量测序技术是对传统测序一次革命性的改变，一次对几十万到几百万条DNA分子进行序列测定，因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变，同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能，所以又被称为深度测序(deep ...

高通量测序是什么技术,一二三代的区别,测序注意事项答：Q30：高质量碱基比例，影响读长和分析准确性。比对率：与参考序列的匹配程度，高比对率保证分析可靠性。覆盖度：均匀覆盖是准确分析的基础。在构建文库时，无PCR过程可降低偏差，重复率要求在10%以下，以保证数据一致性。结语：前沿与实践高通量测序技术的进步，如谷禾健康等公司，不仅提供专业服务，还通过...

高通量测序高分文章分析,测序技术怎么选,看这篇就够了!答：5. 微塑料与健康的影响高分论文《聚苯乙烯微塑料与胰岛素抵抗》(Environ Int, IF 13.352)揭示了微塑料可能通过影响肠道-肝轴，增加胰岛素抵抗和糖尿病的风险，其中代谢组学和微生物组学的结合提供了深入洞察。总结选择高通量测序技术时，要综合考虑研究问题的特性，利用各技术的优势进行多角度分析。无论是...

DNA测序的测序技术答：高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(Next-generation sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)...

大家正在搜

层次聚类的聚类方式层次聚类和kmeans聚类 illumina高通量测序高通量测序结果怎么看高通量测序分析高通量测序深度高通量测序的步骤高通量测序手段有哪些二代高通量测序