Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/matlab/13.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
基于matlab的数据聚类_Matlab_Cluster Analysis_Hierarchy_Dendrogram - Fatal编程技术网

基于matlab的数据聚类

基于matlab的数据聚类,matlab,cluster-analysis,hierarchy,dendrogram,Matlab,Cluster Analysis,Hierarchy,Dendrogram,我正在尝试对数据进行群集。以下是我的数据示例: genes param1 param2 ... gene1 0.224 -0.113 ... gene2 -0.149 -0.934 ... 我有一千个基因和一百个参数。我想通过基因和参数对我的数据进行聚类,并使用聚类图。因为有很多基因,用图片很难理解任何东西。现在我想得到我数据中15-20个最大基因簇的文本信息。我的意思是15-20个基因列表,它们属于不同的簇。我该怎么做? 谢谢 这是我从数据中得到的聚类图示例: 这

我正在尝试对数据进行群集。以下是我的数据示例:

genes   param1  param2  ...
gene1   0.224   -0.113  ...
gene2   -0.149  -0.934  ...
我有一千个基因和一百个参数。我想通过基因和参数对我的数据进行聚类,并使用聚类图。因为有很多基因,用图片很难理解任何东西。现在我想得到我数据中15-20个最大基因簇的文本信息。我的意思是15-20个基因列表,它们属于不同的簇。我该怎么做? 谢谢

这是我从数据中得到的聚类图示例:

这里有垂直和水平树状图。因为有很多行,所以在垂直树状图上不可能看到任何东西(我只需要这一行)。
据我所知,树状图从我的数据中创建了一个二进制聚类,从N行数据中有N-1个聚类。因为这些是二进制聚类,所以有一个聚类,在下一步它分裂成两个,然后再分裂成两个,依此类推。我可以在第4步中获得哪些基因在哪些簇中的信息吗?例如,当有16个簇时?

要更清楚地查看树状图和热图中感兴趣的部分,可以使用工具栏上的缩放按钮选择感兴趣的区域并放大它们

要找出特定簇中的基因/变量,请右键单击表示感兴趣簇的树状图中的一个点,然后选择“导出到工作区”。您将获得具有以下字段的结构:

  • GroupNames—包含行或列组名称的文本字符串的单元格数组
  • RowNodeNames—包含行节点名称的文本字符串的单元格数组
  • ColumnNodeNames—包含列节点名称的文本字符串的单元格数组
  • ExprValues-强度值的M×N矩阵,其中M和N分别是行节点数和列节点数

  • 请澄清您的术语
    集群
    ?那是什么?我指的是一组相似的基因,用参数值来衡量相似性。Clustergram是matlab中的一个工具,请给我们一个输入和输出的简短示例?会有帮助的。“还是很模糊。”迪瓦卡希望现在更清楚了:)不,不多。您应该发布更大的样本数据,并解释集群的含义。什么是好集群,什么是坏集群?它们什么时候相似?什么时候它们不相似?只有你知道你的数据。选择一个特定的示例,绘制一幅图像,解释您试图定位的群集等。这可能会有所帮助: