使用dplyr:：mutate计算R中的成对相关性_R_Dplyr_Correlation - Fatal编程技术网

使用dplyr:：mutate计算R中的成对相关性

r

使用dplyr:：mutate计算R中的成对相关性,r,dplyr,correlation,R,Dplyr,Correlation,我有一个很大的数据框，每行上都有足够的数据，可以使用该数据框的特定列计算相关性，并添加一个包含计算出的相关性的新列下面是我想做的一个总结（这一个使用dplyr）：很明显，它不是这样工作的，因为我在pearsoncor专栏中只得到了NA的，有人有什么建议吗？有没有一个简单的方法可以做到这一点最好的几天前我遇到了同样的问题，我知道循环在R中不是最优的，但这是我唯一能想到的： df$r = rep(0,nrow(df)) df$cor_p = rep(0,nrow(df)) for (i i

我有一个很大的数据框，每行上都有足够的数据，可以使用该数据框的特定列计算相关性，并添加一个包含计算出的相关性的新列

下面是我想做的一个总结（这一个使用dplyr）：

很明显，它不是这样工作的，因为我在pearsoncor专栏中只得到了

NA的

，有人有什么建议吗？有没有一个简单的方法可以做到这一点

最好的

几天前我遇到了同样的问题，我知道循环在R中不是最优的，但这是我唯一能想到的：

df$r = rep(0,nrow(df))
df$cor_p = rep(0,nrow(df))

for (i in 1:nrow(df)){
  ct = cor.test(as.numeric(df[i,cols_A]),as.numeric(df[i,cols_B]))
df$r[i] = ct$estimate
df$cor_p[i] = ct$p.value
}

几天前我也遇到过同样的问题，我知道循环在R中不是最优的，但这是我唯一能想到的：

df$r = rep(0,nrow(df))
df$cor_p = rep(0,nrow(df))

for (i in 1:nrow(df)){
  ct = cor.test(as.numeric(df[i,cols_A]),as.numeric(df[i,cols_B]))
df$r[i] = ct$estimate
df$cor_p[i] = ct$p.value
}

下面是一个解决方案，它使用

restrape2

包将数据帧分解为长格式，这样每个值都有自己的行。原始的宽格式数据对于6个基因中的每一个每行有60个值，而熔化的长格式数据框有360行，每个值一行。然后我们可以很容易地使用

dplyr

中的

summary（）

来计算无循环的相关性

library(reshape2)
library(dplyr)

names1 <- names(example_data)[4:33]
names2 <- names(example_data)[34:63]

example_data_longform <- melt(example_data, id.vars = c('Gene','clusterFR','clusterHR'))

example_data_longform %>%
  group_by(Gene, clusterFR, clusterHR) %>%
  summarize(pearsoncor = cor(x = value[variable %in% names1],
                             y = value[variable %in% names2]))

这将输出一个TIBLE，其中

cor

列是每个基因的

cor.test（）

结果列表。我们可以使用

lappy（）

从列表中提取输出

lapply(detailed_r$cor, function(x) c(x$estimate, x$p.value))

下面是一个解决方案，它使用

restrape2

包将数据帧分解为长格式，这样每个值都有自己的行。原始的宽格式数据对于6个基因中的每一个每行有60个值，而熔化的长格式数据框有360行，每个值一行。然后我们可以很容易地使用

dplyr

中的

summary（）

来计算无循环的相关性

library(reshape2)
library(dplyr)

names1 <- names(example_data)[4:33]
names2 <- names(example_data)[34:63]

example_data_longform <- melt(example_data, id.vars = c('Gene','clusterFR','clusterHR'))

example_data_longform %>%
  group_by(Gene, clusterFR, clusterHR) %>%
  summarize(pearsoncor = cor(x = value[variable %in% names1],
                             y = value[variable %in% names2]))

这将输出一个TIBLE，其中

cor

列是每个基因的

cor.test（）

结果列表。我们可以使用

lappy（）

从列表中提取输出

lapply(detailed_r$cor, function(x) c(x$estimate, x$p.value))

使用tidyr，您可以分别收集要比较的所有x和y变量。您将获得一个TIBLE，其中包含您提供的每个组合的相关系数及其p值

library(dplyr)
library(tidyr)

example_data %>%
  gather(x_var, x_val, X001_F5_000_A:X030_F5_480_C) %>% 
  gather(y_var, y_val, X031_H5_000_A:X060_H5_480_C) %>% 
  group_by(x_var, y_var) %>% 
  summarise(cor_coef = cor.test(x_val, y_val)$estimate,
            p_val = cor.test(x_val, y_val)$p.value)

几年后编辑、更新：

library(tidyr)
library(purrr)
library(broom)
library(dplyr)

longley %>%
  pivot_longer(GNP.deflator:Armed.Forces, names_to="x_var", values_to="x_val") %>% 
  pivot_longer(Population:Employed, names_to="y_var", values_to="y_val") %>% 
  nest(data=c(x_val, y_val)) %>%
  mutate(cor_test = map(data, ~cor.test(.x$x_val, .x$y_val)),
         tidied = map(cor_test, tidy)) %>% 
  unnest(tidied)

使用tidyr，您可以分别收集要比较的所有x和y变量。您将获得一个TIBLE，其中包含您提供的每个组合的相关系数及其p值

library(dplyr)
library(tidyr)

example_data %>%
  gather(x_var, x_val, X001_F5_000_A:X030_F5_480_C) %>% 
  gather(y_var, y_val, X031_H5_000_A:X060_H5_480_C) %>% 
  group_by(x_var, y_var) %>% 
  summarise(cor_coef = cor.test(x_val, y_val)$estimate,
            p_val = cor.test(x_val, y_val)$p.value)

几年后编辑、更新：

library(tidyr)
library(purrr)
library(broom)
library(dplyr)

longley %>%
  pivot_longer(GNP.deflator:Armed.Forces, names_to="x_var", values_to="x_val") %>% 
  pivot_longer(Population:Employed, names_to="y_var", values_to="y_val") %>% 
  nest(data=c(x_val, y_val)) %>%
  mutate(cor_test = map(data, ~cor.test(.x$x_val, .x$y_val)),
         tidied = map(cor_test, tidy)) %>% 
  unnest(tidied)

它不会工作，因为你没有正确地使用它。请尝试

diag（cor（t（example_data[columnnames]）、t（example_data[columnnames]））

或使用

purrrmap2_dbl（as.data.frame（t（example_data[columnnames]）、as.data.frame（t（example_data[columnnames]）、cor来回答我建议您复习一下您的问题，并试着回答一下。我认为这更像是一个统计问题，而不是为你编写一个。它不会起作用，因为你没有正确地使用它。请尝试diag（cor（t（example_data[columnnames]）、t（example_data[columnnames]））
或使用purrrmap2_dbl（as.data.frame（t（example_data[columnnames]）、as.data.frame（t（example_data[columnnames]）、cor来回答我建议您复习一下您的问题，并试着回答一下。我认为这对你来说更像是一个统计问题，而不是编码问题。非常感谢Eudald，我在寻找有效解决方案时使用了类似的循环作为解决方法。使用我的数据集，循环大约需要5分钟才能完成：-/抓取一杯咖啡的完美时间；-）（我会试着想出更有效的方法！）非常感谢Eudald，我在寻找有效的解决方案时使用了类似的循环作为解决方法。使用我的数据集，循环大约需要5分钟才能完成：-/抓取一杯咖啡的完美时间；-）（我会想一些更有效的方法！）是否有一种方法可以只调用一次cor.test
函数，然后使用$
评估它们的值？使用purr的map（）和broom的tidy（）函数确实是可能的。请参见回答的编辑是否有方法只调用一次cor.test
函数，然后使用$
评估它们的值？使用purr的map（）和broom的tidy（）函数确实是可能的。请参见答案的编辑




[dart]相关文章推荐



                                                        
如何使用反射（镜像）访问Dart类中的方法名？
dart 
按位操作，错误结果为Dart2Js
dart 
Polymer.dart：对子组件使用强类型引发异常，var有效
dartpolymer 
Dart 仅使用一个工厂构造函数扩展类
dart 
Dart 将值从登录表单传递到仪表板
dart 
Dart HttpRequest&&引用；内置库'；dart:io'；在Dartium上不可用；
dart 
Dart 是什么原因导致这款聚合物镖在Safari和Chrome中表现不好？
dart 
Dart 可重复使用的省道代码/角省道组件
dart 
Dart 如何从常量对象获取值？
dart 
Dart 对DeclarationMirror类型的访问
dart 
Dart 颤振
dartflutter 
将Dart 2映射动态转换为Javascript对象
dart 
Dart 颤振/图形ql-以自定义类型为参数的变异
dartfluttergraphql 
Dart 如何在flatter中的小部件中创建内部循环？
dartflutter 
Dart 为什么2.0（数字2.0）同时是double和int？
dart 
Dart 如何更改TextField中图标颜色的颜色？
dartflutter 
dart根访问的最佳实践
dartpath 
如何在Dart中循环遍历变量数组
字符串A=null；
字符串B=null；
var C=List（）；
...
dart 
Dart 飞镖投错了类型？
dart 
Dart 找不到名为“的命令”；“开发工具”；
dart 
                                       





随机文章推荐



                                                        
关于安全修改/自定义Wordpress主题标题的建议
wordpress 
扩展Wordpress永久链接以创建虚拟页面和文件夹
wordpressdynamic 
创建wordpress开发环境并上传到生产环境
wordpress 
将WordPress从子目录移动到根目录
wordpress 
如何在wordpress插件-'中向bbp_topics（）传递参数；bbpress&x27；
wordpress 
Wordpress 限制通过IP访问Nginx上的文件和目录
wordpressnginx 
Wordpress 是否选中“发送到不同地址”复选框的反向行为？
wordpresswoocommerce 
404从服务器导出wordpress数据库并导入到本地服务器时出错
wordpress 
将WordPress从本地迁移到实时错误
wordpress 
WordPress自定义页面集成在不同的菜单中。
wordpressmenu 
Wordpress 获取一个边栏小部件，显示Woocommerce中相同类别的产品
wordpresswoocommerce 
Wordpress 如何重定向http://http://www 及https://www 到https://using.htaccess
wordpressapache.htaccessredirectmod-rewrite 
从WordPress主题中删除隐藏的div标记
wordpress 
Wordpress 来自WooCommerce的管理员通知无效，客户通知无效
wordpressemailwoocommerce 
Wordpress '；安装失败：无法创建目录；我每次尝试下载WP4.8中的插件时都会遇到这个错误
wordpresspluginsinstallation 
Centos 7上的Wordpress权限噩梦
wordpress 
Wordpress-只列出网站上使用的图片的插件？
wordpressimageimage-processingplugins 
Wordpress 如何在get_用户查询中按超级管理员进行搜索？
wordpress 
如何使用index.php解决Wordpress问题
wordpress 
Wordpress自定义post类型存储为序列化数组格式
wordpress


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R 使用镶嵌面网格隐藏垂直轴
									R
							 
R 防止线条在图例中出现两次
									R
							 									Plot
							 
R系统命令
									R
							 									Bash
							 
R 检查特征值是否等于实数的不同方法？
									R
							 
R 操作具有公共字段的两个数据帧
									R
							 									Merge
							 									Dataframe
							 
R 如何在我的数据框中每个id每月计算change_标志
									R
							 
R 多组镶嵌面网格上的错误条
									R
							 
如何使用最新版本的RDCOMClient从outlook发送邮件？
									R
							 									Email
							 									Outlook
							 									Shiny
							 
R 如何使用Box-cox传输数据？
									R
							 
用户定义的匹配项，用于在R中计算尾撑距离
									R
							 									Function
							 
R 无法将列值带到行名称
									R
							 
r为什么光栅提取会产生暗度误差？
									R
							 
R-绘制时间序列数据时的未解释峰值
									R
							 
使用caretEnsemble创建集合模型时出错
									R
							 
R 如何允许用户在数据表中将表内容编辑为全新的值（例如，从数字到文本）
									R
							 									Shiny
							 
R 如何用paste（）中的空格替换NAs？
									R
							 
在不忽略其他变量的情况下，获取某些变量的data.frame中的交集
									R
							 
R 将xts对象与字符输入合并而不获取NAs
									R
							 									Merge
							 
R 为什么difftime（）在计算日期之间的时差时返回0？
									R
							 
在R中制作多个模型（尝试各种参数）而不使用for循环
									R
							 									Loops
							 
R 删除作为较大字符串子集的字符串行
									R
							 
在R Studio中尝试按地区分组数据并按日期汇总有关COVID19流行病的数据
									R
							 									Filter
							 
R中的Matlab函数uint8
									R
							 									Matlab
							 									Binary
							 
如何使用lappy引导？R中boot（）的引导错误
									R
							 
手工计算岭回归解（矩阵形式）[r]
									R
							 
R 对GLMM使用confint（）估计CI会导致zetafun中的错误（np，ns）
									R
							 
R 如何在一个绘图中绘制4个烛台图表？
									R
							 
在零假设为H0=b1+的情况下，如何在R中运行回归模型；b4=0？
									R
							 
使用R中的置换值从模型中获取摘要统计信息
									R
							 
R 有没有想过如何解析这个文本文件以获得数据帧？
									R
							 									Dataframe
							 									Parsing
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Object
Download
Swagger
Swiftui
Swift
Msbuild
Caching
Types
Hazelcast
Pine Script
Processing
File Upload
Actions On Google
Azure Devops
Antlr4
Sql Server
C# 4.0
Timer
Ignite
Xpages
Solr
Ibm Mq
Azure Sql Database
Automated Tests
Anaconda
Ember.js
Gps
Nosql
Vb6
Formatting
Teradata
Linux Kernel
Zend Framework2
Asterisk
Flask
Elm
Pagination
Sql Server 2008
Scrapy
Http
Vaadin
Maven
Colors
Hybris
Youtube
Sharepoint
Gdb
Ruby On Rails 3.1
Sphinx
Reactjs
Vagrant
Listview
Nlp
Socket.io
Python
Oracle
Graphql
Xquery
Zend Framework
Sublimetext2
Jsf 2
Couchdb
Pentaho
Swing
Odoo
Wso2
Acumatica
Amp Html
Log4j
Jestjs
Sql
Cors
Crystal Reports
Next.js
Plot
Nservicebus
Jdbc
Silverstripe
Yocto
Data Binding
Sql Server 2008 R2
Moodle
Pandas
Xampp
Jmeter
Udp
Gremlin
Svg
Testng
Itext
Scheme
Active Directory
Operating System
Openlayers 3
Mono
Cmd
Permissions
Dom
Cuda
Tableau Api
Prometheus
View
Mips
Aframe
Content Management System
Autocomplete
Google Chrome Extension
Ide
Iphone
Google App Maker
Log4net
Actionscript 3
Azure Data Factory
Oauth 2.0
Npm
Vb.net
Configuration
Google Apps Script
Jms
Embedded
Fonts
Neo4j
Excel Formula
Openssl
Websphere
Mule
Scikit Learn
Couchbase
Sprite Kit
Webview
Url
Multithreading
Join
Erlang
Openerp
Primefaces
Libgdx
Ms Office
Orm
Visual Studio 2013
Ruby On Rails 3
Windows Phone
Streaming
Directx
Xna
Latex
Qt
Twig
Sqlalchemy
Optimization
Ssis
Version Control
Air
Omnet++
Arduino
Bazel
For Loop
Asp.net Core Mvc
Openstack
Ssh
Sas
Gstreamer
Redux
Apache Zookeeper
Windows Phone 7
Gcc
Api
Glsl
Robotframework
Windows Phone 8
Mapping
Doctrine Orm
Laravel 5
Docusignapi
Methods
Orchardcms
Sdk
Sparql
Mapreduce
Linker
Typo3
Testing
Tcl
R
Search
Mvvm
Maps
Ldap
EmptyTag
Angularjs
Jira
Sharepoint 2007
Rust
Stm32
Visual Studio 2012
Arrays
Canvas
.net 4.0
C++11
Cron
Google Maps Api 3


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网