R 子集中两组之间的最短欧氏距离
我有一个较大的数据框(50000个点),表示从生物图像中采集的2D点。点被分类为红色或绿色,并在组中相互关联(在示例中:单元格A-D)。可以找到一个小的测试数据集(MSR_test.csv)R 子集中两组之间的最短欧氏距离,r,plyr,R,Plyr,我有一个较大的数据框(50000个点),表示从生物图像中采集的2D点。点被分类为红色或绿色,并在组中相互关联(在示例中:单元格A-D)。可以找到一个小的测试数据集(MSR_test.csv) require(ggplot2) cells我不认为有任何理由使用plyr,但也许我错了。 下面的代码适用于您的示例。我没有使用任何重函数来计算欧几里德距离,主要是因为你可能需要在很多点上计算它 green <- subset(cells, channel=="Green") red <- su
require(ggplot2)
cells我不认为有任何理由使用plyr
,但也许我错了。
下面的代码适用于您的示例。我没有使用任何重函数来计算欧几里德距离,主要是因为你可能需要在很多点上计算它
green <- subset(cells, channel=="Green")
red <- subset(cells, channel=="Red")
fun_dist <- function(a, M) rowSums( (M - matrix(1,nrow(M),1) %*% as.numeric(a))**2 )
foo <- function(greenrow, matred) {
subred <- subset(matred, cell == greenrow["cell"], select=c("X","Y"))
minred <- subred[ which.min(fun_dist(unlist(greenrow[c("X","Y")]),subred)), ]
return(minred)
}
data.frame( "rbind", apply(green, 1, foo, red) )
green是否可以使用apply
函数提取各种分组子集,并依次对每个分组子集运行rdist
,存储所需的距离?
green <- subset(cells, channel=="Green")
red <- subset(cells, channel=="Red")
fun_dist <- function(a, M) rowSums( (M - matrix(1,nrow(M),1) %*% as.numeric(a))**2 )
foo <- function(greenrow, matred) {
subred <- subset(matred, cell == greenrow["cell"], select=c("X","Y"))
minred <- subred[ which.min(fun_dist(unlist(greenrow[c("X","Y")]),subred)), ]
return(minred)
}
data.frame( "rbind", apply(green, 1, foo, red) )