Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/78.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 在识别数据集中的其他字段时可视化字段的唯一性_R_Data Visualization - Fatal编程技术网

R 在识别数据集中的其他字段时可视化字段的唯一性

R 在识别数据集中的其他字段时可视化字段的唯一性,r,data-visualization,R,Data Visualization,我有一个数据可视化问题。 我的数据如下:{intx,inty,字符串a,字符串b,…} 我想想象一下{x,y}唯一识别{a,b}的能力。 也就是说,如果x,y是已知的,那么通常有1个,有时只有a,b的几个可能的组合。我知道在我的数据中是这样的,但我想在可视化中显示。假设记录数约为5000条,最好的方法是什么 Here are a few lines of this data 2320,1190,T,a 3051,1680,i,a 3099,1495,N,v 3395,1475,C,v 3395,

我有一个数据可视化问题。 我的数据如下:{intx,inty,字符串a,字符串b,…}

我想想象一下{x,y}唯一识别{a,b}的能力。 也就是说,如果x,y是已知的,那么通常有1个,有时只有a,b的几个可能的组合。我知道在我的数据中是这样的,但我想在可视化中显示。假设记录数约为5000条,最好的方法是什么

Here are a few lines of this data
2320,1190,T,a
3051,1680,i,a
3099,1495,N,v
3395,1475,C,v
3395,1475,C,c
3400,1480,C,a
3405,1615,A,a
3430,1630,1f,a
3440,1480,C1,d
3440,1640,C1,e
3450,1640,u,lk

也许这就是你要找的东西。从这里,您可以切分出非唯一的条目

require(ggplot2)

df <- read.table(file="clipboard", sep=",",             #Read in your data
               header=F, skip = 1, stringsAsFactors = F)

df$key <- with(df, paste0(V1, V2))                      #Make Key from {x,y}
Counts <- as.data.frame(xtabs(~key, data = df))         #Get counts for {x,y} pairs

df_merge <- merge(df, Counts, by = "key", all.x =T)        #Merge the Tables by Key
df_merge$Unique <- ifelse(df_merge$Freq == 1, "Yes", "No") #Unique Yes or No

qplot(data = df_merge, x = V1, y = V2, color = Unique, geom = "point") #Plot
require(ggplot2)

df你能分享你数据集的前几行吗?我编辑了这篇文章来显示数据和字段的顺序。