在R中分析CSV数据

在R中分析CSV数据,r,csv,R,Csv,我有如下CSV数据: code, label, value ABC, len, 10 ABC, count, 20 ABC, data, 102 ABC, data, 212 ABC, data, 443 ... XYZ, len, 11 XYZ, count, 25 XYZ, data, 782 ... 每个代码的数据条目数不同。这与我的问题无关;我只是想指出这一点 我需要分析每个代码的数据条目。这将包括计算中位数、绘制图表等。这意味着我

我有如下CSV数据:

 code, label, value
 ABC,  len,   10
 ABC,  count, 20
 ABC,  data,  102
 ABC,  data,  212
 ABC,  data,  443
 ...
 XYZ,  len,   11
 XYZ,  count, 25
 XYZ,  data,  782
 ...
每个代码的数据条目数不同。这与我的问题无关;我只是想指出这一点

我需要分析每个代码的数据条目。这将包括计算中位数、绘制图表等。这意味着我应该分离出每个代码的数据,并使其成为数字

有没有比这更好的方法

 x = read.csv('dataFile.csv, header=T)
 ...
 median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value))
 boxplot(median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value)))
split and list2env允许您为每个代码分离data.frame x,为代码中的每个级别生成一个data.frame:

或者只是

my.list <- split(x, x$code)

如果您喜欢使用列表。

我不确定我是否完全理解您问题的最终目的,您是否只想了解一些您可以做的事情?因为有很多可能的解决方案

当你问:我需要分析每个代码的数据条目。这将包括计算中位数、绘制图表等。这意味着我应该分离出每个代码的数据,并使其成为数字

答案是否定的,严格来说你不必这么做。您可以使用为您执行此任务的R函数,例如:

x = read.csv('dataFile.csv', header=T)

#is it numeric?
class(x$value)
# if it is already numeric you shouldn't have to convert it,
# if it strictly numeric I don't know any reason why it 
# should be read as strings but it happens.

aggregate(x,by=list(x$code),FUN="median")

boxplot(value~code,data=x)
# and you can do ?boxplot to look into its options. 

R有许多不同的组或应用类型函数。请看这个问题开始:是的,我正在寻找关于如何轻松使用数据结构的建议/指针。
x = read.csv('dataFile.csv', header=T)

#is it numeric?
class(x$value)
# if it is already numeric you shouldn't have to convert it,
# if it strictly numeric I don't know any reason why it 
# should be read as strings but it happens.

aggregate(x,by=list(x$code),FUN="median")

boxplot(value~code,data=x)
# and you can do ?boxplot to look into its options.