在R中分析CSV数据
我有如下CSV数据:在R中分析CSV数据,r,csv,R,Csv,我有如下CSV数据: code, label, value ABC, len, 10 ABC, count, 20 ABC, data, 102 ABC, data, 212 ABC, data, 443 ... XYZ, len, 11 XYZ, count, 25 XYZ, data, 782 ... 每个代码的数据条目数不同。这与我的问题无关;我只是想指出这一点 我需要分析每个代码的数据条目。这将包括计算中位数、绘制图表等。这意味着我
code, label, value
ABC, len, 10
ABC, count, 20
ABC, data, 102
ABC, data, 212
ABC, data, 443
...
XYZ, len, 11
XYZ, count, 25
XYZ, data, 782
...
每个代码的数据条目数不同。这与我的问题无关;我只是想指出这一点
我需要分析每个代码的数据条目。这将包括计算中位数、绘制图表等。这意味着我应该分离出每个代码的数据,并使其成为数字
有没有比这更好的方法
x = read.csv('dataFile.csv, header=T)
...
median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value))
boxplot(median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value)))
split and list2env允许您为每个代码分离data.frame x,为代码中的每个级别生成一个data.frame:
或者只是
my.list <- split(x, x$code)
如果您喜欢使用列表。我不确定我是否完全理解您问题的最终目的,您是否只想了解一些您可以做的事情?因为有很多可能的解决方案 当你问:我需要分析每个代码的数据条目。这将包括计算中位数、绘制图表等。这意味着我应该分离出每个代码的数据,并使其成为数字 答案是否定的,严格来说你不必这么做。您可以使用为您执行此任务的R函数,例如:
x = read.csv('dataFile.csv', header=T)
#is it numeric?
class(x$value)
# if it is already numeric you shouldn't have to convert it,
# if it strictly numeric I don't know any reason why it
# should be read as strings but it happens.
aggregate(x,by=list(x$code),FUN="median")
boxplot(value~code,data=x)
# and you can do ?boxplot to look into its options.
R有许多不同的组或应用类型函数。请看这个问题开始:是的,我正在寻找关于如何轻松使用数据结构的建议/指针。
x = read.csv('dataFile.csv', header=T)
#is it numeric?
class(x$value)
# if it is already numeric you shouldn't have to convert it,
# if it strictly numeric I don't know any reason why it
# should be read as strings but it happens.
aggregate(x,by=list(x$code),FUN="median")
boxplot(value~code,data=x)
# and you can do ?boxplot to look into its options.