R语言中非结构化数据的处理
PSA:我不确定这是否属于主题/属于meta 新用户经常在控制台中打印的版本中发布代码,例如 “这是我的数据:” 据我所知,这通常是一种痛苦或不可能重现我是否缺少一种将非结构化数据转换为可复制数据的明显方式?(除了要求用户输出数据之外) 如果不是,我想考虑创建一个这样的软件包。下面是这样一个包中存在的函数的不可靠、不健壮的示例R语言中非结构化数据的处理,r,structure,R,Structure,PSA:我不确定这是否属于主题/属于meta 新用户经常在控制台中打印的版本中发布代码,例如 “这是我的数据:” 据我所知,这通常是一种痛苦或不可能重现我是否缺少一种将非结构化数据转换为可复制数据的明显方式?(除了要求用户输出数据之外) 如果不是,我想考虑创建一个这样的软件包。下面是这样一个包中存在的函数的不可靠、不健壮的示例 Dump_to_DF<-function(dump){ test<-regmatches(dump , gregexpr(".*\n|.*$", dump,
Dump_to_DF<-function(dump){
test<-regmatches(dump
, gregexpr(".*\n|.*$",
dump, perl=TRUE))
test2<-unlist(test)
test3<-strsplit(test2, split="\\s+",perl = T)
len<-length(test3)
test5<-list()
for(i in 2:len){
test4<-unlist(test3[[i]])
test5[[i]]<-test4[-1]
}
test5<-test5[-1]
Fin_Data<-do.call(rbind.data.frame, test5)
names(Fin_Data)<-test3[[1]]
return(Fin_Data)
}
data<-"Num Data
1 1 A
2 2 B
3 3 C
4 4 D
5 5 E"
Data<-Dump_to_DF(data)
> Data
Num Data
1 1 A
2 2 B
3 3 C
4 4 D
5 5 E
Dump_to_DF您给出的一种读取数据的方法如下:
data <- read.table(text="Num Data
1 1 A
2 2 B
3 3 C
4 4 D
5 5 E")
数据您可以使用read.table(text=“Num data 1 1 A 2 B 3 C 4 D 5 E”)
,这将起作用(注释不保留格式,但将问题复制/粘贴到read.table
通常起作用fine@RAB“我是不是漏掉了什么明显的东西?”正如你所指出的,答案是肯定的。请在你有机会时作为答案发布。添加为答案否:)
data <- read.table(text="Num Data
1 1 A
2 2 B
3 3 C
4 4 D
5 5 E")