使用R创建一个CSV文件,其内容在指定列中

使用R创建一个CSV文件,其内容在指定列中,r,csv,R,Csv,我正在尝试从现有表在R中创建一个新表。 如需说明,请参见下表: 该查询查看第2列和第3列,并映射发生组合以生成新表的实例 正如您所看到的,没有重复的实例,这是至关重要的。 我试着使用Unique函数来实现这一点,但我还不能很好地计算它来生成这样的CSV输出 如果您是R新手,sqldf包可能会帮助您。有了它,就可以在R中编写sql查询。如果您使用表,这会有所帮助 您的代码,对于您想要执行的操作,将如下所示: install.packages("sqldf") library(sqldf) new

我正在尝试从现有表在R中创建一个新表。 如需说明,请参见下表:

该查询查看第2列和第3列,并映射发生组合以生成新表的实例

正如您所看到的,没有重复的实例,这是至关重要的。
我试着使用Unique函数来实现这一点,但我还不能很好地计算它来生成这样的CSV输出

如果您是R新手,sqldf包可能会帮助您。有了它,就可以在R中编写sql查询。如果您使用表,这会有所帮助

您的代码,对于您想要执行的操作,将如下所示:

install.packages("sqldf")
library(sqldf)
new_table<-sqldf("SELECT Column2, Column3, COUNT(*) as Frequency from old_table group by CONCAT(Column2,Column3)")
write.csv(new_table, "new_table.csv")
install.packages(“sqldf”)
库(sqldf)

新建表格要操作数据,您可以将其放在一个TIBLE中,然后使用
dplyr
语法

library(dplyr)

tibble(col_1=c(14, 5, 7, 688, 56, 565, 674),
       col_2=c("A", "A", "B", "B", "B", "A", "C"),
       col_3=c("C", "C", "D", "D", "D", "A", "D"),
       col_4=c("67rhr", "4gg2", "344g5", "4yy4", "6hthht7", "7ttjty7", "yyuuy")) %>% 
    count(col_2, col_3) %>% 
    rename("frequency"=n)

#   col_2 col_3 frequency
#   <chr> <chr>     <int>
# 1     A     A         1
# 2     A     C         2
# 3     B     D         3
# 4     C     D         1
库(dplyr)
tibble(col_1=c(14,5,7688,5656564),
col_2=c(“A”、“A”、“B”、“B”、“B”、“A”、“c”),
col_3=c(“c”、“c”、“D”、“D”、“D”、“A”、“D”),
列4=c(“67rhr”、“4gg2”、“344g5”、“4yy4”、“6hthht7”、“7ttjty7”、“yyuuy”))%>%
计数(列2,列3)%>%
重命名(“频率”=n)
#第2列第3列频率
#         
#1 A 1
#2 A C 2
#3 B D 3
#4 C D 1
Col1
Col1 <- c(12,5,7,688,56,565,674)
ColA <- c("A","A","B","B","B","A","C")
ColB <- c("C", "C","D", "D", "D", "A", "C")
df = data.frame(Col1, ColA, ColB)
library(dplyr)
result <- select(df, ColA, ColB) %>% 
    group_by(ColA, ColB) %>% 
    summarise(Frequency=n())

write.csv(result, file="somename.csv")