使用R创建一个CSV文件，其内容在指定列中_R_Csv

使用R创建一个CSV文件，其内容在指定列中

r csv

使用R创建一个CSV文件，其内容在指定列中,r,csv,R,Csv,我正在尝试从现有表在R中创建一个新表。如需说明，请参见下表：该查询查看第2列和第3列，并映射发生组合以生成新表的实例正如您所看到的，没有重复的实例，这是至关重要的。我试着使用Unique函数来实现这一点，但我还不能很好地计算它来生成这样的CSV输出如果您是R新手，sqldf包可能会帮助您。有了它，就可以在R中编写sql查询。如果您使用表，这会有所帮助您的代码，对于您想要执行的操作，将如下所示： install.packages("sqldf") library(sqldf) new

我正在尝试从现有表在R中创建一个新表。如需说明，请参见下表：

该查询查看第2列和第3列，并映射发生组合以生成新表的实例

正如您所看到的，没有重复的实例，这是至关重要的。

我试着使用Unique函数来实现这一点，但我还不能很好地计算它来生成这样的CSV输出

如果您是R新手，sqldf包可能会帮助您。有了它，就可以在R中编写sql查询。如果您使用表，这会有所帮助

您的代码，对于您想要执行的操作，将如下所示：

install.packages("sqldf")
library(sqldf)
new_table<-sqldf("SELECT Column2, Column3, COUNT(*) as Frequency from old_table group by CONCAT(Column2,Column3)")
write.csv(new_table, "new_table.csv")

install.packages（“sqldf”）
库（sqldf）
新建表格要操作数据，您可以将其放在一个TIBLE中，然后使用dplyr
语法
library(dplyr)

tibble(col_1=c(14, 5, 7, 688, 56, 565, 674),
       col_2=c("A", "A", "B", "B", "B", "A", "C"),
       col_3=c("C", "C", "D", "D", "D", "A", "D"),
       col_4=c("67rhr", "4gg2", "344g5", "4yy4", "6hthht7", "7ttjty7", "yyuuy")) %>% 
    count(col_2, col_3) %>% 
    rename("frequency"=n)

#   col_2 col_3 frequency
#   <chr> <chr>     <int>
# 1     A     A         1
# 2     A     C         2
# 3     B     D         3
# 4     C     D         1

库（dplyr）
tibble（col_1=c（14,5,7688,5656564），
col_2=c（“A”、“A”、“B”、“B”、“B”、“A”、“c”），
col_3=c（“c”、“c”、“D”、“D”、“D”、“A”、“D”），
列4=c（“67rhr”、“4gg2”、“344g5”、“4yy4”、“6hthht7”、“7ttjty7”、“yyuuy”））%>%
计数（列2，列3）%>%
重命名（“频率”=n）
#第2列第3列频率
#         
#1 A 1
#2 A C 2
#3 B D 3
#4 C D 1
Col1
Col1 <- c(12,5,7,688,56,565,674)
ColA <- c("A","A","B","B","B","A","C")
ColB <- c("C", "C","D", "D", "D", "A", "C")
df = data.frame(Col1, ColA, ColB)
library(dplyr)
result <- select(df, ColA, ColB) %>% 
    group_by(ColA, ColB) %>% 
    summarise(Frequency=n())

write.csv(result, file="somename.csv")