r表列出了多个具有频率的分类变量库（“tidyverse”）图书馆（“papaja”） df% 在（c（“性别”、“第一次创始人”）、列表（~因子（））%%>%处进行变异突变（性别=因子（如果其他（性别=1，“男性”，“女性”））%>% 变异（第一次创始人d=因子（如果其他（第一次创始人d==1，“是”、“否”））%>% 变异（投资类型=因子（ifelse（投资类型=“天使”、“天使”、ifelse（投资类型=“预种子”、“预种子”、“种子”））））%>% 下拉菜单（）%>% 摘要（）%>% as.data.frame（） #清理柱子 df% 选择（-Var1）%>% 重命名（变量=Var2，N=Freq）%>% 变异（变量=因子）（ifelse（变量==“投资类型”、“投资类型”、ifelse（变量==“状态代码组织”、“状态”、ifelse（str_-detect（变量，“性别”）、“性别”、“首次创始人”]）%>% 滴_na（） #将N分为level和N df% 分离（col=N，into=c（“级别”，“N”），sep=“：”） #删除值中的空白 df% 变异( 变量=trimws（变量））%>% 变异( 级别=trimws（级别））%>% 变异( N=trimws（N）） #将N转换为整数 df% 变异（N=as.integer（N）） df% 分组依据（变量）%>% 排列（变量，描述（N）） apa_表( df， #存根缩进=列表（“1”、“2”）， caption=“分类变量摘要”，注意=“未显示缺失的数据。”）_R_R Markdown_Papaja

r表列出了多个具有频率的分类变量库（“tidyverse”）图书馆（“papaja”） df% 在（c（“性别”、“第一次创始人”）、列表（~因子（））%%>%处进行变异突变（性别=因子（如果其他（性别=1，“男性”，“女性”））%>% 变异（第一次创始人d=因子（如果其他（第一次创始人d==1，“是”、“否”））%>% 变异（投资类型=因子（ifelse（投资类型=“天使”、“天使”、ifelse（投资类型=“预种子”、“预种子”、“种子”））））%>% 下拉菜单（）%>% 摘要（）%>% as.data.frame（） #清理柱子 df% 选择（-Var1）%>% 重命名（变量=Var2，N=Freq）%>% 变异（变量=因子）（ifelse（变量==“投资类型”、“投资类型”、ifelse（变量==“状态代码组织”、“状态”、ifelse（str_-detect（变量，“性别”）、“性别”、“首次创始人”]）%>% 滴_na（） #将N分为level和N df% 分离（col=N，into=c（“级别”，“N”），sep=“：”） #删除值中的空白 df% 变异( 变量=trimws（变量））%>% 变异( 级别=trimws（级别））%>% 变异( N=trimws（N）） #将N转换为整数 df% 变异（N=as.integer（N）） df% 分组依据（变量）%>% 排列（变量，描述（N）） apa_表( df， #存根缩进=列表（“1”、“2”）， caption=“分类变量摘要”，注意=“未显示缺失的数据。”）

r表列出了多个具有频率的分类变量库（“tidyverse”）图书馆（“papaja”） df% 在（c（“性别”、“第一次创始人”）、列表（~因子（））%%>%处进行变异突变（性别=因子（如果其他（性别=1，“男性”，“女性”））%>% 变异（第一次创始人d=因子（如果其他（第一次创始人d==1，“是”、“否”））%>% 变异（投资类型=因子（ifelse（投资类型=“天使”、“天使”、ifelse（投资类型=“预种子”、“预种子”、“种子”））））%>% 下拉菜单（）%>% 摘要（）%>% as.data.frame（） #清理柱子 df% 选择（-Var1）%>% 重命名（变量=Var2，N=Freq）%>% 变异（变量=因子）（ifelse（变量==“投资类型”、“投资类型”、ifelse（变量==“状态代码组织”、“状态”、ifelse（str_-detect（变量，“性别”）、“性别”、“首次创始人”]）%>% 滴_na（） #将N分为level和N df% 分离（col=N，into=c（“级别”，“N”），sep=“：”） #删除值中的空白 df% 变异( 变量=trimws（变量））%>% 变异( 级别=trimws（级别））%>% 变异( N=trimws（N）） #将N转换为整数 df% 变异（N=as.integer（N）） df% 分组依据（变量）%>% 排列（变量，描述（N）） apa_表( df， #存根缩进=列表（“1”、“2”）， caption=“分类变量摘要”，注意=“未显示缺失的数据。”）,r,r-markdown,papaja,R,R Markdown,Papaja,这是我现在得到的我对使用任何软件包都持开放态度——这碰巧是使用papaja。但它需要在带有PDF输出的rmarkdown中工作，并符合APA风格我希望该表折叠变量值，使它们不会重复多次，并将状态（其他）移动到状态分组的底部。例如，类似以下内容（不同的数据集）：您可以尝试该软件包（尚未在CRAN上） #devtools:：install_github（“rstudio/gt”）图书馆（gt） df%>% 变异（`%`=scales:：percent（N/sum（N），1））%>% gt（

这是我现在得到的

我对使用任何软件包都持开放态度——这碰巧是使用papaja。但它需要在带有PDF输出的rmarkdown中工作，并符合APA风格

我希望该表折叠变量值，使它们不会重复多次，并将状态（其他）移动到状态分组的底部。例如，类似以下内容（不同的数据集）：

您可以尝试该软件包（尚未在CRAN上）

#devtools:：install_github（“rstudio/gt”）
图书馆（gt）
df%>%
变异（`%`=scales:：percent（N/sum（N），1））%>%
gt（）%>%
制表符标题(
title=“分类变量摘要。”
) %>%    
选项卡\u来源\u注释(
source_note=md（“*缺少的数据未显示。*”）
)

这是HTML格式副本。它使用

dplyr

的组来确定行分组

repo和RTF都表示，它支持HTML格式的输出，并计划在将来使用LaTeX和RTF，但在某种程度上是可行的

df%>%
变异（`%`=scales:：percent（N/sum（N），1））%>%
gt（）%>%
#制表符标题(
#title=“分类变量摘要”，subtitle=“”
# ) %>%    
选项卡\u来源\u注释(
source_note=md（“*缺少的数据未显示。*”）
) %>%
as_乳胶（）

tab\u header

和latex output（）有一个bug，看起来

tab\u source\u note

可能也有点歪斜

我重新安排了一些事情，并能够得到这个，虽然我相信这并不完全是你想要的。（这表明副标题中的任何非空白都允许

选项卡标题

起作用，但

“

”——任何数量的空格——都不起作用。）

df%>%
变异（`%`=scales:：percent（N/sum（N），1））%>%
gt（）%>%
制表符标题(
title=“分类变量摘要。”，
subtitle=md（“*缺少的数据未显示。*”）
) %>%    
as_乳胶（）

我认为这是一个简单的解决方案：

library("tidyverse")
library("papaja")

df <- structure(list(investment_type = structure(c(3L, 3L, 3L, 3L, 
3L, 3L, 3L, 1L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L, 3L, 
3L), .Label = c("angel", "pre_seed", "seed"), class = "factor"), 
    gender_d = c(1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 
    1, 1, 1, 1, 0, 1), state_code_org = structure(c(3L, 22L, 
    3L, 15L, 3L, 4L, 3L, 3L, 22L, 3L, 29L, 25L, 8L, 29L, 10L, 
    6L, 22L, 4L, 17L, 23L, 17L), .Label = c("AL", "AR", "CA", 
    "CO", "CT", "DC", "DE", "FL", "GA", "IL", "KS", "LA", "MA", 
    "MD", "MN", "MO", "NC", "NE", "NH", "NJ", "NV", "NY", "OH", 
    "OR", "PA", "RI", "SC", "TN", "TX", "UT", "VA", "VT", "WA", 
    "WI", "WY"), class = "factor"), first_time_founder_d = c(0, 
    1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, NA, 1, 0, 0, 1, 
    0)), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, 
-21L))

df <- df %>%
  select(investment_type,
         state_code_org,
         gender_d,
         first_time_founder_d) %>%
  mutate_at(c("gender_d", "first_time_founder_d"), list(~ factor(.))) %>%
  mutate(gender_d=factor(ifelse(gender_d==1, "Male", "Female"))) %>%
  mutate(first_time_founder_d=factor(ifelse(first_time_founder_d==1, "Yes", "No"))) %>%
  mutate(investment_type=factor(ifelse(investment_type=="angel", "Angel", ifelse(investment_type=="pre_seed", "Pre-Seed", "Seed")))) %>%
  drop_na() %>%
  summary() %>%
  as.data.frame()

# Clean up columns
df <- df %>%
  select(-Var1) %>%
  rename(Variable=Var2, N=Freq) %>%
  mutate(Variable=factor(ifelse(Variable=="investment_type", "Investment Type", ifelse(Variable=="state_code_org", "State", ifelse(str_detect(Variable, "gender_d"), "Gender", "First-Time Founder"))))) %>%
  drop_na()

# break N into level and N
df <- df %>%
  separate(col = N, into = c("Level", "N"), sep = ":")

# Remove white space in values
df <- df %>% 
  mutate(
    Variable=trimws(Variable)) %>%
  mutate(
    Level=trimws(Level)) %>%
  mutate(
    N=trimws(N))

# Convert N to integer
df <- df %>% 
  mutate(N=as.integer(N))

df <- df %>% 
  group_by(Variable) %>% 
  arrange(Variable, desc(N))

apa_table(
  df,
  # stub_indents = list("1", "2"),
  caption = "Summary of categorical variables.",
  note = "Missing data is not shown.")

df$Variable[duplicated（df$Variable）]这里是另一种使用apa_table（）的方法
首先是一种简单的数据汇总方法：
库（“dplyr”）
图书馆（“tidyr”）
df%
na.排除%>%
pivot_更长（cols=everything（））%>%
分组依据（名称、值）%>%
计数（）%>%
解组（）%>%
变异(
名称=系数（名称、级别=c（“首次创始人”、“性别”、“投资类型”、“州代码”、“组织”），标签=c（“首次创始人”、“性别”、“投资类型”、“州”）
) %>% 
分组单位（名称）%>%
变异（百分比=printnum（n/和（n）*100，位数=1））%>%
重命名（变量=值，N=N，“%”=百分比）

现在，您可以拆分data.frame
并将它们重新组合到一个命名列表中，以获得存根缩进
factor\u level\u count\u list%
lappy（函数（x）x[，-1]）#删除拆分列
图书馆（“papaja”）
apa_表(
因子水平计数列表
，align=“llr”#右对齐最后一列
，caption=“分类变量摘要。”
，note=“未显示缺失的数据。”
，merge_method=“indent”#用于合并列表元素的表格样式
，midrules=c（3,6,9）
)

什么是创始人
？我希望有一种更直接的方法来实现我所破解的东西，顺便说一句，“折叠变量值”，这是什么意思？你的意思是要删除级别
，可能是使用分组依据（df，Variable）%%>%summary（N=sum（N））
（加上%）？@r2evans，通过折叠，我的意思是不要在每个级别重复它。例如，在第二个示例图像中，该表中的变量以粗体显示，总的N值，然后在下面列出了各个级别的N值。（性别分为男性、女性和其他级别）。谢谢。这很好地清理了代码，并且表格缩进更符合我所寻找的内容。
df$Variable[duplicated(df$Variable)] <- ""     # remove duplicated labels
df <- df[c(1:7, 9:13, 8), ]                    # move "(other)" to last row

apa_table(
  df,
  align = "llr",                               # right-align last column
  caption = "Summary of categorical variables.",
  note = "Missing data is not shown.")