Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/73.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
r表列出了多个具有频率的分类变量 库(“tidyverse”) 图书馆(“papaja”) df% 在(c(“性别”、“第一次创始人”)、列表(~因子())%%>%处进行变异 突变(性别=因子(如果其他(性别=1,“男性”,“女性”))%>% 变异(第一次创始人d=因子(如果其他(第一次创始人d==1,“是”、“否”))%>% 变异(投资类型=因子(ifelse(投资类型=“天使”、“天使”、ifelse(投资类型=“预种子”、“预种子”、“种子”))))%>% 下拉菜单()%>% 摘要()%>% as.data.frame() #清理柱子 df% 选择(-Var1)%>% 重命名(变量=Var2,N=Freq)%>% 变异(变量=因子)(ifelse(变量==“投资类型”、“投资类型”、ifelse(变量==“状态代码组织”、“状态”、ifelse(str_-detect(变量,“性别”)、“性别”、“首次创始人”])%>% 滴_na() #将N分为level和N df% 分离(col=N,into=c(“级别”,“N”),sep=“:”) #删除值中的空白 df% 变异( 变量=trimws(变量))%>% 变异( 级别=trimws(级别))%>% 变异( N=trimws(N)) #将N转换为整数 df% 变异(N=as.integer(N)) df% 分组依据(变量)%>% 排列(变量,描述(N)) apa_表( df, #存根缩进=列表(“1”、“2”), caption=“分类变量摘要”, 注意=“未显示缺失的数据。”)_R_R Markdown_Papaja - Fatal编程技术网

r表列出了多个具有频率的分类变量 库(“tidyverse”) 图书馆(“papaja”) df% 在(c(“性别”、“第一次创始人”)、列表(~因子())%%>%处进行变异 突变(性别=因子(如果其他(性别=1,“男性”,“女性”))%>% 变异(第一次创始人d=因子(如果其他(第一次创始人d==1,“是”、“否”))%>% 变异(投资类型=因子(ifelse(投资类型=“天使”、“天使”、ifelse(投资类型=“预种子”、“预种子”、“种子”))))%>% 下拉菜单()%>% 摘要()%>% as.data.frame() #清理柱子 df% 选择(-Var1)%>% 重命名(变量=Var2,N=Freq)%>% 变异(变量=因子)(ifelse(变量==“投资类型”、“投资类型”、ifelse(变量==“状态代码组织”、“状态”、ifelse(str_-detect(变量,“性别”)、“性别”、“首次创始人”])%>% 滴_na() #将N分为level和N df% 分离(col=N,into=c(“级别”,“N”),sep=“:”) #删除值中的空白 df% 变异( 变量=trimws(变量))%>% 变异( 级别=trimws(级别))%>% 变异( N=trimws(N)) #将N转换为整数 df% 变异(N=as.integer(N)) df% 分组依据(变量)%>% 排列(变量,描述(N)) apa_表( df, #存根缩进=列表(“1”、“2”), caption=“分类变量摘要”, 注意=“未显示缺失的数据。”)

r表列出了多个具有频率的分类变量 库(“tidyverse”) 图书馆(“papaja”) df% 在(c(“性别”、“第一次创始人”)、列表(~因子())%%>%处进行变异 突变(性别=因子(如果其他(性别=1,“男性”,“女性”))%>% 变异(第一次创始人d=因子(如果其他(第一次创始人d==1,“是”、“否”))%>% 变异(投资类型=因子(ifelse(投资类型=“天使”、“天使”、ifelse(投资类型=“预种子”、“预种子”、“种子”))))%>% 下拉菜单()%>% 摘要()%>% as.data.frame() #清理柱子 df% 选择(-Var1)%>% 重命名(变量=Var2,N=Freq)%>% 变异(变量=因子)(ifelse(变量==“投资类型”、“投资类型”、ifelse(变量==“状态代码组织”、“状态”、ifelse(str_-detect(变量,“性别”)、“性别”、“首次创始人”])%>% 滴_na() #将N分为level和N df% 分离(col=N,into=c(“级别”,“N”),sep=“:”) #删除值中的空白 df% 变异( 变量=trimws(变量))%>% 变异( 级别=trimws(级别))%>% 变异( N=trimws(N)) #将N转换为整数 df% 变异(N=as.integer(N)) df% 分组依据(变量)%>% 排列(变量,描述(N)) apa_表( df, #存根缩进=列表(“1”、“2”), caption=“分类变量摘要”, 注意=“未显示缺失的数据。”),r,r-markdown,papaja,R,R Markdown,Papaja,这是我现在得到的 我对使用任何软件包都持开放态度——这碰巧是使用papaja。但它需要在带有PDF输出的rmarkdown中工作,并符合APA风格 我希望该表折叠变量值,使它们不会重复多次,并将状态(其他)移动到状态分组的底部。例如,类似以下内容(不同的数据集): 您可以尝试该软件包(尚未在CRAN上) #devtools::install_github(“rstudio/gt”) 图书馆(gt) df%>% 变异(`%`=scales::percent(N/sum(N),1))%>% gt(

这是我现在得到的

我对使用任何软件包都持开放态度——这碰巧是使用papaja。但它需要在带有PDF输出的rmarkdown中工作,并符合APA风格

我希望该表折叠变量值,使它们不会重复多次,并将状态(其他)移动到状态分组的底部。例如,类似以下内容(不同的数据集):

您可以尝试该软件包(尚未在CRAN上)

#devtools::install_github(“rstudio/gt”)
图书馆(gt)
df%>%
变异(`%`=scales::percent(N/sum(N),1))%>%
gt()%>%
制表符标题(
title=“分类变量摘要。”
) %>%    
选项卡\u来源\u注释(
source_note=md(“*缺少的数据未显示。*”)
)

这是HTML格式副本。它使用
dplyr
的组来确定行分组

repo和RTF都表示,它支持HTML格式的输出,并计划在将来使用LaTeX和RTF,但在某种程度上是可行的

df%>%
变异(`%`=scales::percent(N/sum(N),1))%>%
gt()%>%
#制表符标题(
#title=“分类变量摘要”,subtitle=“”
# ) %>%    
选项卡\u来源\u注释(
source_note=md(“*缺少的数据未显示。*”)
) %>%
as_乳胶()
tab\u header
和latex output()有一个bug,看起来
tab\u source\u note
可能也有点歪斜

我重新安排了一些事情,并能够得到这个,虽然我相信这并不完全是你想要的。(这表明副标题中的任何非空白都允许
选项卡标题
起作用,但
”——任何数量的空格——都不起作用。)

df%>%
变异(`%`=scales::percent(N/sum(N),1))%>%
gt()%>%
制表符标题(
title=“分类变量摘要。”,
subtitle=md(“*缺少的数据未显示。*”)
) %>%    
as_乳胶()

我认为这是一个简单的解决方案:

library("tidyverse")
library("papaja")

df <- structure(list(investment_type = structure(c(3L, 3L, 3L, 3L, 
3L, 3L, 3L, 1L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L, 3L, 
3L), .Label = c("angel", "pre_seed", "seed"), class = "factor"), 
    gender_d = c(1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 
    1, 1, 1, 1, 0, 1), state_code_org = structure(c(3L, 22L, 
    3L, 15L, 3L, 4L, 3L, 3L, 22L, 3L, 29L, 25L, 8L, 29L, 10L, 
    6L, 22L, 4L, 17L, 23L, 17L), .Label = c("AL", "AR", "CA", 
    "CO", "CT", "DC", "DE", "FL", "GA", "IL", "KS", "LA", "MA", 
    "MD", "MN", "MO", "NC", "NE", "NH", "NJ", "NV", "NY", "OH", 
    "OR", "PA", "RI", "SC", "TN", "TX", "UT", "VA", "VT", "WA", 
    "WI", "WY"), class = "factor"), first_time_founder_d = c(0, 
    1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, NA, 1, 0, 0, 1, 
    0)), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, 
-21L))

df <- df %>%
  select(investment_type,
         state_code_org,
         gender_d,
         first_time_founder_d) %>%
  mutate_at(c("gender_d", "first_time_founder_d"), list(~ factor(.))) %>%
  mutate(gender_d=factor(ifelse(gender_d==1, "Male", "Female"))) %>%
  mutate(first_time_founder_d=factor(ifelse(first_time_founder_d==1, "Yes", "No"))) %>%
  mutate(investment_type=factor(ifelse(investment_type=="angel", "Angel", ifelse(investment_type=="pre_seed", "Pre-Seed", "Seed")))) %>%
  drop_na() %>%
  summary() %>%
  as.data.frame()

# Clean up columns
df <- df %>%
  select(-Var1) %>%
  rename(Variable=Var2, N=Freq) %>%
  mutate(Variable=factor(ifelse(Variable=="investment_type", "Investment Type", ifelse(Variable=="state_code_org", "State", ifelse(str_detect(Variable, "gender_d"), "Gender", "First-Time Founder"))))) %>%
  drop_na()

# break N into level and N
df <- df %>%
  separate(col = N, into = c("Level", "N"), sep = ":")

# Remove white space in values
df <- df %>% 
  mutate(
    Variable=trimws(Variable)) %>%
  mutate(
    Level=trimws(Level)) %>%
  mutate(
    N=trimws(N))

# Convert N to integer
df <- df %>% 
  mutate(N=as.integer(N))

df <- df %>% 
  group_by(Variable) %>% 
  arrange(Variable, desc(N))

apa_table(
  df,
  # stub_indents = list("1", "2"),
  caption = "Summary of categorical variables.",
  note = "Missing data is not shown.")

df$Variable[duplicated(df$Variable)]这里是另一种使用
apa_table()的方法

首先是一种简单的数据汇总方法:

库(“dplyr”)
图书馆(“tidyr”)
df%
na.排除%>%
pivot_更长(cols=everything())%>%
分组依据(名称、值)%>%
计数()%>%
解组()%>%
变异(
名称=系数(名称、级别=c(“首次创始人”、“性别”、“投资类型”、“州代码”、“组织”),标签=c(“首次创始人”、“性别”、“投资类型”、“州”)
) %>% 
分组单位(名称)%>%
变异(百分比=printnum(n/和(n)*100,位数=1))%>%
重命名(变量=值,N=N,“%”=百分比)
现在,您可以拆分
data.frame
并将它们重新组合到一个命名列表中,以获得存根缩进

factor\u level\u count\u list%
lappy(函数(x)x[,-1])#删除拆分列
图书馆(“papaja”)
apa_表(
因子水平计数列表
,align=“llr”#右对齐最后一列
,caption=“分类变量摘要。”
,note=“未显示缺失的数据。”
,merge_method=“indent”#用于合并列表元素的表格样式
,midrules=c(3,6,9)
)

什么是
创始人
?我希望有一种更直接的方法来实现我所破解的东西,顺便说一句,“折叠变量值”,这是什么意思?你的意思是要删除
级别
,可能是使用
分组依据(df,Variable)%%>%summary(N=sum(N))
(加上
%
)?@r2evans,通过折叠,我的意思是不要在每个级别重复它。例如,在第二个示例图像中,该表中的变量以粗体显示,总的N值,然后在下面列出了各个级别的N值。(性别分为男性、女性和其他级别)。谢谢。这很好地清理了代码,并且表格缩进更符合我所寻找的内容。
df$Variable[duplicated(df$Variable)] <- ""     # remove duplicated labels
df <- df[c(1:7, 9:13, 8), ]                    # move "(other)" to last row

apa_table(
  df,
  align = "llr",                               # right-align last column
  caption = "Summary of categorical variables.",
  note = "Missing data is not shown.")