如何计算R中的优势比和风险比

如何计算R中的优势比和风险比,r,R,我是新手 我的数据附在谷歌表格上。这只是数据的一小部分。数据有12274行和107列 点击下面的链接获取数据 我想用PH值和所有其他变量逐一计算优势比和风险比。 尝试使用以下方法: tab <- table(mydata[[i]],mydata[[j]]) OddsRatio <- epitab(tab,method = "oddsratio") tab不确定这是否正是您想要的,但是vcd::oddsratio是一个很好的起点 # load libraries library(g

我是新手

我的数据附在谷歌表格上。这只是数据的一小部分。数据有12274行和107列

点击下面的链接获取数据

我想用PH值和所有其他变量逐一计算优势比和风险比。 尝试使用以下方法:

tab <- table(mydata[[i]],mydata[[j]])
OddsRatio <- epitab(tab,method = "oddsratio")

tab不确定这是否正是您想要的,但是
vcd::oddsratio
是一个很好的起点

# load libraries
library(gsheet)
library(vcd)
# load data
df <- gsheet2tbl('docs.google.com/spreadsheets/d/1kpWtAxj7XTNaXowMjBsZ5lWm6LlbdE2nzH6s6Pll1Y8')
# remove NAs
df <- df[,-3]
df <- df[-8,]
# convert to matrix 
mat <- data.matrix(df, rownames.force = NA)
# calculate odds ratio
oddsratio(mat, log = FALSE)
#加载库
图书馆(gsheet)
图书馆(vcd)
#加载数据

df so基于二项式情况,OR=\frac{\frac{p_1}{1-p_1}}{\frac{p_2}{1-p_2}}}。你需要为你所有的数据计算它吗?你如何估计你的可能性?什么是“它没有帮助”的意思。由于epitab需要一个表格,表格需要系数!但您的数据似乎有连续变量。首先离散化变量(生成因子)选项卡。@Robert您的意思是将数据转换为类别吗。。?我在某个时候也用过这个标签谢谢你抽出时间。但是,由于数据庞大,我需要一种通用的方法来删除NA。对于ex-pH-apger得分、pH-weight small、pH-weight large等变量,一次计算两个变量的优势比。如果您想找到没有缺失值的行,您可以尝试
complete.cases(df)
。这将为您提供一个逻辑向量。如果您想要数据的子集,只保留完整的案例,您可以尝试
df[complete.cases(df),]
。这也可以通过执行此
na.omit(df)
来完成。