R 创建只有两个变量的交叉表矩阵
如果这个问题太简单,我很抱歉,但我现在才开始研究R和统计相关的问题 我使用的数据来自内置的R 创建只有两个变量的交叉表矩阵,r,matrix,R,Matrix,如果这个问题太简单,我很抱歉,但我现在才开始研究R和统计相关的问题 我使用的数据来自内置的推断数据集,对于赋值,我需要构建一个交叉表矩阵,其中列将是诱导的变量,行将是自发的变量 下面是一个矩阵示例,供不熟悉infert的人使用: > infert education age parity induced case spontaneous stratum pooled.stratum 1 0-5yrs 26 6 1 1 2
推断
数据集,对于赋值,我需要构建一个交叉表矩阵,其中列将是诱导的
变量,行将是自发的
变量
下面是一个矩阵示例,供不熟悉infert
的人使用:
> infert
education age parity induced case spontaneous stratum pooled.stratum
1 0-5yrs 26 6 1 1 2 1 3
2 0-5yrs 42 1 1 1 0 2 1
3 0-5yrs 39 6 2 1 0 3 4
4 0-5yrs 34 4 2 1 0 4 2
5 6-11yrs 35 3 1 1 1 5 32
6 6-11yrs 36 4 2 1 1 6 36
7 6-11yrs 23 1 0 1 0 7 6
8 6-11yrs 32 2 0 1 0 8 22
9 6-11yrs 21 1 0 1 1 9 5
10 6-11yrs 28 2 0 1 0 10 19
11 6-11yrs 29 2 1 1 0 11 20
...
247 12+ yrs 29 1 0 0 1 82 43
248 12+ yrs 23 1 0 0 1 83 40
在那之后,我还需要对结果进行卡方连续性表检验,以查看这两个变量是否关联
问题是,由于我缺乏经验,我不知道从哪里开始。谷歌没有得到任何相关的结果,我也找不到任何关于构建交叉表矩阵的方法()或教程
Hoever,一个非常相关的页面也包含了我发现的卡方检验方法的信息,尽管它使用了一个外部包,gmodels
使用内置的R函数执行此操作的任何方法,或者我必须获得
gmodels
?您可以使用表
创建列联表:
freq <- table(infert[c("induced", "spontaneous")])
# spontaneous
# induced 0 1 2
# 0 67 47 29
# 1 45 16 7
# 2 29 8 0
@MarkHeckmann我在我的问题中链接到了同一个页面。下次发表评论时请仔细阅读。很抱歉让您生气。也许我应该加上一句:“你链接的页面上都有描述。”:
attach(infert);空白表
chisq.test(freq)
# Pearson's Chi-squared test
#
# data: freq
# X-squared = 18.198, df = 4, p-value = 0.001129