R 使用正确的独立性测试
R中有两组data.frame,分别称为good和bad,分别包含good用户和bad用户 组商品包含game_id(电脑游戏的id)和数字(该游戏已玩了多少次) 例如,好的$game\u id我们得到1 2 3。。。20我们有20场比赛。 类似的好数字我们得到45214125423。。。8914这是游戏已经玩过的号码。例如,组内游戏_id==1已经玩了45214次 坏的也一样。 我们在这两个组中也有相同数量的用户 所以对于headgood,我们得到20 我想调查一个固定的电脑游戏被玩的次数之间是否存在相关性 对于game_id==1,我会尝试使用Pearson的Chi测试来测试“独立性”。 在R中,我键入chisq.testgood[1,2],bad[1,2]以查看游戏_id==1的good和bad之间是否存在独立性,但我得到一条错误消息:x和y必须具有相同的级别R 使用正确的独立性测试,r,statistics,R,Statistics,R中有两组data.frame,分别称为good和bad,分别包含good用户和bad用户 组商品包含game_id(电脑游戏的id)和数字(该游戏已玩了多少次) 例如,好的$game\u id我们得到1 2 3。。。20我们有20场比赛。 类似的好数字我们得到45214125423。。。8914这是游戏已经玩过的号码。例如,组内游戏_id==1已经玩了45214次 坏的也一样。 我们在这两个组中也有相同数量的用户 所以对于headgood,我们得到20 我想调查一个固定的电脑游戏被玩的次数之间
如何解决此问题?请仔细阅读如何创建和更新问题。您所说的固定电脑游戏的玩数之间的依赖性是什么意思?在您的示例中,您似乎试图比较两个数字,并找出它们之间的某种依赖性。我真的不认为有一个统计工具可以做到这一点。Pearson的Chi测试可以应用于一组数字,但不能应用于两个单独的数字。我想调查一些电脑游戏是否对好的或坏的群体有影响。例如,某些游戏可能导致某些用户是好的,而某些游戏可能导致某些用户是坏的。我认为您正试图调查,但可能在代码中没有正确表达出来的是,某个特定游戏更可能由好用户还是坏用户玩。因此,对于每个游戏,您需要比较玩得好的用户的百分比与玩得不好的用户的百分比。你需要使用好用户总数和坏用户总数,我想你提到的是相同的。因此,对于游戏1,好的百分比是45214/总的好用户,坏的百分比是以类似的方式获得的。是的,这就是我想要做的。所以要明确的是:对于一个固定的游戏id,我使用Pearson chi-sq测试:chisq.test好的百分比,坏的百分比。对于游戏id 1,我得到了chisq.test0.066,0.041,但R表示x和y必须至少有2个级别。
game_id number
1 45214
2 1254
...
20 8914