R 使用正确的独立性测试_R_Statistics

R 使用正确的独立性测试

r statistics

R 使用正确的独立性测试,r,statistics,R,Statistics,R中有两组data.frame，分别称为good和bad，分别包含good用户和bad用户组商品包含game_id（电脑游戏的id）和数字（该游戏已玩了多少次）例如，好的$game\u id我们得到1 2 3。。。20我们有20场比赛。类似的好数字我们得到45214125423。。。8914这是游戏已经玩过的号码。例如，组内游戏_id==1已经玩了45214次坏的也一样。我们在这两个组中也有相同数量的用户所以对于headgood，我们得到20 我想调查一个固定的电脑游戏被玩的次数之间

R中有两组data.frame，分别称为good和bad，分别包含good用户和bad用户

组商品包含game_id（电脑游戏的id）和数字（该游戏已玩了多少次）

例如，好的$game\u id我们得到1 2 3。。。20我们有20场比赛。类似的好数字我们得到45214125423。。。8914这是游戏已经玩过的号码。例如，组内游戏_id==1已经玩了45214次

坏的也一样。我们在这两个组中也有相同数量的用户

所以对于headgood，我们得到20

我想调查一个固定的电脑游戏被玩的次数之间是否存在相关性

对于game_id==1，我会尝试使用Pearson的Chi测试来测试“独立性”。在R中，我键入chisq.testgood[1,2]，bad[1,2]以查看游戏_id==1的good和bad之间是否存在独立性，但我得到一条错误消息：x和y必须具有相同的级别

如何解决此问题？

请仔细阅读如何创建和更新问题。您所说的固定电脑游戏的玩数之间的依赖性是什么意思？在您的示例中，您似乎试图比较两个数字，并找出它们之间的某种依赖性。我真的不认为有一个统计工具可以做到这一点。Pearson的Chi测试可以应用于一组数字，但不能应用于两个单独的数字。我想调查一些电脑游戏是否对好的或坏的群体有影响。例如，某些游戏可能导致某些用户是好的，而某些游戏可能导致某些用户是坏的。我认为您正试图调查，但可能在代码中没有正确表达出来的是，某个特定游戏更可能由好用户还是坏用户玩。因此，对于每个游戏，您需要比较玩得好的用户的百分比与玩得不好的用户的百分比。你需要使用好用户总数和坏用户总数，我想你提到的是相同的。因此，对于游戏1，好的百分比是45214/总的好用户，坏的百分比是以类似的方式获得的。是的，这就是我想要做的。所以要明确的是：对于一个固定的游戏id，我使用Pearson chi-sq测试：chisq.test好的百分比，坏的百分比。对于游戏id 1，我得到了chisq.test0.066,0.041，但R表示x和y必须至少有2个级别。

game_id  number
1  45214
2  1254
...
20  8914