R 选择正确的分析

R 选择正确的分析,r,statistics,R,Statistics,我在R中有一个数据集,它包含两组好的和坏的。组good包含生命周期长的用户,组bad包含生命周期短的用户 所以good包含game\u id和game\u play。例如,good$game\u id==1(game 1)已经玩了good$game\u played==12.5小时 我想调查一下好与坏之间是否存在差异,看看哪种游戏能够区分好与坏 我有20个游戏id,所以我不需要主成分分析来减少游戏id。人们应该如何分析某个游戏id是否对好的和坏的产生影响 所以在R中,我们得到的是good 这样的

我在R中有一个数据集,它包含两组
好的
坏的
。组good包含生命周期长的用户,组bad包含生命周期短的用户

所以
good
包含
game\u id
game\u play
。例如,
good$game\u id==1
(game 1)已经玩了
good$game\u played==12.5
小时

我想调查一下好与坏之间是否存在差异,看看哪种游戏能够区分好与坏

我有20个游戏id,所以我不需要主成分分析来减少游戏id。人们应该如何分析某个游戏id是否对
好的
坏的
产生影响

所以在R中,我们得到的是
good

这样的输出:

game_id   game_played
6         18.3
14        2.1
4         0.6
1         1.0
2         1.4
3         0.1
5         0.4
7         1.2
8         1.2
9         3.1
10        1.7
11        11.6
12        0.2
13        5.4
15        4.3
16        12.4
17        8.2
18        7.0
19        3.4
20        4.6                                        

其中,
game\u id
是游戏的名称,
game\u play
是在数据
good
中玩游戏的时间。对于
bad
我们有一个类似的输出,但值不同。

您能否提供一个包含
good
bad
的数据集的具体示例?你所说的好与坏之间的“区别”是什么意思?您是否正在寻找经常出现在
good
中而很少出现在
bad
中的
游戏id
,或者反之亦然?我已经给出了一个例子。我想调查一下,是否有一款游戏玩得很好,从而导致这些用户玩得更多。类似地,我想调查是否有一款游戏在“bad”中导致这些用户停止玩。
head(good,3)
is to short<代码>头部(好,100)和
头部(坏,100)
会更好。
game\u played
栏是否与该问题相关?game\u played只告诉我们在固定的组(好或坏)中,一个游戏id玩了多少小时。如果我们有一场高水平的比赛,而低水平的比赛,这一定表明比赛可能是两组之间的差异。似乎每一场比赛,id在
好的
坏的
中只出现一次。因此,
game\u play
汇总了各个玩家玩游戏的时间。是平均数还是总数?好球员和坏球员一样多吗?对于所有游戏id,一个游戏id被玩的次数是否相同?这个数字越大,如果该游戏id产生了影响,那么估计值就越好。您能否提供一个包含
good
bad
的数据集的具体示例?你所说的好与坏之间的“区别”是什么意思?您是否正在寻找经常出现在
good
中而很少出现在
bad
中的
游戏id
,或者反之亦然?我已经给出了一个例子。我想调查一下,是否有一款游戏玩得很好,从而导致这些用户玩得更多。类似地,我想调查是否有一款游戏在“bad”中导致这些用户停止玩。
head(good,3)
is to short<代码>头部(好,100)和
头部(坏,100)
会更好。
game\u played
栏是否与该问题相关?game\u played只告诉我们在固定的组(好或坏)中,一个游戏id玩了多少小时。如果我们有一场高水平的比赛,而低水平的比赛,这一定表明比赛可能是两组之间的差异。似乎每一场比赛,id在
好的
坏的
中只出现一次。因此,
game\u play
汇总了各个玩家玩游戏的时间。是平均数还是总数?好球员和坏球员一样多吗?对于所有游戏id,一个游戏id被玩的次数是否相同?如果这个数字越大,那么如果这个游戏产生了影响,那么这个估计值就越好。