R 选择正确的分析
我在R中有一个数据集,它包含两组R 选择正确的分析,r,statistics,R,Statistics,我在R中有一个数据集,它包含两组好的和坏的。组good包含生命周期长的用户,组bad包含生命周期短的用户 所以good包含game\u id和game\u play。例如,good$game\u id==1(game 1)已经玩了good$game\u played==12.5小时 我想调查一下好与坏之间是否存在差异,看看哪种游戏能够区分好与坏 我有20个游戏id,所以我不需要主成分分析来减少游戏id。人们应该如何分析某个游戏id是否对好的和坏的产生影响 所以在R中,我们得到的是good 这样的
好的
和坏的
。组good包含生命周期长的用户,组bad包含生命周期短的用户
所以good
包含game\u id
和game\u play
。例如,good$game\u id==1
(game 1)已经玩了good$game\u played==12.5
小时
我想调查一下好与坏之间是否存在差异,看看哪种游戏能够区分好与坏
我有20个游戏id,所以我不需要主成分分析来减少游戏id。人们应该如何分析某个游戏id是否对好的
和坏的
产生影响
所以在R中,我们得到的是good
这样的输出:
game_id game_played
6 18.3
14 2.1
4 0.6
1 1.0
2 1.4
3 0.1
5 0.4
7 1.2
8 1.2
9 3.1
10 1.7
11 11.6
12 0.2
13 5.4
15 4.3
16 12.4
17 8.2
18 7.0
19 3.4
20 4.6
其中,
game\u id
是游戏的名称,game\u play
是在数据good
中玩游戏的时间。对于bad
我们有一个类似的输出,但值不同。您能否提供一个包含good
和bad
的数据集的具体示例?你所说的好与坏之间的“区别”是什么意思?您是否正在寻找经常出现在good
中而很少出现在bad
中的游戏id
,或者反之亦然?我已经给出了一个例子。我想调查一下,是否有一款游戏玩得很好,从而导致这些用户玩得更多。类似地,我想调查是否有一款游戏在“bad”中导致这些用户停止玩。head(good,3)
is to short<代码>头部(好,100)和头部(坏,100)
会更好。game\u played
栏是否与该问题相关?game\u played只告诉我们在固定的组(好或坏)中,一个游戏id玩了多少小时。如果我们有一场高水平的比赛,而低水平的比赛,这一定表明比赛可能是两组之间的差异。似乎每一场比赛,id在好的
和坏的
中只出现一次。因此,game\u play
汇总了各个玩家玩游戏的时间。是平均数还是总数?好球员和坏球员一样多吗?对于所有游戏id,一个游戏id被玩的次数是否相同?这个数字越大,如果该游戏id产生了影响,那么估计值就越好。您能否提供一个包含good
和bad
的数据集的具体示例?你所说的好与坏之间的“区别”是什么意思?您是否正在寻找经常出现在good
中而很少出现在bad
中的游戏id
,或者反之亦然?我已经给出了一个例子。我想调查一下,是否有一款游戏玩得很好,从而导致这些用户玩得更多。类似地,我想调查是否有一款游戏在“bad”中导致这些用户停止玩。head(good,3)
is to short<代码>头部(好,100)和头部(坏,100)
会更好。game\u played
栏是否与该问题相关?game\u played只告诉我们在固定的组(好或坏)中,一个游戏id玩了多少小时。如果我们有一场高水平的比赛,而低水平的比赛,这一定表明比赛可能是两组之间的差异。似乎每一场比赛,id在好的
和坏的
中只出现一次。因此,game\u play
汇总了各个玩家玩游戏的时间。是平均数还是总数?好球员和坏球员一样多吗?对于所有游戏id,一个游戏id被玩的次数是否相同?如果这个数字越大,那么如果这个游戏产生了影响,那么这个估计值就越好。