R 选择正确的分析_R_Statistics

R 选择正确的分析

r statistics

R 选择正确的分析,r,statistics,R,Statistics,我在R中有一个数据集，它包含两组好的和坏的。组good包含生命周期长的用户，组bad包含生命周期短的用户所以good包含game\u id和game\u play。例如，good$game\u id==1（game 1）已经玩了good$game\u played==12.5小时我想调查一下好与坏之间是否存在差异，看看哪种游戏能够区分好与坏我有20个游戏id，所以我不需要主成分分析来减少游戏id。人们应该如何分析某个游戏id是否对好的和坏的产生影响所以在R中，我们得到的是good 这样的

我在R中有一个数据集，它包含两组

好的

和

坏的

。组good包含生命周期长的用户，组bad包含生命周期短的用户

所以

good

包含

game\u id

和

game\u play

。例如，

good$game\u id==1

（game 1）已经玩了

good$game\u played==12.5

小时

我想调查一下好与坏之间是否存在差异，看看哪种游戏能够区分好与坏

我有20个游戏id，所以我不需要主成分分析来减少游戏id。人们应该如何分析某个游戏id是否对

好的

和

坏的

产生影响

所以在R中，我们得到的是

good

这样的输出：

game_id   game_played
6         18.3
14        2.1
4         0.6
1         1.0
2         1.4
3         0.1
5         0.4
7         1.2
8         1.2
9         3.1
10        1.7
11        11.6
12        0.2
13        5.4
15        4.3
16        12.4
17        8.2
18        7.0
19        3.4
20        4.6

其中，

game\u id

是游戏的名称，

game\u play

是在数据

good

中玩游戏的时间。对于

bad

我们有一个类似的输出，但值不同。

您能否提供一个包含

good

和

bad

的数据集的具体示例？你所说的好与坏之间的“区别”是什么意思？您是否正在寻找经常出现在

good

中而很少出现在

bad

中的

游戏id

，或者反之亦然？我已经给出了一个例子。我想调查一下，是否有一款游戏玩得很好，从而导致这些用户玩得更多。类似地，我想调查是否有一款游戏在“bad”中导致这些用户停止玩。

head（good，3）

is to short<代码>头部（好，100）和

头部（坏，100）

会更好。

game\u played

栏是否与该问题相关？game\u played只告诉我们在固定的组（好或坏）中，一个游戏id玩了多少小时。如果我们有一场高水平的比赛，而低水平的比赛，这一定表明比赛可能是两组之间的差异。似乎每一场比赛，id在

好的

和

坏的

中只出现一次。因此，

game\u play

汇总了各个玩家玩游戏的时间。是平均数还是总数？好球员和坏球员一样多吗？对于所有游戏id，一个游戏id被玩的次数是否相同？这个数字越大，如果该游戏id产生了影响，那么估计值就越好。您能否提供一个包含

good

和

bad

的数据集的具体示例？你所说的好与坏之间的“区别”是什么意思？您是否正在寻找经常出现在

good

中而很少出现在

bad

中的

游戏id

head（good，3）

is to short<代码>头部（好，100）和

头部（坏，100）

会更好。

game\u played

好的

和

坏的

中只出现一次。因此，

game\u play

汇总了各个玩家玩游戏的时间。是平均数还是总数？好球员和坏球员一样多吗？对于所有游戏id，一个游戏id被玩的次数是否相同？如果这个数字越大，那么如果这个游戏产生了影响，那么这个估计值就越好。