R-DF频率
我有一个洛杉矶湖人队从2005年到2015年所有比赛的数据集。看起来是这样的:R-DF频率,r,dataframe,R,Dataframe,我有一个洛杉矶湖人队从2005年到2015年所有比赛的数据集。看起来是这样的: Hometeam Guest Result Value LA Lakers NY Knicks H 1 Chicago Bulls LA Lakers G 1 LA Lakers Houston Rockets D 0 LA Lakers NY
Hometeam Guest Result Value
LA Lakers NY Knicks H 1
Chicago Bulls LA Lakers G 1
LA Lakers Houston Rockets D 0
LA Lakers NY Knicks H 1
Chicago Bulls LA Lakers G 1
LA Lakers Houston Rockets D 0
LA Lakers Walsh HS H 1
LA Lakers Ga Tech G 0
Akron Beacon LA Lakers G 1
New Orleans LA Lakers H 0
在哪里
H - Home team won
G - Guest team won
D - Draw
现在,我想找到频率,以便找到概率-洛杉矶湖人队获胜,如果他们赢得了前一场比赛
我怎么知道湖人队在主场和客场连续两场比赛中获胜的频率。我正试图在R解决这个问题。提前谢谢
现在,我想计算洛杉矶湖人队(赢/输)这场比赛赢/输上一场比赛的频率
因此,这四个有序对是(赢p,赢C),(赢p,输C),(输p,赢C),(输p,输C)。
df可能,您可以:
library(dplyr)
#Win and win
df %>% summarise(total = sum(Value == 1 & lag(Value, default = 0) == 1))
#Win and lose
df %>% summarise(total = sum(Value == 0 & lag(Value, default = 0) == 1))
#Lose and Win
df %>% summarise(total = sum(Value == 1 & lag(Value, default = 1) == 0))
#Lose and Lose
df %>% summarise(total = sum(Value == 0 & lag(Value, default = 1) == 0))
您好@DavidT我的问题要求创建一个新列,其中我为赢分配值1,为输或平局分配值0。但从那里我无法找出如何找到频率…我添加了更多的游戏,使逻辑更加清晰。最后一个with
给出了你的频率。你好@RonakShah,我想解决的问题是我必须创建一个新列,它的值为1表示win,0表示L/D。我无法从那里计算出来。…@t.wangd要创建一个新列,你可以执行df%>%mutate(win=+(主队='LA_Lakes'和结果='H';客队='LA_Lakes'和结果='G'))
是的,我确实创建了一个新列。但是从那里,我无法计算出可能的成对频率。我想这就是我的答案。你试过运行它吗?嗨@RonakShah,添加新列后,我的df看起来像这样主队客场成绩值洛杉矶湖人队纽约尼克斯队H1芝加哥公牛队G1洛杉矶湖人队休斯顿火箭队D0``现在我如何计算洛杉矶湖人队在上一次比赛中的胜负频率游戏和赢/输当前游戏。它应该计算所有可能的四对有序对
library(dplyr)
#Win and win
df %>% summarise(total = sum(Value == 1 & lag(Value, default = 0) == 1))
#Win and lose
df %>% summarise(total = sum(Value == 0 & lag(Value, default = 0) == 1))
#Lose and Win
df %>% summarise(total = sum(Value == 1 & lag(Value, default = 1) == 0))
#Lose and Lose
df %>% summarise(total = sum(Value == 0 & lag(Value, default = 1) == 0))