R-DF频率

R-DF频率,r,dataframe,R,Dataframe,我有一个洛杉矶湖人队从2005年到2015年所有比赛的数据集。看起来是这样的: Hometeam Guest Result Value LA Lakers NY Knicks H 1 Chicago Bulls LA Lakers G 1 LA Lakers Houston Rockets D 0 LA Lakers NY

我有一个洛杉矶湖人队从2005年到2015年所有比赛的数据集。看起来是这样的:

Hometeam         Guest           Result     Value
LA Lakers       NY Knicks          H         1
Chicago Bulls   LA Lakers          G         1
LA Lakers      Houston Rockets     D         0
LA Lakers       NY Knicks          H         1
Chicago Bulls   LA Lakers          G         1
LA Lakers      Houston Rockets     D         0
LA Lakers      Walsh HS            H         1
LA Lakers      Ga Tech             G         0
Akron Beacon    LA Lakers          G         1
New Orleans     LA Lakers          H         0
在哪里

     H - Home team won
     G - Guest team won
     D - Draw
现在,我想找到频率,以便找到概率-洛杉矶湖人队获胜,如果他们赢得了前一场比赛

我怎么知道湖人队在主场和客场连续两场比赛中获胜的频率。我正试图在R解决这个问题。提前谢谢

现在,我想计算洛杉矶湖人队(赢/输)这场比赛赢/输上一场比赛的频率


因此,这四个有序对是(赢p,赢C),(赢p,输C),(输p,赢C),(输p,输C)。

df可能,您可以:

library(dplyr)

#Win and win
df %>%  summarise(total = sum(Value == 1 & lag(Value, default = 0) == 1))

#Win and lose
df %>% summarise(total = sum(Value == 0 & lag(Value, default = 0) == 1))

#Lose and Win
df %>% summarise(total = sum(Value == 1 & lag(Value, default = 1) == 0))

#Lose and Lose
df %>% summarise(total = sum(Value == 0 & lag(Value, default = 1) == 0))

您好@DavidT我的问题要求创建一个新列,其中我为赢分配值1,为输或平局分配值0。但从那里我无法找出如何找到频率…我添加了更多的游戏,使逻辑更加清晰。最后一个
with
给出了你的频率。你好@RonakShah,我想解决的问题是我必须创建一个新列,它的值为1表示win,0表示L/D。我无法从那里计算出来。…@t.wangd要创建一个新列,你可以执行
df%>%mutate(win=+(主队='LA_Lakes'和结果='H';客队='LA_Lakes'和结果='G'))
是的,我确实创建了一个新列。但是从那里,我无法计算出可能的成对频率。我想这就是我的答案。你试过运行它吗?嗨@RonakShah,添加新列后,我的df看起来像这样主队客场成绩值洛杉矶湖人队纽约尼克斯队H1芝加哥公牛队G1洛杉矶湖人队休斯顿火箭队D0``现在我如何计算洛杉矶湖人队在上一次比赛中的胜负频率游戏和赢/输当前游戏。它应该计算所有可能的四对有序对
library(dplyr)

#Win and win
df %>%  summarise(total = sum(Value == 1 & lag(Value, default = 0) == 1))

#Win and lose
df %>% summarise(total = sum(Value == 0 & lag(Value, default = 0) == 1))

#Lose and Win
df %>% summarise(total = sum(Value == 1 & lag(Value, default = 1) == 0))

#Lose and Lose
df %>% summarise(total = sum(Value == 0 & lag(Value, default = 1) == 0))