当数据帧中的值';s列为x,使用Jupyter笔记本电脑和;python

当数据帧中的值';s列为x,使用Jupyter笔记本电脑和;python,python,pandas,numpy,dataframe,jupyter-notebook,Python,Pandas,Numpy,Dataframe,Jupyter Notebook,我希望能够回答这样一个问题:“击球手击出6杆后,在接下去的球时被解雇的可能性有多大?” 为此,我想计算“击球手跑步”列的值“6”,如果是,我想计算下一行的“球员被解雇”列 例如,对于整个数据集,如果第2行中的“击球手”为“6”,第3行中的“球员”是否包含值?如果是,数一 以下是前5行显示的我的数据集结构: match_id inning batting_team bowling_team over \ 0 1 1

我希望能够回答这样一个问题:“击球手击出6杆后,在接下去的球时被解雇的可能性有多大?”

为此,我想计算“击球手跑步”列的值“6”,如果是,我想计算下一行的“球员被解雇”列

例如,对于整个数据集,如果第2行中的“击球手”为“6”,第3行中的“球员”是否包含值?如果是,数一

以下是前5行显示的我的数据集结构:

match_id  inning         batting_team                 bowling_team  over  \
0         1       1  Sunrisers Hyderabad  Royal Challengers Bangalore     1   
1         1       1  Sunrisers Hyderabad  Royal Challengers Bangalore     1   
2         1       1  Sunrisers Hyderabad  Royal Challengers Bangalore     1   
3         1       1  Sunrisers Hyderabad  Royal Challengers Bangalore     1   
4         1       1  Sunrisers Hyderabad  Royal Challengers Bangalore     1   


   ball    batsman non_striker    bowler  is_super_over   ...    bye_runs  \
0     1  DA Warner    S Dhawan  TS Mills              0   ...           0   
1     2  DA Warner    S Dhawan  TS Mills              0   ...           0   
2     3  DA Warner    S Dhawan  TS Mills              0   ...           0   
3     4  DA Warner    S Dhawan  TS Mills              0   ...           0   
4     5  DA Warner    S Dhawan  TS Mills              0   ...           0   


   legbye_runs  noball_runs  penalty_runs  batsman_runs  extra_runs  \
0            0            0             0             0           0   
1            0            0             0             0           0   
2            0            0             0             4           0   
3            0            0             0             0           0   
4            0            0             0             0           2   


   total_runs  player_dismissed dismissal_kind fielder  
0           0                No           None    None  
1           0                No           None    None  
2           4                No           None    None  
3           0                No           None    None  
4           2                No           None    None  

[5 rows x 21 columns]

您可以使用换档功能并检查以下情况。当玩家在6点后被解职时,这将给出行数

df[(df['batsman_runs'].shift()='6')和(df['player_disposed']!=']
##或者,如果玩家_因未解散而解散为空
df[(df['batsman_runs'].shift()='6')&(~df['player_disposed'].isnull())]

您能给出一个数据片段吗?创建一个最小且可重复的示例。不要将数据作为图像发布。到目前为止你做了什么?是什么阻止了你取得结果?您的逻辑似乎还可以。@peili是的,我会得到它并将其添加到原始帖子中,谢谢您的建议。谢谢您考虑这一点-但是我得到了这两行的无效类型比较错误。请您提出原因?您的df['batsman_runs']cloumn的数据类型是什么,如果其整数使用6而不是“6”,解决方案是否对您有效,如果是,请向上投票并/或标记已解决的答案