R 分析棒球投手

R 分析棒球投手,r,R,我想解决以下任务: 请说出棒球史上每一位累积了至少300场胜利(W)和至少3000次三振(SO)的投手的名字 (提示:在Lahman包中使用团队数据) 到目前为止我试过了 library(Lahman) Teams %>% filter(W >= 300 & SO >= 3000) %>% select(name, W, SO) 问题1.但这给了我零行的回复,甚至不包括投手 问题2.我开始注意到Lahman中的函数名为:“playerinfo(xxx)”,也许

我想解决以下任务:

请说出棒球史上每一位累积了至少300场胜利(W)和至少3000次三振(SO)的投手的名字

(提示:在Lahman包中使用团队数据)

到目前为止我试过了

library(Lahman)
Teams  %>% filter(W >= 300 & SO >= 3000) %>% select(name, W, SO)
问题1.但这给了我零行的回复,甚至不包括投手

问题2.我开始注意到Lahman中的函数名为:“playerinfo(xxx)”,也许这就是我找到投手名字的原因


请帮我解决这两个问题

就像@John Coleman说的,df
团队
不包含球员级别信息。这可以在俯仰中找到。但你几乎做对了。请记住按playerID分组,因为数据跨越不同的季节,然后左键与人df合并以获得他们的名字

Lahman::Pitching %>% 
    dplyr::group_by(playerID) %>% 
    dplyr::summarise(W = sum(W), SO = sum(SO)) %>% 
    dplyr::filter(W >= 300 & SO >= 3000) %>%
    dplyr::left_join(Lahman::People) %>%
    dplyr::mutate(name = stringr::str_c(nameGiven, nameLast)) %>%
    dplyr::pull(name)

你检查了W的最大值了吗?这个提示没有意义。一定是打字错误。
团队
表不包含关于单个投手的信息。数据集
俯仰
必须是预期的。
 [1] "Steven NormanCarlton" "William RogerClemens" "Randall DavidJohnson" "Walter PerryJohnson"  "Gregory AlanMaddux"   "Philip HenryNiekro"  
 [7] "Gaylord JacksonPerry" "Lynn NolanRyan"       "George ThomasSeaver"  "Donald HowardSutton"