R 分析棒球投手
我想解决以下任务: 请说出棒球史上每一位累积了至少300场胜利(W)和至少3000次三振(SO)的投手的名字 (提示:在Lahman包中使用团队数据) 到目前为止我试过了R 分析棒球投手,r,R,我想解决以下任务: 请说出棒球史上每一位累积了至少300场胜利(W)和至少3000次三振(SO)的投手的名字 (提示:在Lahman包中使用团队数据) 到目前为止我试过了 library(Lahman) Teams %>% filter(W >= 300 & SO >= 3000) %>% select(name, W, SO) 问题1.但这给了我零行的回复,甚至不包括投手 问题2.我开始注意到Lahman中的函数名为:“playerinfo(xxx)”,也许
library(Lahman)
Teams %>% filter(W >= 300 & SO >= 3000) %>% select(name, W, SO)
问题1.但这给了我零行的回复,甚至不包括投手
问题2.我开始注意到Lahman中的函数名为:“playerinfo(xxx)”,也许这就是我找到投手名字的原因
请帮我解决这两个问题就像@John Coleman说的,df
团队
不包含球员级别信息。这可以在俯仰中找到。但你几乎做对了。请记住按playerID分组,因为数据跨越不同的季节,然后左键与人df合并以获得他们的名字
Lahman::Pitching %>%
dplyr::group_by(playerID) %>%
dplyr::summarise(W = sum(W), SO = sum(SO)) %>%
dplyr::filter(W >= 300 & SO >= 3000) %>%
dplyr::left_join(Lahman::People) %>%
dplyr::mutate(name = stringr::str_c(nameGiven, nameLast)) %>%
dplyr::pull(name)
你检查了W的最大值了吗?这个提示没有意义。一定是打字错误。
团队
表不包含关于单个投手的信息。数据集俯仰
必须是预期的。
[1] "Steven NormanCarlton" "William RogerClemens" "Randall DavidJohnson" "Walter PerryJohnson" "Gregory AlanMaddux" "Philip HenryNiekro"
[7] "Gaylord JacksonPerry" "Lynn NolanRyan" "George ThomasSeaver" "Donald HowardSutton"