如何在nycflights13 R包的飞行数据集中计算飞行时间

如何在nycflights13 R包的飞行数据集中计算飞行时间,r,tidyverse,R,Tidyverse,我正在分析R中nycflights13包的航班数据集 我有一个问题,那就是如何准确计算空气时间 查看数据的我的代码,从最短航班开始: library(nycflights13) library(tidyverse) view(arrange(flights, air_time)) 例如,查看的第一行包含以下信息: dep_time=1355->13:55 日程安排时间=1315->13:15 起飞延迟40分钟 到达时间=1442->14:42 预定到达时间=1411->14:11 到达延迟=

我正在分析R中nycflights13包的航班数据集

我有一个问题,那就是如何准确计算空气时间

查看数据的我的代码,从最短航班开始:

library(nycflights13)
library(tidyverse)
view(arrange(flights, air_time))
例如,查看的第一行包含以下信息:

  • dep_time=1355->13:55
  • 日程安排时间=1315->13:15
  • 起飞延迟40分钟
  • 到达时间=1442->14:42
  • 预定到达时间=1411->14:11
  • 到达延迟=31->到达时延迟31分钟
  • 播出时间=20->20分钟播出时间
我还知道,空气时间以分钟为单位,如下所述:

我希望航班时间是实际出发和实际到达之间的时间,以分钟为单位。换句话说,在这种情况下,航班在2点前5分钟起飞,14:42到达,因此我预计持续时间为47分钟。然而,所提到的持续时间是20天。其他数据元素,如计划的计时,似乎没有澄清。起初我考虑过时差,但这也无济于事

另一个间接相关的问题已经存在,但没有帮助我清楚地了解空气时间是如何定义的:


如果您有任何线索,请告诉我:)

Jeffrey B.Arnold的《数据科学R:练习解决方案》在展示以下问题的解决方案时:

[…]航班数据不包含变量taxin、TaxiOff、WheelsIn和wheelsof。air_时间变量似乎是指飞行时间,它被定义为车轮离开(起飞)和车轮进入(着陆)之间的时间。但飞行时间不包括在跑道上滑行进出登机口的时间

另见交通统计局(数据来源)发布的《广播时间》:

从飞机离开地面到在飞行阶段结束时接触地面计算的飞机飞行小时数


所有这些都证实了爱德华对这个问题的评论。

起飞时间是飞机离开登机门的时间,而不是实际起飞时间。同样,到达时间是飞机到达登机口的时间,而不是着陆时间。飞机滑行、排队等候或从错误转弯中恢复所需的时间不计入“飞行时间”,但所有时间都将计入“飞行时间”,而“飞行时间”不在航班数据集中。这一点,加上不同的时区,可能还有一些数据输入错误,可以解释明显的不一致。谢谢@Edward!我想我应该退一步;)祝你今天愉快(: