Statistics 如何找到一个非常大的数据集的分布

Statistics 如何找到一个非常大的数据集的分布,statistics,Statistics,我有一个airline.csv文件,它有大约100万个条目,我能做些什么来找到这么大数据集的分布?统计中有很多概率分布。因此,您需要根据需要使用现有数据集进行的预测来选择分布。 请您详细说明“您需要根据需要使用现有数据集进行的预测来选择分销”。我对该领域不熟悉,因此请您提供详细信息。我认为您有一个与航空公司相关的数据集。这可能是航班延误、机票价格、乘客数量或任何其他需要分析的有用数据。因此,您可能需要根据现有数据进行一些预测或分析。是的,我有航空公司数据集,那么我应该对其进行什么预测和分析?我的

我有一个airline.csv文件,它有大约100万个条目,我能做些什么来找到这么大数据集的分布?

统计中有很多概率分布。因此,您需要根据需要使用现有数据集进行的预测来选择分布。

请您详细说明“您需要根据需要使用现有数据集进行的预测来选择分销”。我对该领域不熟悉,因此请您提供详细信息。我认为您有一个与航空公司相关的数据集。这可能是航班延误、机票价格、乘客数量或任何其他需要分析的有用数据。因此,您可能需要根据现有数据进行一些预测或分析。是的,我有航空公司数据集,那么我应该对其进行什么预测和分析?我的意思是,你会怎么做才能知道这个数据集适合哪个分布?你能提供步骤和细节吗?直接形成你的数据集,你可以绘制一些直方图和图表。如果需要根据现有数据进行预测,则需要找到分布。最常见的是用于大学经典考试分数的正态分布。请将您的数据加载到统计软件包中,并尝试不同的发行版。首先,您需要了解有关数据集的任何线索(列的含义)。检查数据值是离散的还是连续的。试着画一个直方图。如果您使用像R这样的统计软件,您可以尝试不同的分布,并测试哪一个是数据的最佳分布。