Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/windows/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Statistics 为什么有些统计数据没有用于数据科学_Statistics_Kaggle - Fatal编程技术网

Statistics 为什么有些统计数据没有用于数据科学

Statistics 为什么有些统计数据没有用于数据科学,statistics,kaggle,Statistics,Kaggle,我学会了统计学,包括均值、中位数、模式和不同的测试 为Z检验、F检验和卡方检验,且几乎全部参与 困难的数值数据预测挑战,如kaggle和其他 我很少看到有人使用z,f,卡方检验 这些数据的标准化-我们都使用箱线图、条形图来查看平均值 中位数、模式等 我的问题是,这些测试是数据科学中不可或缺的一部分,为什么 这类问题主要是基于设计研究的 在数据科学问题中,理想情况下应该使用统计数据的哪一部分 为什么只有一部分被使用,而所有的统计数据都是数据科学所必需的 我问的是关于测试和除算法之外的其他统计数据。

我学会了统计学,包括均值、中位数、模式和不同的测试

为Z检验、F检验和卡方检验,且几乎全部参与

困难的数值数据预测挑战,如kaggle和其他

我很少看到有人使用z,f,卡方检验

这些数据的标准化-我们都使用箱线图、条形图来查看平均值

中位数、模式等

我的问题是,这些测试是数据科学中不可或缺的一部分,为什么

这类问题主要是基于设计研究的

在数据科学问题中,理想情况下应该使用统计数据的哪一部分

为什么只有一部分被使用,而所有的统计数据都是数据科学所必需的


我问的是关于测试和除算法之外的其他统计数据。

如果你在看A/B测试之类的东西,你最有可能在数据科学中看到统计假设测试,你的目标是确定两个样本之间是否存在可靠的差异以及差异的大小

Kaggle竞赛特别是有监督的学习问题,而不是假设检验,这就是为什么你看不到人们使用卡方检验之类的东西。(这是有道理的:如果你让十个人在同一个数据集上进行假设检验,他们应该得到几乎相同的答案,这将导致一场相当无趣的竞争。)


就个人而言,我认为熟悉统计假设检验和机器学习技术是很好的,因为它们有不同的用途。希望有帮助!:)

数据科学中的每一个问题都需要一种不同的方法,因此一般的统计方法可能不适用。由于这不是一个编程问题,因此可能不需要一些统计数据来投票结束。这可能适用于统计数据或其他网站,尽管这是相当广泛的。