Python 了解数据的任何统计测试——价格越高质量越好吗?

Python 了解数据的任何统计测试——价格越高质量越好吗?,python,matplotlib,statistics,Python,Matplotlib,Statistics,我有以下数据集。价格3:最高;质量等级4:最好,0:可怜;obs对给定价格级别给予给定评级的人数 问题: 我想验证我的假设,即价格与评级呈正相关。哪个测试会给我这个结果 我可以用Python从中创建哪些好的可视化效果 可以从以下链接获取数据,因为以下数据可能格式不正确 0304 1 2 0 1 2 1 0 4 3 3 1 8 4 2 1 21 5 1 1 20 6 3 2 26 7 2 2 22 8 1

我有以下数据集。价格3:最高;质量等级4:最好,0:可怜;obs对给定价格级别给予给定评级的人数

问题:

我想验证我的假设,即价格与评级呈正相关。哪个测试会给我这个结果

我可以用Python从中创建哪些好的可视化效果

可以从以下链接获取数据,因为以下数据可能格式不正确

0304 1 2 0 1 2 1 0 4 3 3 1 8 4 2 1 21 5 1 1 20 6 3 2 26 7 2 2 22 8 1 2 23 9 3 3 15 10 2 3 12 11 1 3 9 12 3 4 7 13 2 4 4
14 14 14 4

因此,您需要评估价格是否与评级相关。有很多统计方法来评估相关性,在这方面进行搜索可能会更好

由于您似乎有分类数据,即评级是在类别中,而不是在一个连续的尺度上,我建议使用。得到的r值描述了两个变量之间的关联程度

在python中,您可以通过以下方式实现这一点:

从scipy.stats导入spearmanr p、 r=spearmanrx,yx和y是您的数据
要知道基于价格的评级会增加多少,您需要研究预测模型,如线性回归。

嘿,欢迎光临。人们开始对你的问题投反对票,因为它有点模糊,并且同时问了多个问题,这在这里是不鼓励的。请提供一份清单。你有数据示例吗?你试过什么?
price   rating  obs