Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/sql/83.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在sql中检查样本数据是否符合均匀分布_Sql_Math_Distribution - Fatal编程技术网

如何在sql中检查样本数据是否符合均匀分布

如何在sql中检查样本数据是否符合均匀分布,sql,math,distribution,Sql,Math,Distribution,我在SQL数据库中有一个x,y数据表,例如 12.5,26.3 12.5,26.4 12.6,26.3 12.6,26.4 ... 如何确定数据集是否均匀分布回答我自己的问题: 按lat-lon分组,并在地图上为每个lat和lon创建一些精度为0.01的矩形 创建表tbl_to_check_if_of_uniform_distribution as 通过castlat*100作为int作为lat100,castlon*100作为int作为lon100,count1作为latlon100cnt从

我在SQL数据库中有一个x,y数据表,例如

12.5,26.3
12.5,26.4
12.6,26.3
12.6,26.4
...

如何确定数据集是否均匀分布回答我自己的问题:

按lat-lon分组,并在地图上为每个lat和lon创建一些精度为0.01的矩形 创建表tbl_to_check_if_of_uniform_distribution as 通过castlat*100作为int作为lat100,castlon*100作为int作为lon100,count1作为latlon100cnt从tbl_some_lat_和_lon_作为双组中选择castlat*100作为int,castlon*100作为int

检查矩形是否可以描述为较大矩形内的均匀分布Pearson卡方检验
我用python绘制了这些点,看看latlon100cnt是否在一个更大的矩形区域中都是相同的,然后按castlat*10作为int,castlon*10作为int分组,看看是否存在差异&maxlatlon100cnt-minlatlon100cnt之类的东西

如果你想得到一个有意义的答案,你真的应该提供更多细节。例如,您是否有分销范围或是否也应安装?你有多少数据点?你说的“确定”到底是什么意思?统计测试只能给你概率,随机来源没有确定性。@SergGr谢谢你的回复,总样本量超过7000000条记录,范围为gps+90.0000,-90.0000,-180.0000,-180.0000,通过我糟糕的英语判断,这意味着所有样本数据都像…………均匀分布一样分布,好像由均匀分布函数生成。在统计学中,没有确定性,只有置信水平。即使是一枚真正公平的硬币,也可能连续出现100倍的正面。这不太可能。不管怎样,到目前为止你试过什么?你有没有试过一些基本的东西,比如和?您的问题到底在哪里?@SergGr再次感谢您的建议Pearson卡方检验,我自己找到了解决方案,并在下面发布了答案。很高兴它有所帮助。我不确定你的真正目标是什么,但根据具体情况,你可能还需要检查相关性。例如,生成的值为纬度=随机-90;90,经度=2*纬度很难被视为真正的随机性,尽管这样的纬度和经度可以独立地通过任何随机性测试。