Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/arrays/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在Stata中生成GROUPBY语句(来自MySQL)?_Mysql_Group By_Stata - Fatal编程技术网

如何在Stata中生成GROUPBY语句(来自MySQL)?

如何在Stata中生成GROUPBY语句(来自MySQL)?,mysql,group-by,stata,Mysql,Group By,Stata,我不是一个统计人员,但我必须处理相当多的数据。在大多数情况下,这些数据集来自在线调查;因此,我有一个MySQL数据库,并且知道如何从中获得一些结果 然而,现在我得到了一个Stata文件,我需要做一些分析。在MySQL中,我知道如何做到这一点,但我陷入了困境,需要你的帮助 我有一个不太小的表,大约50k行,包含以下列有更多的列,但这些是我必须处理的: id-对象id,唯一值 名称-对象的名称,字符串值 类-对象类,整数范围1-6 原点-对象原点,整数范围1-2 在50k行中,只有大约7k个不同的名

我不是一个统计人员,但我必须处理相当多的数据。在大多数情况下,这些数据集来自在线调查;因此,我有一个MySQL数据库,并且知道如何从中获得一些结果

然而,现在我得到了一个Stata文件,我需要做一些分析。在MySQL中,我知道如何做到这一点,但我陷入了困境,需要你的帮助

我有一个不太小的表,大约50k行,包含以下列有更多的列,但这些是我必须处理的:

id-对象id,唯一值

名称-对象的名称,字符串值

类-对象类,整数范围1-6

原点-对象原点,整数范围1-2

在50k行中,只有大约7k个不同的名称。在Stata中,我可以检索所有具有列表名的名称,如果class==2,甚至可以将其限制为具有列表名的单个类

现在我想要一个所有不同名称的列表,以及具有该名称的对象的计数,并按计数对列表进行排序。 在MySQL中,我会查询SELECT name,按名称顺序按cnt DESC从对象组中将*计算为cnt。但在Stata中该如何做呢

接下来的步骤是为每个类或两个源获取这样的列表,即从class=2的对象中选择name,COUNT*AS cnt按名称分组,按cnt DESC排序,Stata也可以吗


ps:我不知道stackoverflow是否合适,因为Stata不是真正的编程语言,是吗?但我在这里发现了一些与Stata相关的问题;这就是我把它贴在这里的原因。如果有更好的地方,请告诉我正确的位置。

请记住,Stata仅适用于固定长度的矩形表,因此您只能添加跨越整个50k行的列。在这个设置中,您可以这样做

对于第一个问题的名称和频率列表,您可以

   collapse (count) freq = name, by(class)
   sort class freq name
   list class name freq, sepby(class)
请注意,折叠将删除现有数据并替换为摘要。通常,对于数据管理的这一方面,我不喜欢这个命令,但它应该在这里工作。如果你不想发生这种情况,这里有一个更复杂的技巧:

   bysort class name : generate long freq = _N
   bysort class name : generate byte first = (_n==1)
   sort class freq name
   list class name freq if first, sepby(class)
说明:_N是按组中的观察数,_N是按组中当前观察数


然后,您可以使用if class==将其子集到感兴趣的类中,如您所知。

还可以使用ssc inst groups查看groups命令下载

这个答案有用吗?这看起来确实很有希望,但我最终得到的要么是数千个新变量,要么是我无法处理的数据集。我仍然会尝试适应这个。最后我要做的就是把所有这些mX值加起来。谢谢你给我指出那个问题!人们确实会问关于Stata的问题,但社区的专业知识有点有限。Stata问题的第一站是statalist谢谢StasK,这正是我想要的。比斯司令部是我的新朋友;